摘要:論文一本體論在自動問答系統中的應用駱正華基于本體來組織問句的方法,并探討在基礎上分析問句的方法,并利用本體向量來聯系問句實例和領域知識,達到問題和答案的連接。領域具體事實知識的表示采用標記規范,主題操作事件或業務實體描述或屬性。
論文 一、本體論在自動問答系統中的應用_駱正華
基于本體來組織問句的方法,并探討在基礎上分析問句的方法,并利用本體向量
來聯系問句實例和領域知識,達到問題和答案的連接。
用戶提交的問句
進行分詞、 詞性標注、 語塊劃分等淺層句法分析
在語塊結構化的問句實例中找相似的問句
構造本體的目的都是為了實現某種程度的知識共享和重用。
領域知識可劃分為三個層次,通用概念知識->領域概念知識->具體事實知識。
領域具體事實知識的表示
采用XML標記規范,主題、操作事件或業務實體、描述或屬性。
問句語義的表示
主題、疑問塊、問句語義表示
問句向量本質上有三種情況
主題+實體+屬性
主題+事件+角色
向量是一組無序的關鍵字
二、一種基于加權語義相似度模型的自動問答系統_劉亞軍利用語義樹中詞語間的距離和語義樹的高度來計算詞語間的語義相似度
利用詞語間的語義相似度和詞語的權重進一步計算用戶問題與答案庫中問題間的語義相似度。
關鍵詞語(權重高的詞語)
三、自動問答系統中的問題理解研究_曹志娟QA系統主要分為五個部分
問題理解、信息檢索、信息處理、答案抽取、FAQ系統。
主要是三個主要部分
問題理解
信息檢索
答案抽取
講述問題理解的兩個關鍵點:問題分類和問句擴展。
問題分類
詞法分析:問句分詞和標注
問題分類:基于答案對象的類型分類,增加疑問詞短語分類、問題標準型、特征詞分類
1. 識別問句中的疑問詞,根據疑問詞找到句型模式集合 - 人、地點、具體時間、持續事件、數量、原因、方法、其他 2. 與集合中的句型規則進行匹配,從而得到問題標準型 - 通過形式語言制定具體規則 - 通過概率分類的方法 3. 再根據特征詞確定問題領域 - 特征詞的擴充
問句擴展
問句重寫-更改為定制的模板
關鍵詞擴展
名詞、動詞的關鍵詞
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/43286.html
摘要:考慮這樣一個計算集合,它可以被允許在每一個節點和可能的圖結構中,并定義了一個函數族。傳統的前饋神經網絡能夠被看做擁有等于層數的深度比如對于輸出層為隱層數加。理論結果證實那些事實上所需要的節點數隨著輸入的大小指數增長的函數族是存在的。 查看論文 Yoshua Bengio, Learning Deep Architectures for AI, Foundations and Trends i...
摘要:實驗結果實驗數據集數據集都是新聞類網頁,從五個中文新聞網站中收集一百個頁面這最多也就五類吧,而且也就五百個,好像有點少了吧結果與驗證性能指標這這這比較文本長度就了那不是只要包含新聞正文不就好了。 《Web Content Extraction Using Clustering with Web Structure》引用 Huang X, Gao Y, Huang L, et al. ...
摘要:分塊效果如圖所示聚類由于不同網頁之間設計和布局存在較大差異,作者選擇了作為聚類算法來解決簇數目未知簇形狀未知噪聲等問題未給出距離函數。 《Web Content Extraction Through Machine Learning》 通過機器學習來提取網頁內容 2014年,未見期刊會議上登載,作者 Ziyan Zhou @stanford.edu 簡介 數據集 以新聞文章網站為主數...
摘要:后文將圍繞做一些介紹。盡管如此,的使用對新手而言仍然充滿了困難。本系列文章基本為個人見解,難免有錯誤與誤解,如有客觀錯誤歡迎提出。 前言 說到Android的污點分析框架,網上的搜索結果大多指向靜態的FlowDroid與動態的TaintDroid。盡管由于加固、混淆等技術使得針對Android的靜態分析越來越困難,但靜態分析的無先驗分析能力無法被動態分析取代,使得靜態分析仍有發揮空間。...
閱讀 1698·2021-10-28 09:32
閱讀 605·2021-09-24 09:47
閱讀 2920·2021-09-02 15:11
閱讀 2731·2021-08-09 13:46
閱讀 2884·2019-08-30 15:55
閱讀 1071·2019-08-30 15:54
閱讀 3299·2019-08-29 14:12
閱讀 805·2019-08-26 13:40