摘要:圖數據庫逐步成為目前主要的知識圖譜存儲方式。知識圖譜的補全是通過現有知識圖譜來預測實體之間的關系,是對關系抽取的重要補充。相關資料大規模知識圖譜的構建推理及應用肖仰華大規模知識圖譜構建與應用
知識圖譜怎么去做,這當然不是幾句話說得清楚的。首先肯定要先基于自身的業務進行思考,這里整理一些知識圖譜構建的主要路徑。
構建的邏輯思路1、梳理業務,構建本體:是否需要用知識圖譜?成本怎么樣,能達到怎么的效果?是否有能力構建知識圖譜?數據、團隊等情況是否能支撐?如果有必要,如何根據業務梳理一套本體框架?
2、編輯本體,給出業務知識表示框架:可以利用Protege進行本體編輯,獲得一個用OWL表示的知識表示文件。
3、給本體補充實例數據:先找一些示例數據,便于理解。
構建的不同方式自頂向下的構建方式:先定義本體和數據模式,再將實體加入知識庫。利用一些現有的結構化知識庫作為其基礎知識庫。
自底向上的構建方式:從一些開放鏈接數據中提取出實體,選擇其中置信度較高的加入到知識庫,再構建頂層的本體模式。
構建過程中的關鍵技術大體包含五個方面:知識抽取、知識表示、知識融合、知識加工、知識評估
通過知識提取技術,可以從一些公開的半結構化、非結構化和第三方結構化數據庫的數據中提取出實體、關系、屬性等知識要素。
知識表示則通過一定有效手段對知識要素表示,便于進一步處理使用。分布式的知識表示形成的綜合向量對知識庫的構建、推理、融合以及應用均具有重要的意義。
然后通過知識融合,可消除實體、關系、屬性等指稱項與事實對象之間的歧義,形成高質量的知識庫。
知識加工則是在已有的知識庫基礎上進一步挖掘隱含的知識,構建新本體,補全關系,從而豐富、擴展知識庫。
知識評估可以對知識的可信度進行量化,保留置信度較高的,舍棄置信度較低的,有效確保知識的質量。
除此之外,大規模知識圖譜構建,還需要多種技術的支持:分布式存儲和計算、圖數據庫、圖推理、內存數據庫等。
數據的存儲數據庫選擇知識圖譜的存儲和查詢語言也經歷了歷史的洗滌,從RDF到OWL以及SPARQL查詢,都逐漸因為使用上的不便及高昂的成本,而被工業界主流所遺棄。
圖數據庫逐步成為目前主要的知識圖譜存儲方式。
目前應用比較廣泛的圖數據庫包括Neo4j、graphsql、sparkgraphx(包含圖計算引擎)、基于hbase的Titan、BlazeGraph等,各家的存儲語言和查詢語言也不盡相同。
實際應用場景下,OrientDB和postgresql也有很多的應用,主要原因是其相對低廉的實現成本和性能優勢。
應用推理和知識自學習在知識圖譜構建過程中,還存在很多關系補全問題。雖然一個普通的知識圖譜可能存在數百萬的實體和數億的關系事實,但相距補全還差很遠。
知識圖譜的補全是通過現有知識圖譜來預測實體之間的關系,是對關系抽取的重要補充。
傳統方法TransE和TransH通過把關系作為從實體A到實體B的翻譯來建立實體和關系嵌入,但是這些模型僅僅簡單地假設實體和關系處于相同的語義空間。
而事實上,一個實體是由多種屬性組成的綜合體,不同關系關注實體的不同屬性,所以僅僅在一個空間內對他們進行建模是不夠的。
相關資料大規模知識圖譜的構建、推理及應用
肖仰華 | 大規模知識圖譜構建與應用
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/74870.html
摘要:月日,由阿里云與上海瑞金醫院阿里健康聯合舉辦的新一輪天池大賽瑞金醫院人工智能輔助構建知識圖譜大賽決賽結果頒布,兩位來自哈工大的歲研究生在全球近位開發者當中脫穎而出,獲得冠軍。3月1日,由阿里云與上海瑞金醫院、阿里健康聯合舉辦的新一輪天池大賽——瑞金醫院MMC人工智能輔助構建知識圖譜大賽決賽結果頒布,兩位來自哈工大的22歲研究生在全球近2000位開發者當中脫穎而出,獲得冠軍。 熱點熱議 阿里...
摘要:如果在學習過程中有什么問題可以關注我公眾號琉憶編程庫給我留言。有興趣可以深入學習最后附上學習的知識結構圖譜,可以按著下面的這個知識結構圖進行學習不一定完整,更多資料,面試題,都可以關注公眾號琉憶編程庫獲取。 你好,是我——琉憶。PHP程序員面試系列圖書作者。 作為一名PHP開發者過來人,也是經歷了菜鳥到老手的過程,在此給那些想學PHP的同學指條路,即使你是轉行學PHP一樣可以學會PHP...
閱讀 1890·2021-11-24 09:39
閱讀 2535·2021-10-14 09:43
閱讀 3318·2021-10-08 10:10
閱讀 2266·2021-09-22 15:54
閱讀 2340·2019-08-29 17:20
閱讀 1573·2019-08-28 18:14
閱讀 2374·2019-08-26 13:28
閱讀 1111·2019-08-26 12:16