1. 程式人生 > 實用技巧 >王昊奮知識圖譜學習筆記--第三講知識抽取與知識挖掘(下)

王昊奮知識圖譜學習筆記--第三講知識抽取與知識挖掘(下)

第一部分 DeepDive 知識抽取實戰

注意:iDeepDive 僅支援Liux或者Mac,不支援Windows。

1.1 工程組成

在這裡插入圖片描述

1.2 先驗資料匯入

在這裡插入圖片描述

1.3 待抽取文章匯入

在這裡插入圖片描述

1.4 流程

在這裡插入圖片描述

1.5 文章資料預處理

對文章進行自然語言處理,包括分詞、詞性標註、命名實體識別等操作。
在app.ddlog 中利用nlp.markup.sh 這個指令碼去實現NLP的處理,並將內容放入到sentences 表中。
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

1.6 候選實體抽取

在這裡插入圖片描述

在這裡插入圖片描述
在這裡插入圖片描述

候選實體對生成

在這裡插入圖片描述

關係特徵抽取

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

資料標註

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述

因子圖構建

在這裡插入圖片描述
在這裡插入圖片描述

總結

這個專案僅僅聽老師講,很難懂這個過程。還需要自己親自實踐,才能真正理解。

在這裡插入圖片描述