Task1：知識圖譜介紹（1天）

阿新 • • 發佈：2021-01-12

一、知識圖譜簡介

“知識圖譜本質上是語義網路（Semantic Network）的知識庫”。但這有點抽象，所以換個角度，從實際應用的角度出發其實可以簡單地把知識圖譜理解成多關係圖（Multi-relational Graph）。

二、怎麼構建知識圖譜呢？

2.1 知識圖譜的資料來源

第一種：業務本身的資料。這部分資料通常包含在公司內的資料庫表並以結構化的方式儲存，一般只需要簡單預處理即可以作為後續AI系統的輸入；
第二種：網路上公開、抓取的資料。這些資料通常是以網頁的形式存在所以是非結構化的資料，一般需要藉助於自然語言處理等技術來提取出結構化資訊。

2.2 資訊抽取的難點

資訊抽取的難點在於處理非結構化資料。（如圖）

2.3 構建知識圖譜所涉及的技術

在構建類似的圖譜過程當中，主要涉及以下幾個方面的自然語言處理技術：

實體命名識別（Name Entity Recognition，NER）：就是從文本里提取出實體並對每個實體做分類/打標籤。
關係抽取（Relation Extraction，RE）：通過關係抽取技術，把實體間的關係從文字中提取出來。
實體統一（Entity Resolution，ER）：不同詞彙其實是指向同一個實體。
指代消解（Coreference Resolution）：文字中出現的“it”, “he”, “she”這些詞到底指向哪個實體

三、知識圖譜的儲存

知識圖譜主要有兩種儲存方式：

一種是基於RDF的儲存；
另一種是基於圖資料庫的儲存。

其中Neo4j系統目前仍是使用率最高的圖資料庫，它擁有活躍的社群，而且系統本身的查詢效率高，但唯一的不足就是不支援準分散式。

四、Neo4J 介紹與安裝

安裝與環境配置參考部落格

 安裝完成後win下輸入程式碼：
　　neo4j.bat console

4.1 Neo4J Web 介面介紹

http://127.0.0.1:7474/browser/

4.2 Cypher查詢語言

Cypher：

介紹：是Neo4J的宣告式圖形查詢語言，允許使用者不必編寫圖形結構的遍歷程式碼，就可以對圖形資料進行高效的查詢。
設計目的：類似SQL，適合於開發者以及在資料庫上做點對點模式（ad-hoc）查詢的專業操作人員。

五、Neo4J 實戰

參考知乎@異塵手把手教你快速入門知識圖譜 - Neo4J教程

六、通過 Python 操作 Neo4j

6.1 neo4j模組：執行CQL ( cypher ) 語句

　# step 1：匯入 Neo4j 驅動包
  from neo4j import GraphDatabase
  # step 2：連線 Neo4j 圖資料庫
  driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j", "password"))
  # 新增 關係 函式
  def add_friend(tx, name, friend_name):
      tx.run("MERGE (a:Person {name: $name}) "
            "MERGE (a)-[:KNOWS]->(friend:Person {name: $friend_name})",
            name=name, friend_name=friend_name)
  # 定義 關係函式
  def print_friends(tx, name):
      for record in tx.run("MATCH (a:Person)-[:KNOWS]->(friend) WHERE a.name = $name "
                          "RETURN friend.name ORDER BY friend.name", name=name):
          print(record["friend.name"])
  # step 3：執行
  with driver.session() as session:
      session.write_transaction(add_friend, "Arthur", "Guinevere")
      session.write_transaction(add_friend, "Arthur", "Lancelot")
      session.write_transaction(add_friend, "Arthur", "Merlin")
      session.read_transaction(print_friends, "Arthur")

上述程式的核心部分，抽象一下就是：

  neo4j.GraphDatabase.driver(xxxx).session().write_transaction(函式(含tx.run(CQL語句)))

或者

  neo4j.GraphDatabase.driver(xxxx).session().begin_transaction.run(CQL語句)

6.2 py2neo模組：通過操作python變數，達到操作neo4j的目的（需要pip3 install py2neo）

  # step 1：導包
  from py2neo import Graph, Node, Relationship 
  # step 2：構建圖
  g = Graph()
  # step 3：建立節點
  tx = g.begin()
  a = Node("Person", name="Alice")
  tx.create(a)
  b = Node("Person", name="Bob")
  # step 4：建立邊
  ab = Relationship(a, "KNOWS", b)
  # step 5：執行
  tx.create(ab)
  tx.commit()

py2neo模組符合python的習慣，寫著感覺順暢，其實可以完全不會CQL也能寫
其中可能會出現ClientError: [Security.Unauthorized] The client is unauthorized due to authentication failure.問題參考部落格

七、通過csv檔案批量匯入圖資料

這裡我們介紹使用neo4j-admin import命令匯入，適合部署在docker環境下的neo4j。其他匯入方法也可以參考Neo4j之匯入資料

csv分為兩個nodes.csv和relations.csv，注意關係裡的起始節點必須是在nodes.csv裡能找到的：

  # nodes.csv需要指定唯一ID和nam,
  headers = [
  'unique_id:ID', # 圖資料庫中節點儲存的唯一標識
  'name', # 節點展示的名稱
  'node_type:LABEL', # 節點的型別，比如Person和Location
  'property' # 節點的其他屬性
  ]

  # relations.csv
  headers = [
  'unique_id', # 圖資料庫中關係儲存的唯一標識
  'begin_node_id:START_ID', # begin_node和end_node的值來自於nodes.csv中節點
  'end_node_id:END_ID',
  'begin_node_name',
  'end_node_name',
  'begin_node_type',
  'end_node_type',
  'relation_type:TYPE', # 關係的型別，比如Friends和Married
  'property' # 關係的其他屬性
  ]

製作出兩個csv後，通過以下步驟匯入neo4j:

兩個檔案nodes.csv ，relas.csv放在
```
 neo4j安裝絕對路徑/import
```
匯入到圖資料庫mygraph.db

 　　　　neo4j bin/neo4j-admin import --nodes=/var/lib/neo4j/import/nodes.csv --relationships=/var/lib/neo4j/import/relas.csv   --delimiter=^ --database=xinfang*.db
　　
　　　　注：delimiter=^ 指的是csv的分隔符

指定neo4j使用哪個資料庫

  　　　　修改 /root/neo4j/conf/neo4j.conf 檔案中的 dbms.default_database=mygraph.db

重啟neo4j就可以看到資料已經匯入成功了

Task1：知識圖譜介紹（1天）

一、知識圖譜簡介 “知識圖譜本質上是語義網路（Semantic Network）的知識庫”。但這有點抽象，所以換個角度，從實際應用的角度出發其實可以簡單地把知識圖譜理解成多關係圖（Multi-relational Graph）。

Leetcode Task02: 完成以下三個題目並打卡（1天）

Task02: 完成以下三個題目並打卡（1天） 007 整數反轉 008 字串轉換整數 (atoi) 009 迴文數

Task3：論文程式碼統計（3天）

Task3：論文程式碼統計（3天）Link 學習主題：論文程式碼統計（資料統計任務），統計所有論文類別下包含原始碼論文的比例；

ABP VNext框架基礎知識介紹（1）--框架基礎類繼承關係

在我較早的時候，就開始研究和介紹ABP框架，ABP框架相對一些其他的框架，它整合了很多.net core的新技術和相關應用場景，雖然最早開始ABP框架是基於.net framework，後來也全部轉向擁抱.net core，而另一條線的ABP

野性方舟（Additional Creatures2：Wild Ark）模組武器介紹（1）

模組名：Additional Creatures2：Wild Ark 模組ID：1373744537 模組作者：Shadlos 前言：經由本人的介紹，附加生物2：野性方舟（Additional Creatures2：Wild Ark）模組一般都以“生物數量眾多，生態位與功能全

【DLC】空之探險隊特殊劇情今天的“我的天哪”：附加內容（1/8）

本文是空之探險隊的同人作品，補充特殊劇情 3 今天的“我的天哪”中，向日花怪和吼爆彈的那次失敗的探險的部分。

知識圖譜04：知識圖譜的儲存與檢索

公眾號：資料探勘與機器學習筆記 Web本體語言OWL是當前儲存本體的主要形式.OWL也適用於知識圖譜的儲存, 但OWL文件不適用於大資料量的情況, 影響查詢、修改和推理速度. 作為知識庫的知識圖譜, 其基本元素是

Task01：資料型別及陣列建立（2天）

1.常量（1）兩個numpy.nan是不相等的。np.isnan(x) 對NaN逐個元素進行測試，並以布林陣列返回結果

Datawhale Notes | 知識圖譜介紹與Neo4J實戰

[github] 0. 定義知識圖譜本質上是語義網路（Semantic Network）的知識庫 ==>從實際應用的角度出發，可以簡單地把知識圖譜理解成多關係圖（Multi-relational Graph）

Web前端開發技術：Vue開發基礎（1）

技術標籤：VUEvue 一、實驗目的：掌握Vue開發環境的搭建、開發和除錯工具的使用以及Vue專案的建立。

記錄學習《流暢的python》的一些知識-----一等函式（1）

技術標籤：pythonlambda函數語言程式設計記錄我學習《流暢的python》的過程 2021.1.20

＞＞人工智慧：知識圖譜基礎知識

技術標籤：圖資料庫知識圖譜大資料本體知識圖譜本體就是對那些可能相對於某一智慧體（agent）或智慧體群體而存在的概念和關係的一種描述。

《電馭叛客2077攻略》結局3：星星-風暴前夕（1）

結局3：星星-風暴前夕如果要達成星星結局（或者按照佔卜可以叫月亮結局），請在抉擇時選擇向帕南求助。

《電馭叛客2077攻略》結局3：星星-期待死亡（1）

結局3：星星-期待死亡早晨，V跟隨帕南找到索爾，利用無人機偵察建築工地。

《電馭叛客2077攻略》第22章：303號房（1）

第22章：303號房衝出重圍，在303號房與竹村見面。敲門時選擇敲4下。 V向華子說明了他的哥哥賴宣才是殺死荒阪三郎的弒父凶手。

Linux 核心：裝置驅動模型（1）driver-bus-device與probe

Linux 核心：裝置驅動模型（1）driver-bus-device與probe 參考： https://blog.csdn.net/lizuobin2/article/details/51570196

2021年上半年資訊系統專案管理師上午綜合知識真題（1）

國家資訊化體系包括六個要素,其中___資訊化體系六要素中的龍頭,是國家資訊化建設的主陣地,集中體現了國家資訊化建設的需求和效益。A.資訊資源B.資訊科技應用C.資訊網路D.資訊化政策法規和標準規範

英特爾：2025 年生產 18A 製程工藝（1.8nm）晶片

北京時間 8 月 5 日早間訊息，據報道，英特爾今年早些時候宣佈將重新奪回 CPU 製造領域的領先地位和 PC 行業“無可爭議領導地位”。這些目標的確激動人心，但他們卻並未披露具體如何實現這些目標。

連續劇：計算機組成原理（1）

計算機系統的多層次結構馮·諾依曼機哈佛結構計算機效能指標一、計算機系統概述

OPPO Find X5 / Pro 系列正式釋出：驍龍 8 Gen 1 / 天璣 9000 / 驍龍 888，首發懸浮防抖，售價 3999 元起

2 月 24 日訊息，OPPO Find X5 系列新品釋出會上，OPPO Find X5 / Pro 旗艦手機正式釋出，售價 3999 元起。OPPO Find X5 Pro 擁有白瓷、黑釉、水藍三款配色，採用了「一體化奈米微晶陶瓷」，摸上去是一個連貫的自然

Task1：知識圖譜介紹（1天）

一、知識圖譜簡介

二、怎麼構建知識圖譜呢？

2.1 知識圖譜的資料來源

2.2 資訊抽取的難點

2.3 構建知識圖譜所涉及的技術

三、知識圖譜的儲存

四、Neo4J 介紹與安裝

4.1 Neo4J Web 介面 介紹

4.2 Cypher查詢語言

五、Neo4J 實戰

六、通過 Python 操作 Neo4j

6.1 neo4j模組：執行CQL ( cypher ) 語句

6.2 py2neo模組：通過操作python變數，達到操作neo4j的目的（需要pip3 install py2neo）

七、通過csv檔案批量匯入圖資料

相關推薦

4.1 Neo4J Web 介面介紹