windows下 word2vec學習筆記

阿新 • • 發佈：2019-02-09

1）安裝

gensim是word2vec的python版本，官網地址：gensim官網

在Anaconda相應的環境下執行以下命令，即可安裝成功：

pip install  --upgrade gensim

gensim中函式的使用方法，英文版介紹：gensim API

2）使用訓練好的模型

google提供了word2vec訓練好的model： GoogleNews-vectors-negative300.bin.gz 。

使用WinRAR解壓後。原文利用了下面python程式碼將檔案轉為txt格式，得到的txt檔案大約10G，生成時需要一些時間。

from gensim.models.keyedvectors import KeyedVectors

model = KeyedVectors.load_word2vec_format('GoogleNews-vectors-negative300.bin', binary=True)
model.save_word2vec_format('GoogleNews-vectors-negative300.txt', binary=False)

實際過程中發現生成txt後，可能由於檔案過大，讀取時間非常慢，執行3）中的操作時特別消耗時間。後來發現直接用bin也可以，所以不需要執行上面的程式碼。

3)利用下面的程式碼讀入model，測試結果。

from gensim.models.keyedvectors import KeyedVectors

model = KeyedVectors.load_word2vec_format("GoogleNews-vectors-negative300.bin", binary=True)

# 檢視word的詞向量
print(model['word'])
print(model['word'][0])

# 檢視所有的詞
print(model.wv.vocab.keys())

# 計算兩個詞的相似度/相關程度
y1 = model.similarity("woman", "man")
print("woman和man的相似度為：", y1)

# 計算某個詞的相關詞列表
y2 = model.most_similar("good", topn=20)  # 20個最相關的
print ("和good最相關的詞有：")
for item in y2:
    print(item[0], item[1])

# 尋找對應關係
print(' "boy" is to "father" as "girl" is to ...? ')
y3 = model.most_similar(['girl', 'father'], ['boy'], topn=3)
for item in y3:
    print(item[0], item[1])

more_examples = ["he his she", "big bigger bad", "going went being"]
for example in more_examples:
    a, b, x = example.split()
    predicted = model.most_similar([x, b], [a])[0][0]
    print("'%s' is to '%s' as '%s' is to '%s'" % (a, b, x, predicted))

# 尋找不合群的詞
y4 = model.doesnt_match("breakfast cereal dinner lunch".split())
print("不合群的詞：", y4)

windows下 word2vec學習筆記

1）安裝gensim是word2vec的python版本，官網地址：gensim官網在Anaconda相應的環境下執行以下命令，即可安裝成功：pip install --upgrade gensimgensim中函式的使用方法，英文版介紹：gensim API2）使用訓練好

jenkins 自動部署-windows下的-學習筆記 ( 一 )

最近公司要用jenkins進行自動化部署，所以就研究了一下，記一下筆記，以便於以後翻閱環境 jenkins 2.98 下載地址 http://updates.jenkins-ci.org/download/war/ jenkins部署在 win10 64位機子上（mas

jenkins 自動部署-windows下的-學習筆記 ( 三 )

這次實現遠端windows部署我是用的 Publish overSSH的方式，所以需要Linux環境，而現在是部署到windows伺服器上，所以先在Windows伺服器上搭建了SSH服務，本來網上介紹用cynwin搭建，可是卻是太難下載和安裝了，截止到寫這篇博文

python 下的 word2vec 學習筆記

1.ubuntu下安裝gensim 為了保證安裝成功，首先升級一下easy_install工具。 sudo easy_install -U setuptools 之後使用easy_install進行安裝，使用apt-get安裝會遇到編碼出錯，不知為

001. Windows環境Vulkan學習筆記起始篇

ios toolbar 學習 efi sdk 下載版本引用 extension 背景：由於公司需要用c++對現有項目進行重構，本人從事近6年的C#開發現需要快速轉C++，但是看書學習內容太多記不住，所以打算從Vulkan入手寫一些東西。為什麽選擇Vulka

MySql cmd下的學習筆記 —— 有關表的操作（增，刪，改，查）

strong .com nsh utf str tab 主鍵 test har （知識回顧）連接數據庫 mysql -uroot -p111 先建立一個新庫 create database test1; use test1; 由於今天的主要內容是表的操作，建立表的詳細過

MySql cmd下的學習筆記 —— 有關建立表的操作（有關與數據類型）

字符串聲明 span tro img float info 學習可能（01）建表的過程實際上是聲明字段的過程　　　一. 列類型（字段）：　　　　　存儲同樣的數據時，不同的列類型，所占據的空間和效率是不一樣的，這就是建表時要考慮的意義。　　　二.MySQL三大

MySql cmd下的學習筆記 —— 有關多表查詢的操作（多表查詢練習題及union操作）

image ins myisam name sam row div mysq gin 先建立一張 m 表 mysql> create table m ( -> mid int, -> hid int, -> gid in

MySql cmd下的學習筆記 —— 有關視圖的操作（algorithm）

mysql merge bubuko png define 情況什麽必須臨時建立一張簡單的查詢視圖，不用臨時表，只用條件合並在簡單的查詢中，建立臨時表的開銷比較大這是可以指定algorithm選項為merge 在v2的視圖中，並沒有建立臨時表但在下

MySql 在cmd下的學習筆記 —— 有關儲存過程的操作（procedure）

image eat spa proc idt span case 流程循環我們把若幹條sql封裝取來，起個名字------把此過程存儲在數據庫中叫存儲過程調用procedure 儲存過程是可以變成的，意味著可以使用變量，表達式，控制結構來完成復雜的功能聲明

YOLO---Darknet下的學習筆記

重要 for art self 後臺進程 pandas 數字 his loading YOLO.V3-Darknet下的學習筆記＠wp20180927 【目錄】一、安裝Darknet（僅CPU下） 2 1.1在CPU下安裝Darknet方式 2 1.2在GPU下安裝D

Linux系統下python學習筆記——python基礎學習準備

第一個hello world程式基本環境：Linux系統，Vim程式碼編輯器 1、使用Vim程式碼編輯器編輯程式print("hello world!") 注意：1、前面不要加空格。 2、習慣性問題：括號和分號要成對寫（不容易出錯或

Linux系統下python學習筆記——vim程式碼編輯器

Vim程式碼編輯器一、Vim簡介 vi是"Visual Interface"的簡稱。它在Linux上的地位就彷彿Edit程式在DOS上一樣。它可以執行輸出、刪除、查詢、替換、塊操作等眾多文字操作，而且使用者可以根據自己的

Linux系統下python學習筆記——Linux系統其他命令

Linux系統其他命令一、查詢檔案 find 通常用來在特定目錄下搜尋符合條件的檔案 find [路徑] -name "*.py" 查詢指定路徑下副檔名是.py的檔案，包括子目錄（*為萬用字元）如果省略路徑，表示在當前資料夾下查

Linux系統下python學習筆記——Linux系統資訊相關命令

系統資訊相關命令目的：主要是為了方便通過遠端終端維護伺服器時，檢視伺服器上當前的系統日期和時間/磁碟空間佔用情況/ 程式執行情況。基本都是查詢命令，通過這些命令可以對系統資源的使用情況有個瞭解。 1、時間和日期 date&nbs

Linux系統下python學習筆記——Linux系統使用者許可權命令

1、基本概念使用者是Linux系統工作中重要的一環，使用者管理包括使用者與組管理。在Linux系統中，不論是由本機或是遠端登入系統，每個系統都必須擁有一個賬號，並且對於不同的系統資源擁有不同的使用許可權。在Linux中，可以指定每一個使用者針對不同的檔案或者目錄的不同許可權。對檔案/目錄

Linux系統下python學習筆記——Linux系統遠端管理命令

Linux系統遠端管理常用命令一、關機/重啟shutdown 格式：shutdown 選項時間選項：-r ：重新啟動時間：now(立刻關閉) 22:45 +10(十分鐘之後執行 ) 不指定選項和引數，預設一分鐘之後關閉電腦遠端維護伺服器時，

Linux系統下python學習筆記——Linux中檔案和目錄常用命令詳解

一、檢視目錄內容 ls命令說明: 英文單詞list的簡寫，功能為列出目錄的內容，是使用者最常用的命令字義 Linux下檔案和目錄的特點： Linux檔案或目錄名稱最長可以有256個字元以 . 開頭的檔案為隱藏檔案，需要用-a引數才能顯示（all

Linux系統下python學習筆記——Linux終端命令綜述

終端命令格式： command [-options] [parameter]（其中[ ]表示可選） command:命令名，相應功能的英文名或者英文縮寫 [-options]:選項，用來對命令進行控制，可省

Linux系統下python學習筆記——前期準備

一、作業系統（Operation System,OS）作業系統的作用：1、直接操作硬體；2、把操作硬體的程式碼封裝成一個又一個的系統呼叫，供其他程式（軟體）呼叫，實現間接操作硬體。作業系統分類：

windows下 word2vec學習筆記

相關推薦