1. 程式人生 > >基於seq2seq的中國古詩詞自動生成技術

基於seq2seq的中國古詩詞自動生成技術

文字生成技術是深度學習賦予自然語言處理一項全新的技術,而剛好網上有這方面諸多的例子,因此趁著有空實現一下中國古詩的自動生成技術,還是挺好玩的。

具體步驟主要包括以下幾點:

(1) 準備語料庫,即對據有的古詩進行獲取。

(2) 生成關鍵詞,並進行詞向量轉化。

(3) 利用RNN的編碼解碼模型進行訓練,由於RNN具備一對多的輸出,因此可以很好地解決這種自動生成技術。

本文的具體參考程式碼為:https://github.com/DevinZ1993/Chinese-Poetry-Generation

由於原始程式碼是在python2.7環境下,因此需要更改多處程式碼才能執行。主要細節在於一些變數,filter, sorted ,cmp等這種python3所替代的方法。

(3) 測試結果如下:

做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:


慈悲
我佛




生成古詩:


嶺田商步更但望,為望柴眼畝魂新。
頂情向年一羽又,好時寂中田全心。
做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:

我佛
慈悲





生成古詩:


千飢更瑣初邊臣,一花雷嶂化個殘。
遂姿靈陰白鑑酒,詩宦無看煙衲驂。
做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:

慈悲
我佛





生成古詩:


夢鄭西清超江明,重共齊時日騮歸。
送河醉其堪山韻,也樽定勝自隔規。
做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:
我佛

慈悲





生成古詩:


布胸照似細士廟,故晚攀陵詩下暇。
東池只千一葉處,我道今老一力霞。
做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:
慈悲
我佛






生成古詩:


蝴邊客雲道饒偃,玉竹似病限分家。
秋說聽飛眉早看,但回何滿縹東佳。
做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:


慈悲
我佛




生成古詩:


雲瑟累瓶辱州莫,楚花拄處自鵝苔。
諫是君雨是不過,疊行寶舟突髯臺。
做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:
慈悲

我佛





生成古詩:


濃枝十老不密飄,笙中北大落整長。
好問即陳梅多卻,高凡到汾倚逢腸。
做詩的相關文字為: 我佛慈悲
關鍵詞個數為:4
關鍵詞:
慈悲
我佛






生成古詩:


猛事枝人春皪頭,只向華聲慈衣弦。
須似心上換皆土,數人憐少間及仙。