基於seq2seq的中國對聯自動配對技術實踐

阿新 • • 發佈：2019-01-17

Sequence to Sequence模型這種基於編碼--解碼的模型已經被谷歌成功應用於機器翻譯上。而理論上任意的序列到序列的有監督問題都可以用這種模型。如上一篇文章寫的古詩生成。包括這一篇實踐性的對聯配對。

對對聯生成過程中，需要使用LSTM來實現，然後需要設定其編碼與解碼的相關引數。如下所示：

# 建立基本的LSTM單元
cells = [tf.contrib.rnn.DropoutWrapper(
        tf.contrib.rnn.BasicLSTMCell(embedding_dim), output_keep_prob=keep_prob
    ) for i in range(3)]

stacked_lstm = tf.contrib.rnn.MultiRNNCell(cells)

with tf.variable_scope('decoders') as scope:
    # feed_previous=False, for training
    decode_outputs, decode_state = tf.contrib.legacy_seq2seq.embedding_rnn_seq2seq(
        encode_input,
        decode_input,
        stacked_lstm,
        num_encoder_symbols=input_vocab_size,
        num_decoder_symbols=output_vocab_size,
        embedding_size=embedding_dim)
    
    scope.reuse_variables()
    
    decode_outputs_test, decode_state_test = tf.contrib.legacy_seq2seq.embedding_rnn_seq2seq(
        encode_input,
        decode_input,
        stacked_lstm,
        num_encoder_symbols=input_vocab_size,
        num_decoder_symbols=output_vocab_size,
        embedding_size=embedding_dim,
        feed_previous=True)

loss_weights = [tf.ones_like(l, dtype=tf.float32) for l in labels]
loss = tf.contrib.legacy_seq2seq.sequence_loss(decode_outputs, labels, loss_weights, output_vocab_size)

optimizer = tf.train.AdamOptimizer(0.001)
train_op = optimizer.minimize(loss)

(2) 測試例子如下：其中掛號內為原有的配對。

測試例子：
悼念先嚴三週年▁▁▁(痛表後生一片心▁▁▁) -> 詩留人間百年詩▁▁▁
百歲人歌長壽酒▁▁▁(萬載花開太平春▁▁▁) -> 千秋再愛自長春▁▁▁
黃花釀酒三杯醉▁▁▁(繡閣增輝兩燭燃▁▁▁) -> 碧水池霜百歲人▁▁▁
豔陽照大廈春華競發▁(甘露灑人間瑞氣勃生▁) -> 看日開新地壯天更高▁
延齡人種神仙草▁▁▁(紀竹新開甲子花▁▁▁) -> 蜜月欣逢百歲圖▁▁▁

測試例子：
白髮朱顏喜登上壽▁▁(豐衣足食樂享晚年▁▁) -> 豐山足食享享高秋▁▁
體健神恰晚景好▁▁▁(書聲墨韻老來紅▁▁▁) -> 天明萱草喜無鴦▁▁▁
大好良辰春光明媚▁▁(重開令甲上壽期頤▁▁) -> 文明盛世喜此如山▁▁
寶馬迎來雲外客▁▁▁(香車送出月中仙▁▁▁) -> 金牛犁棟喜雄風▁▁▁
蓮子杯中金各酒▁▁▁(桃花盞上玉臺詩▁▁▁) -> 桃香嫩柳柳絲凰▁▁▁

測試例子：
賞燈極樂繁華地▁▁▁(秉燈同遊不夜天▁▁▁) -> 養手同來幸福花▁▁▁
寒笳送走人間臘▁▁▁(曉角吹迴雪裡春▁▁▁) -> 夜雨梅花蝶蘿香▁▁▁
知識鼓滿青春風帆▁▁(勞動展開愛情羽翼▁▁) -> 赤策文章浩氣清風▁▁
貯在玉壺由人造▁▁▁(結成晶塊奪天工▁▁▁) -> 誓知甘作口子餘▁▁▁
灰飛薛管聲諧鳳▁▁▁(玉種藍田兆夢熊▁▁▁) -> 何潔堪媳薦良侖▁▁▁

針對這兩種測試，也驗證了人工智慧是否真的會創作。利用這種seq2seq寫出的古詩或者對聯，的確會出現訓練集合外的句子，非常有意思，完全是創作的味道。不過呢，目前的僅僅還是測試例子，對語義上有些地方，特別是裡面的思想和語義理解還有待深入。這可能需要更多的知識、常識、典故等的配合。

基於seq2seq的中國對聯自動配對技術實踐

基於seq2seq的中國對聯自動配對技術實踐

基於seq2seq的中國古詩詞自動生成技術

《基於插件的日誌采集技術實踐》幻燈片下載

雲上拍客梨視頻基於阿裏雲的技術實踐分享

服務上億用戶，中國結算新一代數據集市技術實踐

基於深度學習的CT影象肺結節自動檢測技術六—模型預測

基於深度學習的CT影象肺結節自動檢測技術五—3dcnn優化模型

基於深度學習的CT影象肺結節自動檢測技術一——資料預處理（歸一化，資料增強，資料標記）

《物聯網技術實踐教程基於藍芽4》下載

Tensorflow 自動文摘: 基於Seq2Seq+Attention模型的Textsum模型

基於MTCNN的人臉自動對齊技術原理及其Tensorflow實現測試

基於深度學習的CT影象肺結節自動檢測技術四—資料增強—定義神經網路並訓練

【視訊】基於React Native的跨三端技術實踐

基於Spark的公安大資料實時運維技術實踐

基於微服務架構的技術實踐（附PPT）

雲上拍客梨視訊基於阿里雲的技術實踐分享

基於深度學習的CT影象肺結節自動檢測技術二——訓練資料處理

DEVOPS技術實踐_02:jenkins自動構建項目

基於kubernetes自研容器管理平臺的技術實踐

雲上視訊業務基於邊緣容器的技術實踐

基於seq2seq的中國對聯自動配對技術實踐

相關推薦