1. 程式人生 > >【資料應用案例】教神經網路寫漢字

【資料應用案例】教神經網路寫漢字

案例來源:@新智元 @量子位

0. 背景:google公開了一個讓神經網路和你一起寫漢字的demo“Kanji-RNN”,你寫入漢字的前幾畫,神經網路補全成一個完成的“漢字”。

1. 目標:讓神經網路學會“漢字”的書寫

    1)這裡的漢字不一定是真實存在的,看起來像漢字就行

    2)目前寫法比較粗糙,但如果能達到人類寫漢字的水平(字型、頓筆等),就能進行漢字字型的開發(漢字字型開發成本極高,一般需要一個團隊2年的時間,因此中文字型較少)

2. 過程

    1)輸入資料是真實漢字按照筆畫資料的:筆畫、x軸偏移量、y軸偏移量、是否落在紙上(連筆或者非連筆)

    2)分類器採用谷歌塗鴉的sketch-rnn框架,sketch-rnn使用混合高斯分佈來估算下一筆的位移。這個用來生成筆跡的方法叫做混合密度網路

    3)對漢字寫完的概率進行建模,也即結束字元“end-of-char”概率:模型的softmax層計算每一畫落筆、筆畫結束、字元結束的概率,當字元結束時前兩者也結束。

3. 效果