【資料應用案例】教神經網路寫漢字

阿新 • • 發佈：2018-12-30

案例來源：@新智元 @量子位

0. 背景：google公開了一個讓神經網路和你一起寫漢字的demo“Kanji-RNN”，你寫入漢字的前幾畫，神經網路補全成一個完成的“漢字”。

1. 目標：讓神經網路學會“漢字”的書寫

1）這裡的漢字不一定是真實存在的，看起來像漢字就行

2）目前寫法比較粗糙，但如果能達到人類寫漢字的水平（字型、頓筆等），就能進行漢字字型的開發（漢字字型開發成本極高，一般需要一個團隊2年的時間，因此中文字型較少）

2. 過程

1）輸入資料是真實漢字按照筆畫資料的：筆畫、x軸偏移量、y軸偏移量、是否落在紙上（連筆或者非連筆）

2）分類器採用谷歌塗鴉的sketch-rnn框架，sketch-rnn使用混合高斯分佈來估算下一筆的位移。這個用來生成筆跡的方法叫做混合密度網路

3）對漢字寫完的概率進行建模，也即結束字元“end-of-char”概率：模型的softmax層計算每一畫落筆、筆畫結束、字元結束的概率，當字元結束時前兩者也結束。

3. 效果

【資料應用案例】教神經網路寫漢字

案例來源：@新智元 @量子位 0. 背景：google公開了一個讓神經網路和你一起寫漢字的demo“Kanji-RNN”，你寫入漢字的前幾畫，神經網路補全成一個完成的“漢字”。 1. 目標：讓神經網路學會“漢字”的書寫 1）這裡的漢字不一定是

【資料應用案例】摩拜騎行資料探勘違章停車

案例來源：@機器之心作者：Tianfu He、Jie Bao、Ruiyuan Li、Sijie Ruan、Yanhua Li、Chao Tian、Yu Zheng 0. 背景：隨著汽車保有量增加，停車位供不應求，違章停車現象增加。傳統的檢測違停的方式是交警巡

【資料應用案例】關係資料的隱私保護

案例來源：@關會華阿里技術 0. 背景： 1）關係資料描述的是實體與實體之間的聯絡，如人與人之間的交際關係、企業與企業之間的關聯交易關係等。通過關係資料可以生成一張大網，也成為網路資料或者圖資料 2）關係資料的研究包括子群識別、資訊傳播、欺詐識

【資料應用案例】人群優選演算法模型，挖掘品牌潛客

案例來源：@阿里巴巴機器智慧導讀：為A電商做年貨節品牌營銷，目標是識別目標受眾，廣告投放後由“機會人群”轉向“興趣人群”的比例更高。解決方案是：第一步：多方向人群擴散。通過興趣偏好、品類偏好、競品受眾、搜尋人群、流失人群、lookalike人群六個方

【資料應用案例】基於影象搜尋引擎的圖文無關識別方法

案例來源：@位元組跳動技術團隊 0. 背景：知乎、悟空問答中，使用者的回答配上美女、風景圖，能大大提高點選率和點贊率，這樣對正常回答的內容不公平，影響排序質量。需要找到一種方法，識別圖文不符的內容，降低其排序權重。 1. 傳統方法： 1）色情圖片識別

【資料應用案例】美團外賣語音助手

案例來源：@美團技術團隊 0. 背景：騎手在配送時打電話有三個困難： 1）決策複雜：什麼時候打電話？打晚了影響配送速度，打早了影響使用者體驗 2）操作繁瑣與危險：一次操作手機要5-6個操作，大部分在騎電瓶車的時候使用，很危險 1. 目標：美

【電腦科學】【2016】【含部分原始碼】深度神經網路及其實現

本文為捷克布拉格查理大學（作者：Bc. Ján Vojt）的碩士論文，共104頁。深度神經網路是一種有效且通用的模型，能夠完成各種各樣的任務。本文主要研究了三種不同型別的深度神經網路——多層感知器、卷積神經網路和深度置信網路。所有討論的網路模型都是在並行硬體上實現的，並且針對網路

【資料分析案例】DOTA2先幹掉中路一塔後有多大勝算？

e. 1979場比賽後，95%的置信區間為[62.6%, 66.8%]（注：原文中對置信區間的解釋有誤，參看文章最下方有修正。95%置信區間表示的應該是，我們圈定的區間有95%的概率將真正的正態分佈均值圈在內）

【資料分析案例】如何定義你的“親密關係”

案例來源：@將門創投 1. 目標：對戀人間的親密關係做量化，並找出影響親密關係的關鍵因素 2. 資料來源：利用happy couple，戀人可以在上面回答一些與彼此相關的問題。收集到兩大類資料： 1）回答的結果相同，那麼定義為“相似” 2）

【資料應用技巧】NLP領域的預訓練之風

案例來源：@AI科技評論 @集智翻譯組 @人工智慧LeadAI 0. 背景：ImageNet帶來了資料預訓練的風，通過在ImageNet資料集上訓練得到的網路權重，可以遷移學習到較少標註集較高標註成本的領域。這股思想也進入了NLP領域，本文介紹幾種預訓練方法。目

【資料極客】Week3_訓練深度神經網路的技巧

Tips for Training DNN 訓練深度神經網路技巧【李巨集毅2017秋天課程】 1 Vanishing Gradient Problem 梯度消失問題在輸入層部分，即便有很大的變化，通過 Sigmoid 啟

【Keras】GAN神經網路

參考文獻：主要參考這篇文章 Generative Adversarial Networks, link 為了方便說明和研究，我這裡只是設計了一個非常簡單的模型，對高斯分佈樣本進行生成。不過從下面的實驗中，我還是發現了一些非常有用的特點，可以加深我們對GAN網路的瞭解。 G

【深度學習基礎5】深度神經網路的優化與調參(2)

轉載請註明出處。謝謝。本博文根據 coursera 吳恩達 Improving Deep Neural Networks: Hyperparameter tuning, Regularizati

【備忘】python神經網路演算法與深度學習視訊

先準備好一個大硬碟，照著這個學習路線學習！站長也在學習這個教程，沿著數學->演算法->機器學習->資料探勘（分析）->人工智慧的學習路線學習。第00_安裝包、開發工具、註冊（贈品）第01階段-基礎必備篇 python3.6視訊零基礎2周快速

資料結構番外篇【stl應用(1)】優先佇列

stl是一種重要技巧，可以極大地簡化程式設計過程在總結stl之前，我們先簡單介紹一下迭代器。迭代器可以簡單理解為地址的等價物。在不同資料型別中迭代器支援的操作略有不同其中vector使用的是隨機訪問迭代器，其支援的操作可以參考上述表格雖然本文用不上預備知識，但是還是先說一下吧接

【機器學習】搭建神經網路筆記

一、簡單寫一個迴歸方程 import tensorflow as tf import numpy as np #creat data x_data = np.random.rand(100).astype(np.float32)#在x中生成隨機數，隨機數以np的float32型別展示 y_

【機器學習演算法推導】BP神經網路

非線性問題對於一張汽車圖片，如何將其識別為汽車呢？我們人可能看一眼就能識別出來，但是如何讓計算機也擁有同樣的技能呢？我們知道，一張圖片在計算機中都是以畫素矩陣的形式儲存的，無論是一輛汽車，還是一輛飛機，在計算機中都是一個個矩陣，並無法直觀地感受到這個矩陣代表是汽車還是飛機。用邏輯迴

【機器學習】人工神經網路(ANN)淺講

神經網路是一門重要的機器學習技術。它是目前最為火熱的研究方向--深度學習的基礎。學習神經網路不僅可以讓你掌握一門強大的機器學習方法，同時也可以更好地幫助你理解深度學習技術。　　本文以一種簡單的，循序的方式講解神經網路。適合對神經網路瞭解不多的同學。本文對閱讀沒有一定的前提

【資料視覺化】地理資訊視覺化應用

1 地球與生存環境人類長期以來對地球和周遭自然環境進行觀測來研究和了解自己生存的自然空間，科學家們也通過建立數學模型來模擬環境的變化。這些觀測和模擬得到的資料通常包含了地理空間中的位置資訊，因此自然需要用到地理資訊視覺化來呈現資料，最常見的是與氣象相關的資

【基於tesseract或ANN的神經網路的身份證號OCR識別】

之前寫了一篇，結果瀏覽器崩了，文字全無。這次直接上程式碼吧。身份證號的識別過程： #include<iostream> #include<opencv2\opencv.hpp> using namespace std; using names

【資料應用案例】教神經網路寫漢字

相關推薦