1. 程式人生 > >pycorrector開源專案使用指南

pycorrector開源專案使用指南

最近調研語音識別,正在使用ASRT語音識別專案(西電本科生搞得,好膩害)

碰到的問題:這個專案的聲學模型生成語音對應的拼音效果較好,大約能達到專案所說的百分之80的正確率,但是拼音轉文字的效果不太盡如人意。小夥伴發現有一個pycorrector 的專案可以對識別出來的文字進行一定程度上的糾正。因此嘗試一下結合到這個專案裡。

環境:ubuntu、python3

安裝:按照專案裡的說明進行安裝即可

踩坑:無論是自動安裝還是半自動安裝都碰到了下面的錯誤,

error: can't copy 'pycorrector/data/kenlm': doesn't exist or not a regular file

Command "/usr/bin/python -u -c "import setuptools, tokenize;file='/tmp/pip-install-D4lnto/pycorrector/setup.py';f=getattr(tokenize, 'open', open)(file);code=f.read().replace('\r\n', '\n');f.close();exec(compile(code, file, 'exec'))" install --record /tmp/pip-record-kGC_ZP/install-record.txt --single-version-externally-managed --compile" failed with error code 1 in /tmp/pip-install-D4lnto/pycorrector/

根據上面的報錯資訊查詢並沒有找到好的解決方案,其實仔細檢視執行後輸出的資訊會發現前面還有報一個錯誤。

 Running setup.py bdist_wheel for xxx

通過升級pip的安裝工具setuptools後問題解決:

sudo pip install --upgrade setuptools

多踩坑,多進步。