【AI測試】智慧音箱--自然語言處理,語音語義識別測試
自己目前沒有做過自然語言處理,語音語義識別測試,本文為聽一場語音語義識別測試分享學習所得,以及結合網上學習資料整理。
語音識別測試
主要考慮距離、噪聲、不同手機機型或硬體、不同網路
- 噪音干擾識別測試
- 不同距離識別測試
- 不同機型識別測試
- 不同網路語音識別速度測試
- 監測靈敏度測試
- 競品對比測試
語義識別測試
測試人員大部分時間會花在構造語義測試資料階段。儘可能的收集各種語境和語義輸入。
構造語義測試資料的方法:
釋出前
語義測試開展(構造語義測試資料的四個階段)
-
人工腦暴資料
-
實體擴充
- 模板庫 + 實體庫自動化生成資料
- 熱門實體庫更新(實體庫為FM節目、FM專輯、音樂熱歌、音樂新歌等)
-
針對人說話特點以及音箱場景做專項定製化資料增長
- 同音字替代
- 實體少字
- 模糊音替代
- 干擾語氣詞
- 重疊字
- 實體顛倒
- 實體含英文,數字等
-
同義詞擴充(同義詞替代增長測試資料)
- 訓練ngram來判斷語句是否通順
- 提升ngram模型能力
舉個栗子:
釋出後
- 線上真實使用者句子
- 人工標註,反哺測試資料
- 相似度聚類問法,找出新的問法
測試驅動開發
- 總結分析問題(把出錯的樣本逐一分析原因並歸類)
- 發現規律,解決某一類問題
- 主動去發現和挖掘問題
相關推薦
【AI測試】智慧音箱--自然語言處理,語音語義識別測試
自己目前沒有做過自然語言處理,語音語義識別測試,本文為聽一場語音語義識別測試分享學習所得,以及結合網上學習資料整理。 語音識別測試 主要考慮距離、噪聲、不同手機機型或硬體、不同網路 噪音干擾識別測試 不同距離識別測試 不同機型識別測試 不同網路語音識別速度
【讀書筆記】《Python自然語言處理》第1章 語言處理與Python
1.1 語言計算:文字和詞彙 入門 nltk下載地址 使用pip安裝 >>>import nltk 檢驗是否成功。 >>>nltk.download() 選擇語料下載 使用python直譯器載入book模組中的條目 >&g
【forever1dreamsxx--NLP】日子在指尖悄悄流淌,不覺間卻沉積出暗香陣陣。一個普通的數學系本科生,熱愛數學,熱愛自然語言處理,從事自然語言處理相關工作。郵箱:
日子在指尖悄悄流淌,不覺間卻沉積出暗香陣陣。一個普通的數學系本科生,熱愛數學,熱愛自然語言處理,從事自然語言處理相關工作。郵箱:[email protected],希望能夠不吝交流。...
【AI基礎】python:openCV——圖像處理(1)
python python:openCV OpenCV圖像的基本操作 :使用包cv2,numpy import cv2 import numpy as np img = cv2.imread(‘1.jpg‘) cv2.imshow(‘image‘,img) k = cv2.waitKey(0) "
【AI基礎】python:openCV——圖像處理(2)
getTrackbarPos圖像處理練習 制作一個滑動條調色板,使用函數cv2.getTrackbarPos();cv2.creatTrackbar() import cv2 import numpy as np def nothing(x): pass img = np.zeros((300,5
學習自然語言處理,一張圖就夠了
自然語言處理一張圖看懂自然語言處理技術框架 一、前言 正在針對《人工智能產品經理最佳實踐請添加鏈接描述》視頻課程第三部分,關鍵技術篇,進行相關的內容重構,今天整理的部分是自然語言處理技術框架,特地繪制了一張自然語言處理的技術框架圖,在此分享給大家。 二、正文 三、未完待續 個人梳理,未盡之處,歡迎指正。QQ
深度學習視訊,吳恩達,CS231n,斯坦福,計算機視覺,牛津大學,xDeepMind ,自然語言處理,莫煩,Tensorflow
1. 吳恩達 最新深度學習視訊 網易雲課堂 http://mooc.study.163.com/smartSpec/detail/1001319001.htm 《深度學習筆記v5.32》 pdf下載 連結:https://pan.baidu.com/s/1m8c7OdCJJZ2
人工智慧,深度學習,計算機視覺,自然語言處理,機器學習,百度網盤視訊教程
人工智慧,深度學習,計算機視覺,自然語言處理,機器學習視訊教程下載: 1. CS224D 2. NLP到Word2vec 3. Opencv3影象處理 4. Tensorflow 5. 機器學習 6. 人工智慧課程 7. 聊天機器人視訊教程 8. 自然語言處理 獲取檔案下載連結
自然語言處理之命名實體識別-tanfordcorenlp-NER(一)
轉載請註明出處:https://blog.csdn.net/HHTNAN 簡介 CoreNLP 專案是Stanford開發的一套開源的NLP系統。包括tokenize, pos , parse 等功能,與SpaCy類似。SpaCy號稱是目前最快的NLP系統, 並且提供現成的pyt
文字識別(自然語言處理,NLP)
目錄 語音識別 NLTK - 自然語言工具包 分詞 詞幹 詞形還原 詞袋 詞頻 文件頻率(DF) 逆文件頻率(IDF) 詞頻你文件頻率(TF-IDF) 基於多項
自然語言處理 crf++命名實體識別
自然語言處理的方法有很多種,crf++是也是使用比較多的一種方法,關於crf++ 的詳細解釋可以參考網上的資料,這裡不再做介紹,這裡直接說的就是用crf++進行命名實體識別。 crf++ 進行自然語言處理的時候需要下載一個crf工具包,然後使用工具包進行處理,我使用的是CR
第六章(1.4)自然語言處理實戰——時間語義抽取
一、簡介 本工具是由復旦NLP中的時間分析功能修改而來,做了一些細節和功能的優化,經SpringBoot封裝成web工具。 泛指時間的支援,如:早上、晚上、中午、傍晚等。 時間未來傾向。 如:在週五輸入“週一早上開會”,則識別到下週一早上的時間;在下午
【NLP】百度AI平臺自然語言處理API呼叫(情感分析案例)
首先先註冊登入百度AI平臺,自然語言處理是免費的,有5 QPS,夠用了,不夠用可以申請增加。 我申請增加至10 QPS,通過得很快。 相關配置準備 找到百度AI平臺的NLP入口: 看到自然語言處理 點選進入 進入之後跳轉到自然語言處理產品頁 點選
【數學之美筆記】自然語言處理部分(一).md
strip BE 模擬 ges arr 實驗 語句 次數 而不是 文字、數字、語言 、信息 數字、文字和自然語言一樣,都是信息的載體,他們的產生都是為了記錄和傳播信息。 但是貌似數學與語言學的關系不大,在很長一段時間內,數學主要用於天文學、力學。 本章,我們將回顧一下信息時
【自然語言處理篇】--以NLTK為基礎講解自然語?處理的原理
pytho 沒有 正則表達 emma lower art pro 轉換 算法 一、前述 Python上著名的?然語?處理庫?帶語料庫,詞性分類庫?帶分類,分詞,等等功能強?的社區?持,還有N多的簡單版wrapper。 二、文本預處理 1、安裝nltk pip instal
Python自然語言處理筆記【二】文本分類之監督式分類的細節問題
重要 探索 基於 font 產生 com 分類器 保持 聯合 一、選擇正確的特征 1.建立分類器的工作中如何選擇相關特征,並且為其編碼來表示這些特征是首要問題。 2.特征提取,要避免過擬合或者欠擬合 過擬合,是提供的特征太多,使得算法高度依賴訓練數據的特性,而對於一般化的
【NLP漢語自然語言處理與實踐】分詞_筆記
統計 The 計算 分詞 其余 雙向 name -c max 一、兩種分詞標準: 1. 粗粒度。 將詞作為最小基本單位。比如:浙江大學。 主要用於自然語言處理的各種應用。 2. 細粒度。 不僅對詞匯繼續切分,也對詞匯內部的語素進行切分。比如:浙江/大學。 主要用於搜索
【自然語言處理】良心資源,不點開會後悔的那種
ACL文章連結 http://www.aclweb.org/anthology/ 2016年ACL-WMT機器翻譯資料集 PaperWeekly http://rsarxiv.github.io/ 中國NLP聯盟(牆裂推薦) ht
【python 走進NLP】pyhanlp 自然語言處理包
安裝: pip install pyhanlp 若安裝失敗: 從這裡下載JPype allows full access to Java class libraries. https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpype 開
【自然語言處理】詳說中文自動分詞
文章目錄 詳說中文自動分詞 前言 一、 what is 中文分詞 二、中文分詞的用途 三、中文分詞的特點和難點 四、常見的中文分詞方法 五、中文分詞工具 1、Ha