1. 程式人生 > >Statistical language model 統計語言模型

Statistical language model 統計語言模型

我們能夠建立語言模型了,一般的我們在訓練集上得到語言模型的引數,在測試集裡面來測試模型的效能,那麼如何去衡量一個語言模型的好壞呢?比較兩個模型A,B好壞,一種外在的評價就是將AB放入具體的任務中,然後分別得到模型的準確率,這種方式當然是最好的方式,但這種方式的缺點是過於耗時,在實際情況中往往需要花費過多時間才能得到結果。另一種方式是使用下面要介紹的困惑度,但注意困惑度並不是上述外在評價的一個好的近似,所以一般使用在試點試驗上,所謂試點試驗就是一個小規模的初步研究,以評估一些效能。