Reading Level Assessment Using Support Vector Machines and Statistical Language Models-paper

阿新 • • 發佈：2018-12-23

Authors:
Sarah E. Schwarm University of Washington, Seattle, WA
Mari Ostendorf University of Washington, Seattle, WA
Published in: ACL
time：June 25 - 30, 2005
Association for Computational Linguistics Stroudsburg, PA, USA ©2005

資料不公開

2 reading level assessment

最早：公式，syntactic特徵（如句長）
之後：概率語言模型（前兩個論文），smoothed unigram分類器捕捉詞的變化
smoothed unigram分類器的Overall Accuracy and Generalization Ability
UNK：text中unknown的比例
types：per 100-token passage裡的type即unique單詞的個數
MLF：passage和大語料的相對log平均概率
FK：FK公式
smoothed unigram分類器效能超過了上述semantic difficulty，但是沒有捕捉到syntactic information

我們的模型，使用ngram，捕捉both semantic和syntactic資訊

補充：
Syntax是語法上的，Sematic是語義上的。
在自然語言範圍內舉個簡單的例子The dog is a man.從syntax上來說，這句話沒有錯，主謂賓齊全而且各個成分的性和格也沒錯，但是語義上來說是錯的，dog 怎麼能是man呢。在不同的領域，syntax 和semantic有著不同的對照，但大致關係和自然語言裡是差不多的。
syntactic，也就是句法，指的是語言的結構，簡單說就是名詞動詞形容詞等等不同詞性的詞應該按什麼順序在某一個語言裡出現，還有某一種詞性的片語可以衍生出什麼新的結構（比如VP->V NP）。
結構正確的句子不一定有意義（semantic，也就是語義，指的是語言表達的意義）。一個著名的例子是：“Colorless green ideas sleep furiously“。這個句子句法上完全正確，形容詞名詞動詞副詞各就各位，但是一點不make sense，正常生活中人不會明白這個句子要表達什麼意思。
比較簡單的理解語義和句法的區別的方法是：句法是講一個東西往哪擺的，語義是研究擺那以後對句子的interpretation的影響的。

Reading Level Assessment Using Support Vector Machines and Statistical Language Models-paper

Reading Level Assessment Using Support Vector Machines and Statistical Language Models-paper

An intuitive introduction to support vector machines using R

Deep Learning using Linear Support Vector Machines的簡單實現

Ng第十二課：支持向量機(Support Vector Machines)（二）

Support Vector Machines（SVM）如何根據虹膜分類評估性格類別？

Coursera-吳恩達-機器學習-第七週-測驗-Support Vector Machines

Coursera-吳恩達-機器學習-第七週-程式設計作業: Support Vector Machines

機器學習筆記 ---- Support Vector Machines

吳恩達機器學習13--支援向量機(Support Vector Machines)

sklearn(十四)：Support Vector Machines

Andrew Ng機器學習程式設計作業:Support Vector Machines

機器學習之支援向量機(Support Vector Machines)

Comprehensive Support Vector Machines Guide

【原】Coursera—Andrew Ng機器學習—課程筆記 Lecture 12—Support Vector Machines 支援向量機

OpenCV2.4.9原始碼分析——Support Vector Machines

支援向量機（Support Vector machines）

機器學習之支援向量機： Support Vector Machines (SVM)

Sequential Minimal Optimization: A Fast Algorithm for Training Support Vector Machines 論文研讀

Combining Lexical and Grammatical Features to Improve Readability Measures for First and Second Language Texts.-paper

Using Swift with Cocoa and Objective-C下載

Reading Level Assessment Using Support Vector Machines and Statistical Language Models-paper

相關推薦