【語言學】論語言學知識點
文章目錄
論語言學知識點
前言
最近一兩篇博文是連載的,上一篇是關於 統計學 知識點概率,這一篇學習的是關於語言學的簡單瞭解。
關於自然語言處理小分支的學習筆記都在 博主的這個專欄中,若是瀏覽至此,有任何意見和建議歡迎老鐵給菜鳥留言,以此我們共同進步。
說明
以下內容都是博主學習書籍所獲,多半都是博主用自己的大舌頭作為總結性的陳述至此,謹慎借鑑奧!!!
一、語音
1、 What is 語音???
言簡意賅就是說,通過人的發音器官----->發出有意義的內容(可不是大吼大叫的噪音奧)------->用於社會交際的聲音
2、語音的三大屬性
物理屬性
物理屬性,顧名思義,這裡用於物理學知識來理解,語音的本質是音波,由發聲體振動而產生。因此語音同自然界其他聲音一樣,擁有音高、音強、音長、音色四種要素。
生理屬性
語音是由人的發音器官發出的,後者根據參與發音過程的先後順序可分為三個部分:肺、氣管、胸腔、橫膈膜等呼吸器官,它們主要通過撥出氣流為發音提供原動力;喉頭、聲帶等發聲器官,黏附在喉頭的軟骨上,由兩片薄膜構成的聲帶在氣流衝擊下發生振動,形成音波;咽腔、鼻腔、口腔處的調音器官,它們將把從聲帶傳出的音波進行加工,從而產生我們人耳聽到的各種語音。
社會屬性
語言是一套符號系統,語音作為其重要組成部分也是如此。語音的社會性質主要有以下三個方面:
⊚ 語音與相應語義之間的關係是非必然的,約定俗成的。漢語普通話中的[dà lù] 可以用來指代陸地,也可以用來指代寬廣的道路。不同語言間的音義規定差別則更為明顯,同樣是蘋果,英國人就會說成是“apple”。
⊚ 語音具有地域性、民族性。上面說到音義之間的對應關係是人為規定的,但是這種規定如果不能得到一個區域內特定群體的廣泛認同,則人與人之間就無法進行有效的交流。如果進一步放任音義關係的隨意擴充套件,那麼就有可能產生《聖經》中“巴別塔”般的悲劇。為了避免上述現象的發生,不同民族和地區的人們在地理文化的差異下便產生了成百上千種各具特色的語言。
⊚ 語音具有系統性。這就意味著不同語言或方言擁有著不同的語音元素以及不同的內部關係。同樣是說“牛奶”和“男人”這兩個詞,北京人和四川人就會有兩種不同的發音結果(四川方言存在[n][l] 不分的情況)。
總結如下:
社會屬性沒有一定性,都是按照各個不同的民族,國家(地域性,民族性)有各自的語言,就比如中國甘肅省和雲南省都有自己的方言是一個道理, 在同一個語音在語義上也未必表達的是同一個意思。
3、 語音單位
1、 音素
2、 音節
3、 聲母、韻母、聲調
4、 音位
4、記音符號
歷史上漢語的記音方法很多,諸如反切法、“注音符號”(至今臺灣等地區還在使用)標記等。現在國內通行的是1958 年審議通過的《漢語拼音方案》,相信絕大多數讀者在小學語文課堂上就學習了相應的知識,在此就不再贅述。另外需要重點介紹的,也是目前國際上通用的記音符號就是國際音標(International Phonetic Alphabet,簡稱IPA)。它採用一符一音原則,大部分符號採用拉丁小寫字母及其變體(如倒寫、反寫、合寫、新增附加符號等)。
注:趙元任和瞿靄堂兩位先生的發音最為經典。
5、共時語流音變
看名稱好高大,,,其實就是一個音變。
1、 變調
2、 兒化
二、 詞彙
what is 詞彙
是某種特定語言裡所有詞和固定短語的總和。
大白話就是詞和固定的短語統稱為詞彙。
詞彙單位
1、語素
構詞的單位,語言中最小的音義結合體。例如,“筆”就是一個語素,它的語音形式是[sh],它的詞彙意義是“寫字、畫圖的工具”,語法意義是“名詞、量詞”及相關的語法作用。
從音節角度看,語素有單複音節之分。現代漢語中絕大部分是由一個音節構成的語素,如“天、地、人、山、海、的、啥、啊”等;而複音節語素是指由兩個及其以上音節構成的語素,如“蝴蝶、鴛鴦、玻璃、摳門、布宜諾斯艾利斯”等;另外還有小於一個音節的特殊語素,如“鳥兒”的“兒”字因是兒化標記,只算半個語素。
有一個簡單的判別語素的方法——“替代法”,即用一個新語素替代尚未確定為語素的語言單位,其間還要注意替代前後另外一個未被替代的語素,其意義不能發生變化。以“摳門”為例,該詞雖可被替換為“鐵門”“摳鼻子”等,然而“摳門”合在一起表示的“小氣、不大方”義,並非拆開後各自的“用手指或細小的東西挖”“建築物的出入口”等義簡單組合就可得到。
對於複音節語素,其語義常常是確定的,其組成元素也往往是不容隨意更改的。
從表意虛實看,語素還分為實語素和虛語素。前者有具體的詞彙意義,如“天、人、喜”等;後者則只表示抽象的語法意義,如“嗎、的、老(公)”等。
從構詞能力看,還有成詞語素與不成詞語素之分。前者又叫自由語素,指既能單獨成詞又可以與其他語素組合成詞的語素,如“馬跑了。”這句話中的成詞語素“馬”既可以單用,也可以組合成“白馬、駿馬、老馬”等。而不成詞語素則是指不能獨立成詞,必須和別的語素組合在一起的語素,也稱黏著語素。不成詞語素又可以分為兩類,一類位置自由、承擔了所成詞部分乃至全部的基本意義,如“卉、健、民、麗”等,它與成詞語素合在一起被稱作詞根,是詞義的承擔者;另一類位置固定只表示一些附加語義,被稱作詞綴,依所在位置被進一步分為字首、中綴、字尾,如“者、第、化(白熱化)、裡(稀里嘩啦)”等。
2、 詞
3、固定短語
4、縮略語
注: 詞,固定短語,縮略詞就不多說了,,,,
詞的構成
1、單純詞:只由一個語素構成的詞。
聯綿詞,疊音詞,擬聲詞,音譯外來詞。
2、合成詞:由兩個及以上語素構成的詞,主要由以下幾類
複合詞,重疊詞,附加詞
詞彙的構成
現代漢語詞彙分為基本詞彙與一般詞彙兩類。前者具有穩固性、能產性、全民通用性等特徵,是機器翻譯訓練集的理想詞源;後者包括古語詞、方言詞、外來詞、行業語、熟語及新興的網路用語等,這些詞數量多、適用範圍窄、更新速度快,是專語語料庫的主要面向物件,但並不適合作為機器自動學習的詞彙語法教科書。
詞義及其分類
1、什麼是詞義
詞義是詞的意義,廣義上包括詞彙意義和語法意。
2、詞義的分類
理性義:也稱概念義,是詞義中反應事物概念的意義部分。
色彩義:也稱附屬義,是附著在理性義之上旨在表達評價、形象等內容的詞義部分。
義項與義素
義項
詞的理性意義的分項說明。例如,“經過”就有兩個義項:一是“通過”,二是“經歷的過程”。一個詞若同時擁有幾個義項,那其中必有一個義項是最為基本、常用的,我們把它稱作基本義;其他的一些義項一般都是由它直接或間接轉變而來的,我們稱之為轉義。根據轉義產生的方式,又可以細分為兩種:引申義與比喻義。前者是基本義經過推演而形成的意義,如“錘”基本義是“敲打物件的器具”,後來也引申為“用錘敲打”這一動作;後者是基本義被用來比喻為另一事物後逐漸固定下來的新意,如“手足”原指手腳,後也用它來比喻“兄弟”。
根據詞義項的多少我們可以將其分為單義詞和多義詞。值得注意的是,日常生活中我們很容易把多義詞與一些特殊的同音詞混淆在一起。多義詞就是有兩個及以上義項的詞,而同音詞則是語音相同而意義毫聯絡的一組詞。試看一對例子:“廣”是一個多義詞,既可以在“寬廣”中指“面積、範圍寬闊”;又能在“廣開言路”中作動詞,表“擴大、擴充”義。而“花”則是由一組同音詞構成的,一組以“花朵”為基本義,另一組如“花錢、花銷”等,則是詞義與前者毫不相干的另一組詞。
義素
和語音學部分所講的“音素”“音位”類似,詞義部分也有義素與義位兩組概念。前者是最小的不能獨立運用的意義單位,也稱詞的語義特徵;後者則是最小的能獨立運用的意義單位,略等於之前所講的義項。有了這樣一組概念,接下來我們就可以使用一種名為“義素分析法”的手段來深入分析詞的內部意義構成,舉例如下。
父親——[+ 男性+ 長輩+ 血親] 伯父——[+ 男性+ 長輩—血親]
妹妹——[+ 女性-長輩+ 血親] 姨媽——[+ 女性+ 長輩——血親]
要注意,只有相關的詞才可以進行義素分析,反之如“大海”與“狗”,因二者詞義相差過大而很難總結出較為短小的幾條區別特徵。另外,義素的選取也尤為重要,要仔細分析出一組可以區別目標詞的特徵,然後用“[]”將其標註出來,在前面用“+”“-”號進行分析。
語義場
物理學上把物理量在空間中某個特定區域內的分佈稱為場,有溫度場、引力場、電場、磁場等。語義學中也引入了“場”的概念,從而形成了語義場,它是根據詞義的共同特點或關係劃分出來的類。同場詞有著共同的語義區別特徵,同時其各個義素前正負號的差異又將它們在同一個語義場中做出區別。
只要詞在同一語義場內,就可以認為其具有相關性,從而進行義素分析。那麼語義場到底有哪些呢?根據場中各成員間的關係不同,語義場可以粗分為以下幾類。
(1) 類屬義場場內成員同屬於一個更高層的類,如“詩歌 散文 小說”都屬於文學體裁類,其中“詩歌”“散文”等我們稱其為下位詞,“文學體裁”我們稱其為上位詞。上下位的概念是相對的、不斷轉換的,如“詩歌”就可以進一步細分為“古詩、近體詩、現代詩歌” 等。
(2) 順序義場場內成員之間存在某種順序排列,如“狀元 榜眼 探花”“立春 雨水 驚蟄” 等。
(3) 同義義場場內成員意義相同或相近,如“高興 開心 喜悅”“集合 匯合聚集” 等。
(4) 反義義場與同義義場相反,場內成員意義相反或相對,如“高貴 卑賤”“乾淨 邋遢” 等。
(5) 其他關係義場除上述義場外,仍有部分語義關係無法得以充分歸納,所以將其單列一項,一齊算入“其他關係義場”。例如:“父母 子女”“前邊 後邊” 等
三、語法
1、 what is 語法
語法是語言三要素之一(另有語音、語義),專指一種語言中語素、詞、短語和句子等有意義的語言單位由小到大組合所依據的規則。
2、詞類
詞類是詞在語法性質方面劃分出的類別,主要依據三個標準:語法功能、形態和意義。其中尤以語法功能標準最為重要,它主要指詞的組合能力及充當句法成分的能力。在三條標準的指導下,詞可先粗分為兩類:實詞與虛詞。前者可以單獨充當句法成分,意義較為具體;後者不能充當句法成分,只能伴隨實詞發揮語法意義。二者還可進一步細分,具體如下
-
實詞
1:名詞
2:動詞
3:形容詞
4:區別詞
一種特殊的形容詞(非謂形容詞),表示事物的區別性特徵,往往成對出現。例如,“男:女、土:洋、國營:民營、小號:中號:大號”等。
5:數詞
6:量詞
7:動量詞
用以計算動作次數多少及持續時間長短,如“下、次、場、番”等。另有借用的動量詞,如“嗷一嗓子、打一拳、算了一算”等。
8:副詞
表示範圍、程度、時間等義,常用以修飾動詞、形容詞性詞語,又分:
(1) 表示範圍——全、都、皆、均、總、共、齊、就、只、單、光。
(2) 表示程度—— 很、非常、極、最、十分、太、越發。
(3) 表示時頻——立即、曾經、剛剛、一向、再次、偶爾。
(4) 表示肯否——必須、一定、別、未、莫、沒有、勿。
(5) 表示語氣——竟然、豈非、偏、難怪、未免、只好。
(6) 表示處所——到處、處處、隨處、四處。
(7) 表示關聯——遂、就、再、又、仍。
(8) 表示情態方式——匆匆、一味、親自、暗自、隨意。
9:代詞
10:擬聲詞
11:嘆詞 -
虛詞
1:介詞
也稱“前置詞”,常在實詞、短語前組成介詞短語,用以修飾或補充謂詞性詞語。可分為:
(1) 表示施受關係—— 讓、被、叫、把、給。
(2) 表示原因、目的——因為、為了、由於。
(3) 表示方式——據、按、照、依、靠、以。
(4) 表示關涉物件——和、跟、同、比、對、關於。
(5) 表示時間、處所、方向—— 自、從、往、到、至、趁著、當著
2:連詞
3:助詞
附著在實詞、短語或句子前後表示一定的結構關係或語法意義,又分:
(1) 結構助詞—— 的、地、得、之(定語後接“的”、狀語後接“地”、補語前加“得”)(1) 結構助詞—— 的、地、得、之(定語後接“的”、狀語後接“地”、補語前加“得”)
(2) 動態助詞—— 著、了、過。
(3) 嘗試助詞——看(輕聲)。
(4) 時間助詞——來著、的(如“飯後是我洗的碗”等)。
(5) 約數助詞——把、來、多、左右。
(6) 比況助詞——似的、一般、一樣。
(7) 其他助詞——所、連、給、等、們。
4:語氣詞
3、 短語
什麼是短語?
短語也叫“片語”,是詞和詞按照一定的語法規則和語義搭配關係組合起來的,沒有句調的語言單位。按照博主的理解通俗點來說就是小學組詞填空那種套路。
短語的型別
1:組合分類
2:功能分類
3:結構關係不同產生的歧義
A. 共享–單車,動賓,動賓短語(相當於“共享什麼”)
B. 共享–單車,定中,偏正短語(相當於“什麼單車”)
4:語義關係不同產生的歧義
A. 雞–不–吃–了,主–謂–狀–中,主謂短語(相當於“不吃雞了”)
B. 雞–不吃了,主–謂狀中,主謂短語(相當於“雞不吃食了”)
5:結構、語義關係皆不同產生的歧義
A. 咬–死–了–獵人–的–狗,動–謂–中–補–定–中,動賓短語(相當於“獵人的狗被咬死
了”)
B. 咬死–了–獵人–的–狗,定–中–動–賓,偏正短語(相當於“狗咬死了獵人”)
4、單句
單句是由短語或詞構成的句子,在句子結構上與“複句”相對。這裡博主直接理解成了一個句子。
5、 複句
它特指由兩個及以上意義相關而結構上互不包含的分句,加上貫通前後的句調後所構成的句子。這裡博主直接理解成了多個句子。