1. 程式人生 > 其它 >學習極差、移動極差、方差、標準差、正太分佈

學習極差、移動極差、方差、標準差、正太分佈

本文內容摘自 百度百科等。

極差

極差又稱範圍誤差或全距(Range),以R表示,是用來表示統計資料中的變異量數(measures of variation),其最大值與最小值之間的差距,即最大值減最小值後所得之資料。

它是標誌值變動的最大範圍,它是測定標誌變動的最簡單的指標。‘

最直接也是最簡單的方法,即最大值-最小值(也就是極差)來評價一組資料的離散度。這一方法在日常生活中最為常見,比如比賽中去掉最高最低分就是極差的具體應用。極差=最大標誌值—最小標誌值 [1]
R=Xmax-Xmin
(其中,Xmax為最大值,Xmin為最小值)
例如 :12 12 13 14 16 21
這組數的極差就是 :21-12=9

在統計中常用極差來刻畫一組資料的離散程度,以及反映的是變數分佈的變異範圍和離散幅度,在總體中任何兩個單位的標準值之差都不能超過極差。同時,它能體現一組資料波動的範圍。極差越大,離散程度越大,反之,離散程度越小。 [2]
極差只指明瞭測定值的最大離散範圍,而未能利用全部測量值的資訊,不能細緻地反映測量值彼此相符合的程度,極差是總體標準偏差的有偏估計值,當乘以校正係數之後,可以作為總體標準偏差的無偏估計值,它的優點是計算簡單,含義直觀,運用方便,故在資料統計處理中仍有著相當廣泛的應用。 但是,它僅僅取決於兩個極端值的水平,不能反映其間的變數分佈情況,同時易受極端值的影響。

移動極差

移動極差(Moving Range),是指兩個或多個連續樣本值中最大值與最小值之差,這種差是按這樣方式計算的:每當得到一個額外的資料點時,就在樣本中加上這個新的點,同時刪除其中時間上“最老的”點,然後計算與這點有關的極差,因此每個極差的計算至少與前一個極差的計算共用一個點的值。一般說來,移動極差用於單值控制圖,並且通常用兩點(連續的點)來計算移動極差

方差

方差是在概率論和統計方差衡量隨機變數或一組資料時離散程度的度量。概率論中方差用來度量隨機變數和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題中,研究方差即偏離程度有著重要意義。

方差是衡量源資料和期望值相差的度量值。

正太分佈

正態分佈(Normal distribution),也稱“常態分佈”,又名高斯分佈(Gaussian distribution),最早由棣莫弗(Abraham de Moivre)在求二項分佈的漸近公式中得到。C.F.高斯在研究測量誤差時從另一個角度匯出了它。P.S.拉普拉斯和高斯研究了它的性質。是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面有著重大的影響力。

正態曲線呈鍾型,兩頭低,中間高,左右對稱因其曲線呈鐘形,因此人們又經常稱之為鐘形曲線。

若隨機變數X服從一個數學期望為μ、方差為σ2的正態分佈,記為N(μ,σ2)。其概率密度函式為正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度。當μ = 0,σ = 1時的正態分佈是標準正態分佈。

概率論中最重要的分佈
正態分佈有極其廣泛的實際背景,生產與科學實驗中很多隨機變數的概率分佈都可以近似地用正態分佈來描述。例如,在生產條件不變的情況下,產品的強力、抗壓強度、口徑、長度等指標;同一種生物體的身長、體重等指標;同一種種子的重量;測量同一物體的誤差;彈著點沿某一方向的偏差;某個地區的年降水量;以及理想氣體分子的速度分量,等等。一般來說,如果一個量是由許多微小的獨立隨機因素影響的結果,那麼就可以認為這個量具有正態分佈(見中心極限定理)。從理論上看,正態分佈具有很多良好的性質 ,許多概率分佈可以用它來近似;還有一些常用的概率分佈是由它直接匯出的,例如對數正態分佈、t分佈、F分佈等。

主要內涵

在聯絡自然、社會和思維的實踐背景下,我們以正態分佈的本質為基礎,以正態分佈曲線及面積分布圖為表徵(以後談及正態分佈及正態分佈論就要浮現此圖),進行抽象與提升,抓住其中的主要哲學內涵,歸納正態分佈論(正態哲學)的主要內涵如下:

整體論

正態分佈啟示我們,要用整體的觀點來看事物。“系統的整體觀念或總體觀念是系統概念的精髓。” 正態分佈曲線及面積分布圖由基區、負區、正區三個區組成,各區比重不一樣。用整體來看事物才能看清楚事物的本來面貌,才能得出事物的根本特性。不能只見樹木不見森林,也不能以偏概全。此外整體大於部分之和,在分析各部分、各層次的基礎上,還要從整體看事物,這是因為整體有不同於各部分的特點。用整體觀來看世界,就是要立足在基區,放眼負區和正區。要看到主要方面,還要看到次要方面,既要看到積極的方面還要看到事物消極的一面,看到事物前進的一面還要看到落後的一面。片面看事物必然看到的是偏態或者是變態的事物,不是真實的事物本身。

重點論

正態分佈曲線及面積分布圖非常清晰的展示了重點,那就是基區佔68.27%,是主體,要重點抓,此外95%,99%則展示了正態的全面性。認識世界和改造世界一定要抓住重點,因為重點就是事物的主要矛盾,它對事物的發展起主要的、支配性的作用。抓住了重點才能一舉其綱,萬目皆張。事物和現象紛繁複雜,在千頭萬緒中不抓住主要矛盾,就會陷入無限瑣碎之中。由於我們時間和精力的相對有限性,出於效率的追求,我們更應該抓住重點。在正態分佈中,基區佔了主體和重點。如果我們結合20/80法則,我們更可以大膽的把正區也可以看做是重點。

發展論

聯絡和發展是事物發展變化的基本規律。任何事物都有其產生、發展和滅亡的歷史,如果我們把正態分佈看做是任何一個系統或者事物的發展過程的話,我們明顯的看到這個過程經歷著從負區到基區再到正區的過程。無論是自然、社會還是人類的思維都明顯的遵循這這樣一個過程。準確的把握事物或者事件所處的歷史過程和階段極大的有助於掌握我們對事物、事件的特徵和性質,是我們分析問題,採取對策和解決問題的重要基礎和依據。發展的階段不同,性質和特徵也不同,分析和解決問題的辦法要與此相適應,這就是具體問題具體分析,也是解放思想、實事求是、與時俱樂進的精髓。正態發展的特點還啟示我們,事物發展大都是漸進的和累積的,走漸進發展的道路是事物發展的常態。例如,遺傳是常態,變異是非常態。

總之,正態分佈論是科學的世界觀,也是科學的方法論,是我們認識和改造世界的最重要和最根本的工具之一,對我們的理論和實踐有重要的指導意義。以正態哲學認識世界,能更好的認識和把握世界的本質和規律,以正態哲學來改造世界,能更好的在尊重和利用客觀規律,更有效的改造世界。

弗朗西斯·高爾頓 [Francis Galton 1822.02.16-1911.01.17],英國探險家、優生學家、心理學家,差異心理學之父,也是心理測量學上生理計量法的創始人。

高爾頓對心理學的貢獻,大概可以歸納未差異心理學、心理測量的量化和實驗心理學三方面:

心理學研究之量化,始自高爾頓。他發明了許多感官和運動的測試,並以數量代表所測得的心理特質之差異。他認為人的所有特質,不管是物質的還是精神的,最終都可以定量敘述,這是實現人類科學的必要條件,故最先應用統計法處理心理學研究資料,重視資料的平均數與高中差數。他收集了大量資料證明人的心理特質在人口中的分佈如同身高、體重那樣符合正態分佈曲線。他在論及遺傳對個體差異的影響時,為相關係數的概念作了初步提示。如他研究了“居間親”和其成年子女的身高關係,發現居間親和其子女的身高有正相關,即父母的身材較高,其子女的身材也有較高的趨勢。反之,父母的身材較低,其子女也有較矮的趨勢。同時發現子女的身高常與其父母略有差別,而呈現“回中”趨勢,即離開其父母的身高數,而回到一般人身高的平均數。

智力、能力

理查德·赫恩斯坦 [(Richard J. Herrnstein 1930.05.20-1994.09.13),美國比較心理學家]和默瑞(Charles Murray)合著《正態曲線》一書而聞名,在該書中他們指出人們的智力呈正態分佈。智力主要是遺傳的並因種族的不同而不同,猶太人、東亞人的智商最高,其次為白人,表現最差的是黑人、西班牙裔人。他們檢討了數十年來心理計量學與政策學的研究成果,發現美國社會輕忽了智商的影響愈變愈大的趨勢。他們力圖證明,美國現行的偏向於以非洲裔和南美裔為主的低收入階層的社會政策,如職業培訓、大學教育等,完全是在浪費資源。他們利用應募入伍者的測試結果證明,黑人青年的智力低於白人和黃種人;而且,這些人的智力已經定型,對他們進行培訓收效甚微。因此,政府應該放棄對這部分人的教育,把錢用於包括所有種族在內的啟蒙教育,因為孩子的智力尚未定型,開發潛力大。由於此書涉及黑人的智力問題,一經出版便受到來自四面八方的圍攻。