1. 程式人生 > >深入淺出資料分析

深入淺出資料分析

一、分解資料 1.仔細推敲證據 這裡寫圖片描述 2.心智模型 這裡寫圖片描述 二、實驗:檢驗理論 1.比較法 統計與分析的最基本原理之一,比較越多,分析結果越正確。 2.觀察研究法 被研究人自行決定自己屬於哪個群體的一種研究方法。 3.混雜因素 觀察分析法充滿混雜因素,混雜因素是研究物件的個人差異,它不是試圖進行比較的因素,但最終會導致分析結果的敏感度變差。 4.拆分資料塊 為了控制混雜因素的影響,將資料拆分為更小的資料塊。 5.控制組 好的實驗會有一個控制組(也稱對照組),一組體現現狀的處理物件,未經過任何新的處理。 6.隨機選擇相似組 將物件隨機分配到各組之後,最終的結果是:可能成為混雜因素的那些因素最終在實驗組和控制組裡面具有同票同權。 三、最優化:尋找最大值 1.將資料分成兩類:可以控制的因素和無法控制的因素。 決策變數是能控制的因素,收到約束條件的限制 2.藉助目標函式發現目標 目標是希望最大化或者最小化的物件。目標函式則可以幫助找出最優化結果。 3.用電子表格實現最優化 Excel,Open Office(Solver求解器) 4.負相關變數 一種產品越多,意味著另外一種產品越少 5.假設應立足於不斷變化的實際情況 四、資料圖形化 1.提現資料 促進謹慎思考,並制定正確的決策。 2.資料圖形化的根本在於正確比較 3.使用散點圖探索原因 探索性資料分析,在一組資料中尋找一些假設性的條件所做的測試活動。 4.多元圖形 對三個以上的變數進行比較 這裡寫圖片描述

五、假設檢驗 1.編制關係網路模型 這裡寫圖片描述 2.假設評定 這裡寫圖片描述 六、貝葉斯統計 1.利用貝葉斯規則計算患病概率 這裡寫圖片描述 2.貝葉斯規則可反覆使用 這裡寫圖片描述 3.在第一次患病概率的條件下,二次實驗 這裡寫圖片描述 七、主觀概率 1.主觀概率表 這裡寫圖片描述 2.根據主觀概率表進行散點圖分析 這裡寫圖片描述 3.利用貝葉斯規則修正主觀概率 這裡寫圖片描述 八、啟發法 1.啟發法 這裡寫圖片描述 2.快省樹 這裡寫圖片描述 3.案例 這裡寫圖片描述 九、直方圖 1.直方圖 這裡寫圖片描述 2.利用資料子集繪製直方圖 這裡寫圖片描述 十、迴歸:預測 1.演算法 這裡寫圖片描述 2.散點圖 這裡寫圖片描述這裡寫圖片描述 3.使用平均值圖形預測每個區間內的數值 這裡寫圖片描述 4.迴歸線預測實際幅度 這裡寫圖片描述 5.迴歸線與線性相關的資料 這裡寫圖片描述
十一、誤差:合理誤差 1.外插法 這裡寫圖片描述 2.機會誤差 這裡寫圖片描述 3.定量地指定誤差 這裡寫圖片描述 4.用均方根誤差定量表示殘差分佈 分割 這裡寫圖片描述 分割槽模型 這裡寫圖片描述 十二、相關資料庫 1.資料庫 這裡寫圖片描述 2.關係資料庫管理系統(RDBMS) 十三、整理資料 1.EXCEL 2.R(正則表示式)