1. 程式人生 > >Python3資料分析與挖掘建模實戰

Python3資料分析與挖掘建模實戰

第1章 課程介紹 本章首先介紹本課程是什麼,有什麼特色,能學習到什麼,內容如何安排,需要什麼基礎,是否適合學習這門課程等。然後對資料分析進行概述,讓大家對資料分析的含義和作用有一個整體的認知,讓大家對自己接下來要做的事情,有一個基本的概念與瞭解。…

第2章 資料獲取 資料從哪裡來?怎麼來?這一章,我們會介紹資料獲取的一般手段。主要包括資料倉庫、抓取、資料填寫、日誌、埋點、計算等手段。同時,我們也會介紹幾個常用的資料網站,供大家參考與學習。

第3章 單因子探索分析與資料視覺化 有了資料,如何上手?這一章,我們會介紹探索分析的一部分—單因子探索分析和視覺化的內容。我們會以基礎的統計理論知識為切入點,學習異常值分析、對比分析、結構分析、分佈分析。同時,引入接下來幾章都會用到的案例-HR人力資源分析表,並用理論與視覺化的方法,完成對此表的初步分析。…

第4章 多因子探索分析 上了手,然後呢?這一章,我們介紹探索分析的另一部分—多因子複合探索分析。我們同樣以基礎的統計知識為切入點,學習多因子間互相影響與配合的分析方法,如交叉分析、分組分析、相關分析、成分分析等。同時,以HR人力資源分析表為例,進行進一步的探索。…

第5章 預處理理論 資料已瞭解,用起來!不著急,先加工。這一章,我們會介紹特徵工程的主要內容,重點會介紹資料清洗和資料特徵預處理的主要內容,包括資料清洗、特徵獲取、特徵處理(內含對指化、歸一化、標準化等)、特徵降維、特徵衍生。預處理的好壞,直接影響著接下來模型的效果。…

第6章 挖掘建模 把資料用起來!這一章,我們會介紹資料探勘與建模的主要內容。主要包含五類模型的建立與實踐,分別為:分類模型(KNN、樸素貝葉斯、決策樹、SVM、整合方法、GBDT……),迴歸模型與迴歸思想分類(線性迴歸、邏輯斯特迴歸【也叫羅吉迴歸,邏輯迴歸。音譯區別】、神經網路、迴歸樹),聚類模型(K-means、DBSCAN、層次聚類、…

第7章 模型評估 哪個模型好?上一章,我們學習了很多模型,一個數據集,可能用多種模型都可以進行建模,那麼哪種模型好,就需要有些指標化的東西幫我們決策。這一章,我們會介紹使用混淆矩陣和相應的指標、ROC曲線與AUC值來評估分類模型;用MAE、MSE、R2來評估迴歸模型;用RMS、輪廓係數來評估聚類模型。…

第8章 總結與展望 這一章,我們將回顧本課程的全部內容,並從多個角度,重新看待我們的資料分析工作。最後,我們會了解到,學習了這門課程以後,還可以在哪些方面進行發展。

點選下載