資料分析師---目錄(待補充)
基礎知識
數值型別
序列(list,tuple,str),通用技巧和核心基本技巧
dist,常用操作,訪問及遍歷
條件迴圈語句和條件語句
自定義函式
區域性變數和全域性變數
匿名函式lambda
模組建立及import指令運用,pip管理工具
檔案物件申明及其操作
系統模組下路徑操作
檔案讀寫
pickle模組運用及儲存結構化資料
工具
numpy基礎資料結構
通用函式
索引及切片
隨機數
資料輸入和輸出(儲存處理矩陣結構理解陣列物件array)
Pandas
資料結構series,基本概念和建立
Series 索引
series基本技巧
Dataframe 基本概念和建立
索引
基本技巧
時間模組
時刻資料
時間戳索引
數值計算和統計基礎
文字資料
合併
連結和修補
去重和替換
資料分組
分組轉換及拆分-應用-合併
透視表及交叉表
檔案讀取
Matplotlib
圖表視窗
圖表的基本元素
圖表的樣式引數
刻度、註釋、圖表輸出胡
子圖
基本表繪製
柱狀圖、堆疊圖、面積圖、填圖、餅圖
直方圖、散點圖、矩陣散點圖
極座標、箱型圖
表格樣式建立、顯示控制、樣式呼叫
國內外公開資料庫介紹
統計學知識
特徵分析:
分佈分析
對比分析
統計分析
帕累託分析
正態性檢驗
相關性分析
資料處理:缺失值處理
異常值處理
資料歸一化
資料連續屬性離散化
數學建模:
線性迴歸理論
線性迴歸Python實現
線性迴歸模型評估
KNN最鄰近分類
KNNpython實現
PCA主成分分析及實現
Kmeans聚類概述即實現
蒙塔卡羅模擬尼倫概述解毒
結果輸出
資料視覺化技能體系及其方向
資料圖表表達的邏輯原理
python-seaborn 資料視覺化
調色盤
分佈資料視覺化:直方圖和密度圖
散點圖
分類散點圖
分佈圖
統計圖
線性資料視覺化:
時間線圖、熱圖
結構化圖表視覺化
關係網路資料視覺化
gephi軟體安裝和配置
python資料預處理
案例分析:公司職員關係圖表
空間視覺化
3D圖表
空間柱狀圖
空間線性軌跡圖
空間熱力圖
python互動圖表視覺化:bokeh
繪圖空間基本操作
圖表輔助引數設定
散點圖
折線圖、面積圖
柱狀圖、堆疊圖、直方圖
toolbar工具欄設定