1. 程式人生 > 其它 >資料分析模組與Anaconda軟體使用

資料分析模組與Anaconda軟體使用

目錄

  • 資料分析的概念

  • 資料分析的工作流程

  • 資料分析三劍客簡介

  • ipython模組

  • jupyter模組

  • Anaconda軟體使用

資料分析的概念

資料分析

就是從現有的資料中挖掘出價值

資料分析應用領域

1.商品推薦

eg:在淘寶上搜索了一款產品之後,接下來就會瘋狂給你推薦相關產品

2.量化交易

股票、期貨等資料分析

3.短視訊推送

抖音、今日頭條等短視訊推薦

為什麼資料分析需要學python

python簡單易學、並且是資料分析必備的語言

資料分析的工作流程

# 以下工作流程是一般情況下常見流程 也有可能會出現偏差
1.需求分析
    分析什麼資料、以什麼方式分析、想要什麼樣的結果
    
2.資料採集 資料的來源: 1.公司內部自帶 直接呼叫即可 如:MySQL/MongoDB 2.網路爬蟲獲取 需要編寫程式碼 如:爬蟲相關技能 3.第三方服務 花錢直接購買 3.資料清洗 針對獲取到的資料還需要校驗是否符合分析條件 如:缺失資料/異常資料等 4.資料分析 選擇相應的計算公式、演算法模型分析資料 5.生成資料分析報告 攥寫分析報告並給出分析之後的規律及建議 6.資料視覺化 將複雜的資料用圖示的形式展示出來,便於檢視相應規律 資料視覺化一般是結合資料分析報告一起

資料分析三劍客簡介

1.numpy
    數學計算模組,該模組是很多計算模組的底層模組
2.pandas
    資料分析最為核心的模組之一、主要用於操作excel表格
3.matplotlib
    資料視覺化

小疑問

# 既然excel軟體可以操作表格資料,那為什麼還需要pandas模組?
當表格的資料低於10萬行的時候採取excel軟體操作方便
但是資料高於10萬行之後使用excel軟體就會出現卡頓不方便
所以pandas模組能夠解決資料量較大的情況下的處理操作

ipython模組

在cmd終端中可以編寫python程式碼 但是存在以下缺陷
1.程式碼沒有提示
2.程式碼不會自動縮排
3.通篇一個顏色過於單調
在cmd中編寫程式碼是否可以解決掉上面多個缺陷
    pip3 install ipython
    
開啟cmd之後直接輸入ipython進入全新的程式設計環境
1.程式碼有提示
2.程式碼自動縮排
3.通篇顏色不單調

jupyter模組

pip3 install jupyter

命令列輸入jupyter notebook即可
會自動呼叫當前計算機預設的瀏覽器開啟一個介面
如果呼叫了非預設瀏覽器訪問地址需要輸入一個token值,在啟動服務的展示資訊中含有
開啟的介面取決於終端輸入jupyer notebook命令的左側路徑

基本功能

upload用於上傳任意型別的檔案
# new下拉框
        python3用於建立notebook檔案
        Text File用於建立文字檔案
        Folder用於建立資料夾
        Terminal用於模擬cmd終端

注意事項

1.notebook檔案的字尾名是.ipynb 該檔案無法以正常的雙擊直接開啟

2.需要使用專門的notebook環境才可以開啟並且檢視內部的真實資料

以後看到該型別的檔案就使用jupyter notebook開啟

Anaconda軟體

# 內部集成了很多資料分析相關軟體及功能 並且自動下載了接近300個數據分析相關模組
去官網下載安裝完成之後並不會在介面上生成圖示,第一次需要自己搜尋開啟
點選電腦左下方放大鏡搜尋anaconda navigator點選啟動即可

左側選單欄

Home

主要是一些已經準備好的軟體 有直接可以使用和下載即可使用

Environments

裡面主要包含資料分析相關的模組

Learning

裡面含有大量的技術教程

Community

裡面含有大量技術交流平臺

Jupyter Notebook詳細操作

"""
主介面點選jupyter notebook之後無法呼起瀏覽器開啟介面原因在於
原因:當前計算機名詞含有中文
"""

單詞
    cell      單元格
    cut       剪下
    copy      拷貝
    paste     貼上
    above     在...上面
    below     在...下面
    replace   替換
    delete    刪除
    undo      撤銷
    split     切割
    merge     合併

命令列模式與編輯模式

藍色對應的是命令列模式、綠色對應的是編輯模式

# 兩種模式的切換
        1.編輯模式切換到命令列模式 按esc鍵
        2.命令列模式切換到編輯模組 滑鼠左鍵點選即可

快捷鍵使用

1.運行當前單元格
    ctrl+enter
2.運行當前單元格並選中下方的單元格
    shift+enter
3.如何書寫md格式的標題
    方式1:命令列模式下按m鍵 之後按照警號個數書寫幾級標題執行即可
    方式2:編輯模式下先寫文字 之後進入命令列模式按數字來控制幾級標題
4.如何在當前單元格的下方新建一個單元格
    命令列模式下按b鍵
5.如何在當前單元格的上方新建一個單元格
    命令列模式下按a鍵
6.如何刪除單元格
    命令列模式下連續按兩下d鍵
7.如何撤銷刪除
    命令列模式下按z鍵