1. 程式人生 > 其它 >pandas速成筆記(1)-環境搭建及excel讀取

pandas速成筆記(1)-環境搭建及excel讀取

工作中經常會遇到一些excel的資料分析工作,雖然本身excel本身有非常強大的功能,但如果需要將一些資料分析結果整合在自己的專案中,excel就顯示有些不方便了(總不能每次在excel裡做好圖表,再截圖貼進來吧),幸好python的生態圈足夠強大,有pandas這種利器,能以程式設計的方式,方便快捷的分析excel/csv電子表格。

 

一、環境搭建

1.1 anaconda

最簡單的辦法就是安裝Anaconda ,它已經集成了很多資料分析的工具包(包括pandas),download後一路next安裝即可。

安裝完後,mac終端上輸入conda --help,可以檢視幫助資訊。(windows環境也是類似的)

 

1.2 檢視python虛擬環境

python與其它語言不同的地方,它可以在機器上建立不同的所謂『環境』,不同的環境之間相互隔離(即:本環境下安裝的軟體及版本,跟另1個環境沒任何關係),比如:環境A用於執行python 2.x,環境B用於執行python 3.x。

安裝好anaconda後,預設會建立1個名為base的環境,也可以用以下命令檢視當前所有環境:

conda info --env

如上圖,我本機有2個環境:base, pytorch

環境之間也可以切換,比如我想切換到pytorch環境,可以用

conda activate pytorch

如果在mac上,切換完成後,提示符會有所變化:

另外還有一些關於環境的常用命令:

conda info --env 列出所有環境
conda remove -n myenv -all 刪除指定環境myenv
conda create -n myenv1 python=3.6 建立環境myenv1,且指定該環境使用python 3.6版本

另外,如果是mac,還有一個很有用的命令where python,檢視python程式所在目錄(後面配置pycharm執行環境時會用到)

 

1.3 安裝pycharm

雖然conda安裝後,自帶了jupyter notebook,也能做一些簡單的互動式程式設計。比如,在命令列輸入:

jupyter notebook

會在本機啟用1個webserver,同時終端視窗也會有一些日誌:

在瀏覽器裡開啟http://127.0.0.1:8888/ 後就能寫程式碼了:

但真正實際工作中,開發人員更多會使用pycharm,程式設計體驗會更好,而且社群版也不要錢,何樂不為呢?但很多新手可能會發現,pycharm安裝好以後不識別conda環境

pycharm中建立python專案時,如果象上圖一樣,interpreter裡是空的,點選最右側的...按鈕,

在Add Python Interpreter介面,繼續點最右側的...按鈕,這時候會讓你選擇python所在的目錄,還記得前面講到的where python命令嗎?用它找到anaconda安裝後,python所在的目錄(這個很重要!不要選擇mac系統自帶的python目錄/usr/bin/python,那個沒有pandas等工具庫)

如果你經常要使用pandas處理資料,建議把Make available to all projects勾上

 

二、excel讀寫測試

pycharm裡隨便建立1個python專案,驗證下pandas開發環境是否正常。

然後建立一個python檔案,比如:001.py,輸入以下程式碼(先不用管什麼意思)

import pandas as pd

df = pd.DataFrame({"id": [1, 2, 3, 4, 5, 6], "name": ["A", "B", "C", "D", "E", 'F']}).set_index('id')
df.to_excel("data/001.xlsx")

df2 = pd.read_excel("data/001.xlsx").set_index("id")
print(df2)

如果能類似輸出類似上圖的結果 ,就說明環境ok。再來回過頭看看這幾行程式碼的意思:

行1:匯入pandas類庫,同時取個別名叫pd

行3-4:建立幾行資料,然後寫入到excel檔案

行6-7:把剛才寫入的excel,重新讀出來,並列印