python面向物件程式設計

阿新 • • 發佈：2020-07-19

這篇文章用pandas對全球的人口資料做個簡單分析。我收集全球各國1960-2019年人口資料，包含男女和不同年齡段，共6個檔案。

pop_total.csv： 各國每年總人口
pop_female.csv：各國每年女性人口
pop_male.csv： 各國每年男性人口
pop_0_14.csv： 各國每年0-14歲人口
pop_15_64.csv： 各國每年15-64歲人口
pop_65up.csv：各國每年65歲以上人口

先用pandas讀取檔案資料

import pandas as pd

pop_total = pd.read_csv('./data/pop_total.csv', skiprows=4 
)
pop_total.info()

pop_total.csv檔案存放各國每年總人口資料，格式如下

pop_total.head(2)

同樣的方式，我們讀取剩下的5個檔案，對應的DataFrame分別是pop_female、pop_male、pop_0_14、pop_15_64、pop_65up。

為了直觀觀察全球人口分佈，我們用pyecharts繪製2019年全球人口分佈地圖

from pyecharts import options as opts
from pyecharts.charts import Timeline, Map

pop_total_2019 = pop_total[['Country Name' 
, '2019']]
# 修改俄羅斯的英文名以便pyecharts能識別
pop_total_2019.loc[200, 'Country Name'] = 'Russia' 

pop_world_map = (
    Map()
    .add("2019年", pop_total_2019.values, "world", is_map_symbol_show=False)
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
    .set_global_opts(
        title_opts=opts.TitleOpts(title="全球人口" 
),
        visualmap_opts=opts.VisualMapOpts(max_=100000000),  # 超過1億人口顏色最深（紅色）
    )
)

pop_world_map.render_notebook()

因為我們有50年的資料，所以我們還可以繪製一個全球人口分佈變化的動圖，類似之前寫的全球疫情變化趨勢圖。因為程式碼跟上面類似，這裡就不貼，原始碼包裡能找到。

上面的圖裡我們只能定性的看到人口分佈，下面我們定量地看看2019年全球人口top10的國家。

# 2019年人口top10的國家
pop_total_2019_ordered = pop_total_2019.sort_values(by="2019" , ascending=False)
pop_total_2019_ordered.head()

排序後發現Country Name這列不只是單個國家，還包括了地區概念，這並不是我們想要的。記得之前做疫情地圖的時候有一份國家中英文對應關係的名單，拿到這裡用一下。

from countries_ch_to_en import countries_dict

pop_top10 = pop_total_2019_ordered[pop_total_2019_ordered['Country Name']\
                                   .isin(countries_dict.keys())][:10]
pop_top10

這樣看起來就正常了，用seaborn將其繪製出來

import seaborn as sns
sns.barplot(y=pop_top10['Country Name'], x=pop_top10['2019'])

可以看到，中國人口仍然位居全球第一，緊隨其後的是印度，三哥也是拼了。令我驚訝的是巴基斯坦那麼小的國土，人口超2億，全球排第五，真是方方面面都要跟三哥死磕。

看完人口絕對值的排行，我們再來看看從2000年值2019年近20年時間各國人口增長率

pop_tmp = pop_total[pop_total['Country Name']\
                    .isin(pop_top10['Country Name'])][['Country Name', '2000', '2019']]
pop_tmp['growth(%)'] = (pop_tmp['2019'] / pop_tmp['2000'] - 1) * 100
pop_tmp.sort_values(by="growth(%)" , ascending=False)

可以看到，中國雖然人口基數比較大，但近20年人口增長率確比較低，增加最快的top3分別是奈及利亞、巴基斯坦和印度。

看完總人口資料後，我們再看看性別分佈，還是以2019年為例

columns = ['Country Name', '2019']
# 抽資料，關聯
pop_sex_2019 = pop_total[columns].merge(pop_male[columns], on = 'Country Name')

# 列名重新命名
pop_sex_2019.rename(columns={'2019_x': 'total', '2019_y': 'male'}, inplace=True)

# 篩選出國家
pop_sex_2019 = pop_sex_2019[pop_sex_2019['Country Name'].isin(countries_dict.keys())]

# 計算女性人口
pop_sex_2019['female'] = pop_sex_2019['total'] - pop_sex_2019['male']
# 女性佔比與男性佔比的差值
pop_sex_2019['diff'] = (pop_sex_2019['female'] - pop_sex_2019['male']) / pop_sex_2019['total'] * 100

# 男性人口占比高於女性的 top15
sex_diff_top15 = pop_sex_2019.sort_values(by='diff')[0:15]

sns.barplot(y=sex_diff_top15['Country Name'], x=sex_diff_top15['diff'])

第一名是卡達，男性人口比女性高50%，咱們中國男女比例也是失衡的，男性人口占比比女性高2%。

再來看看女性佔比比男性高的國家

sex_diff_top15 = pop_sex_2019.sort_values(by='diff', ascending=False)[0:15]
sns.barplot(y=sex_diff_top15['Country Name'], x=sex_diff_top15['diff'])

這個相差的幅度明顯沒那麼大，top1也就差了8%，並且這些國家都不是人口大國。那我們來看看人口超過1億的國家有哪些是女性佔比超過男性

pop_sex_2019[pop_sex_2019['total'] > 100000000].sort_values(by='diff', ascending=False)[0:5]

可以看到日本、墨西哥、巴西和美國這四個人口大國女性佔比超過了男性。

性別也瞭解的差不多了，我們再來看看年齡分佈。因為我比較關注各國年輕人群的佔比，所以我們先對各國0-14歲人口占比進行排序。

pop_0_14_2019 = pop_total[columns].merge(pop_0_14[columns], on = 'Country Name')
pop_0_14_2019.rename(columns={'2019_x': 'total', '2019_y': '0_14'}, inplace=True)
pop_0_14_2019['0_14_r(%)'] = pop_0_14_2019['0_14'] / pop_0_14_2019['total'] * 100

# 我們仍然只看大於1億人的國家
pop_0_14_top = pop_0_14_2019[pop_0_14_2019['Country Name'].isin(countries_dict.keys())][pop_0_14_2019['total'] > 100000000]\
    .sort_values(by='0_14_r(%)', ascending=False)[:15]

sns.barplot(y=pop_0_14_top['Country Name'], x=pop_0_14_top['0_14_r(%)'])

可以看到菲律賓、孟加拉國、印尼和印度等東南亞國家0-14歲人口占比遠超中國，甚至美國也比我們要高。我們只有17%，這也是近幾年世界工廠在往東南亞遷移的原因。

最後，我們再看看中國從1960年至2019年中國各年齡段人口占比的變化趨勢

# 篩選我們需要的列
pop_0_14_ch = pop_0_14[pop_0_14['Country Name'] == 'China'].drop(['Country Name', 'Country Code', 'Indicator Name', 'Indicator Code',\
                                                                  'Unnamed: 64'], axis=1)

#列（年份）轉行
pop_0_14_ch_unstack = pop_0_14_ch.unstack()

# 重新構造DateFrame
pop_0_14_ch = pd.DataFrame(pop_0_14_ch_unstack.values, \
                           index=[x[0] for x in pop_0_14_ch_unstack.index.values], columns=['0_14'])
                           
pop_0_14_ch.head()

同樣的方式，處理一下其他兩個年齡段

# 15-64歲
pop_15_64_ch = pop_15_64[pop_15_64['Country Name'] == 'China'].drop(['Country Name', 'Country Code', 'Indicator Name', 'Indicator Code',\
                                                                  'Unnamed: 64'], axis=1)
pop_15_64_ch_unstack = pop_15_64_ch.unstack()

pop_15_64_ch = pd.DataFrame(pop_15_64_ch_unstack.values,\
                            index=[x[0] for x in pop_15_64_ch_unstack.index.values], columns=['15_64'])
                            

# 65歲以上
pop_65up_ch = pop_65up[pop_65up['Country Name'] == 'China'].drop(['Country Name', 'Country Code', 'Indicator Name', 'Indicator Code',\
                                                                  'Unnamed: 64'], axis=1)
pop_65up_ch_unstack = pop_65up_ch.unstack()

pop_65up_ch = pd.DataFrame(pop_65up_ch_unstack.values, \
                           index=[x[0] for x in pop_65up_ch_unstack.index.values], columns=['65up'])

將各年齡人口按照年份關聯起來，然後計算總人口以及各年齡段人口占比

pop_age_level =  pop_0_14_ch.merge(pop_15_64_ch.merge(pop_65up_ch, left_index=True, right_index=True), left_index=True, right_index=True)
pop_age_level['total'] = pop_age_level['0_14'] + pop_age_level['15_64'] + pop_age_level['65up']
pop_age_level['0_14(%)'] = pop_age_level['0_14'] / pop_age_level['total'] * 100
pop_age_level['15_64(%)'] = pop_age_level['15_64'] / pop_age_level['total'] * 100
pop_age_level['65up(%)'] = pop_age_level['65up'] / pop_age_level['total'] * 100

pop_age_level.head()

最後我們來畫一個堆疊柱狀圖展示

pop_age_level['year'] = pop_age_level.index

pop_age_level.plot.bar(x='year', y=['0_14(%)', '15_64(%)', '65up(%)'], stacked=True, figsize=(15,8),  fontsize=10, rot=60)

可以放大後看看，藍色的是0-14歲人口，六七十年代，中國0-14歲人口占比40%多，算是挺高的了，隨著80年代實行計劃生育，0-14歲人口開始下降，一直降到現在的17%，少的有點可憐了。現在國家放開二胎，也是希望未來我們能有更多的年輕人，這樣才能增強我們的國際競爭力。

我的分析就到這裡了，有興趣的朋友可以自行探索，資料和原始碼已經打包，公眾號回覆關鍵字人口即可。

歡迎公眾號 「渡碼」，輸出別地兒看不到的乾貨。

Python面向物件程式設計基礎例項分析

本文例項講述了Python面向物件程式設計基礎。分享給大家供大家參考，具體如下：

Python面向物件程式設計之私有變數，私有方法原理與用法分析

本文例項講述了Python面向物件程式設計之私有變數，私有方法原理與用法。分享給大家供大家參考，具體如下：

Python面向物件程式設計之靜態方法、類方法、屬性方法原理與用法分析

本文例項講述了Python面向物件程式設計之靜態方法、類方法、屬性方法原理與用法。分享給大家供大家參考，具體如下：

Python面向物件程式設計之類和物件、例項變數、類變數用法分析

本文例項講述了Python面向物件程式設計之類和物件、例項變數、類變數用法。分享給大家供大家參考，具體如下：

Python面向物件程式設計之繼承、多型原理與用法詳解

本文例項講述了Python面向物件程式設計之繼承、多型原理與用法。分享給大家供大家參考，具體如下：

如何理解python面向物件程式設計

類是面向物件程式設計的一部分。面向物件程式設計或者簡稱為 OOP 致力於建立可重用程式碼塊稱之為類。當你想在你的程式中使用類時，你會從類中建立一個物件，這也是面向物件一詞的由來。Python 並不總是面向物件的，

淺析Python面向物件程式設計

概述很多人接觸Python，都是從爬蟲開始，其實很多語言都可以做爬蟲，只是Python相對其他語言來說，更加簡單而已。但是Python並不止於爬蟲，在人工智慧，科學計算等方面的應用更加廣泛。古人云：萬丈高樓平地起，要想

python 面向物件程式設計的slots

同一個類下，不同例項定義的屬性或者方法，其他例項如果沒有定義是不能使用的

python面向物件程式設計

python面向物件程式設計本篇內容: 　　1、反射　　2、面向物件程式設計　　3、面向物件三大特性

python面向物件程式設計: 面向物件版學員管理系統

轉載自https://www.cnblogs.com/LynHome/archive/2020/04/06/12650318.html 詳細解讀請參考https://www.cnblogs.com/blknemo/p/13697185.html

python面向物件程式設計class1

python面向物件程式設計class1 #!/usr/bin/pythonclass clz: ###name=\"nam330\" def __init__(self):self.id=111self.name=\"nam222\"print(\"Hello,1 World!\",id,self.id) def setName(self,name):self.name=name