1. 程式人生 > 實用技巧 >分析哪個國家在總體幸福指數上排名最高,中國居然80名以外?

分析哪個國家在總體幸福指數上排名最高,中國居然80名以外?

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

以下文章來源於CDA資料分析師 ,作者CDA資料分析師

前言

《世界幸福指數報告》是對全球幸福狀況的一次具有里程碑意義的調查。

民意測驗機構蓋洛普從2012年起,每年都會在聯合國計劃下發布《世界幸福指數報告》,報告會綜合兩年內150多個國家的國民對其所處社會、城市和自然環境等因素進行評價後,再根據他們所感知的幸福程度對國家進行排名。

《世界幸福指數報告》的編撰主要依賴於對150多個國家的1000多人提出一個簡單的主觀性問題:“如果有一個從0分到10分的階梯,頂層的10分代表你可能得到的最佳生活,底層的0分代表你可能得到的最差生活。你覺得你現在在哪一層?”

那麼哪個國家在總體幸福指數上排名最高?

哪些因素對幸福指數的影響最大?

今天我們就帶你用Python來聊一聊。

資料理解

關鍵欄位含義解釋:

1. rank:幸福指數排名

2. region:國家

3. happiness:幸福指數得分

4. gdp_per_capita:GDP(人均國內生產總值)

5. healthy_life_expectancy:健康預期壽命

6. freedom_to_life_choise:自由權

7. generosity:慷慨程度

8. year:年份

9. corruption_perceptions:清廉指數

10. social_support:社會支援(客觀上物質上的援助和直接服務;主觀上指個體感到在社會中被尊重、被支援和被理解的情緒體驗和滿意程度。)

資料匯入和資料整理

首先匯入所需包。

#讀入資料
df_2015=pd.read_csv('./deal_data/2015.csv')
df_2016=pd.read_csv('./deal_data/2016.csv')
df_2017=pd.read_csv('./deal_data/2017.csv')
df_2018=pd.read_csv('./deal_data/2018.csv')
df_2019=pd.read_csv('./deal_data/2019.csv')

#新增列-年份
df_2015["year"]=str(2015)
df_2016["year"]=str(2016)
df_2017["year"]=str(2017)
df_2018["year"]=str(2018)
df_2019["year"]=str(2019)

#合併資料
df_all=df_2015.append([df_2016,df_2017,df_2018,df_2019],sort=False)
df_all.drop('Unnamed:0',axis=1,inplace=True)
df_all.head()
#讀入資料
df_2015=pd.read_csv('./deal_data/2015.csv')
df_2016=pd.read_csv('./deal_data/2016.csv')
df_2017=pd.read_csv('./deal_data/2017.csv')
df_2018=pd.read_csv('./deal_data/2018.csv')
df_2019=pd.read_csv('./deal_data/2019.csv')

#新增列-年份
df_2015["year"]=str(2015)
df_2016["year"]=str(2016)
df_2017["year"]=str(2017)
df_2018["year"]=str(2018)
df_2019["year"]=str(2019)

#合併資料
df_all=df_2015.append([df_2016,df_2017,df_2018,df_2019],sort=False)
df_all.drop('Unnamed:0',axis=1,inplace=True)
df_all.head()


print(df_2015.shape,df_2016.shape,df_2017.shape,df_2018.shape,df_2019.shape)
(158,10)(157,10)(155,10)(156,11)(156,11)

df_all.info()

<class'pandas.core.frame.DataFrame'>
Int64Index:782entries,0to155
Datacolumns(total10columns):
region782non-nullobject
rank782non-nullint64
happiness782non-nullfloat64
gdp_per_capita782non-nullfloat64
healthy_life_expectancy782non-nullfloat64
freedom_to_life_choise782non-nullfloat64
corruption_perceptions781non-nullfloat64
generosity782non-nullfloat64
year782non-nullobject
social_support312non-nullfloat64
dtypes:float64(7),int64(1),object(2)
memoryusage:67.2+KB

資料視覺化

2019世界幸福地圖

整體來看,北歐的國家幸福指數較高,如冰島、丹麥、挪威、芬蘭;東非和西非的國家幸福指數較低,如多哥、蒲隆地、盧安達和坦尚尼亞。

程式碼展示:

data=dict(type='choropleth',
locations=df_2019['region'],
locationmode='countrynames',
colorscale='RdYlGn',
z=df_2019['happiness'],
text=df_2019['region'],
colorbar={'title':'Happiness'})

layout=dict(title='GeographicalVisualizationofHappinessScorein2019',
geo=dict(showframe=True,projection={'type':'azimuthalequalarea'}))

choromap3=go.Figure(data=[data],layout=layout)
plot(choromap3,filename='./html/世界幸福地圖.html')

2019世界幸福國家排行Top10

2019年報告,芬蘭連續兩年被評為“全球最幸福國家”。丹麥、挪威、冰島、荷蘭進入前五名,對比2018年報告,中國從86名下降到93名。

程式碼展示:

#合併資料
rank_top10=df_2019.head(10)[['rank','region','happiness']]
last_top10=df_2019.tail(10)[['rank','region','happiness']]
rank_concat=pd.concat([rank_top10,last_top10])

#條形圖
fig=px.bar(rank_concat,
x="region",
y="happiness",
color="region",
title="World'shappiestandleasthappycountriesin2019")

plot(fig,filename='./html/2019世界幸福國家排行Top10和Last10.html')

幸福指數相關性

我們可以得出以下結論:

  • 從影響因素相關性熱力圖可以看出,在影響幸福得分的因素中,GDP、社會支援、健康預期壽命呈現高度相關,自由權呈現中度相關,國家的廉政水平呈現低度相關,慷慨程度則呈現極低的相關性;
  • GDP與健康預期壽命、社會支援之間存在高度相關。說明GDP高的國家,醫療水平和社會福利較為完善,人民的預期壽命也會越高;
  • 健康預期壽命與社會支援之間存在中度相關性。

以下分別觀察各個因素的影響程度。

GDP和幸福得分

人均GDP與幸福得分呈高度線性正相關關係,GDP越高的國家,幸福水平相對越高。

程式碼展示:

#散點圖
fig=px.scatter(df_all,x='gdp_per_capita',
y='happiness',
facet_row='year',
color='year',
trendline='ols'
)
fig.update_layout(height=800,title_text='GDPpercapitaandHappinessScore')
plot(fig,filename='./html/GDP和幸福得分.html')

健康預期壽命和幸福得分

健康預期壽命與幸福得分呈高度線性正相關關係,健康預期壽命越高的國家,幸福水平相對越高。

程式碼展示:

散點圖
fig=px.scatter(df_all,x='healthy_life_expectancy',
y='happiness',
facet_row='year',
color='year',
trendline='ols'
)
fig.update_layout(height=800,title_text='HealthyLifeExpecancyandHappinessScore')
plot(fig,filename='./html/健康預期壽命和幸福得分.html')