Python預測2020高考分數和錄取情況可能是這樣
前言
本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。
作者:打磨蝦
“遲到”了一個月的高考終於要來了。
正好我得到了一份山東新高考模擬考的成績和山東考試院公佈的一分一段表,以及過去三年的普通高考本科普通批首次志願錄取情況統計。2020年是山東新高考改革的元年,全新的錄取模式以及選考科目要求都給考生帶來了非常大的挑戰。
我正好就本次山東模擬考的成績進行深入資料分析,用python視覺化帶大家模擬一下2020高考分數和錄取情況。
(程式碼較長,故只展示部分,完整資料+原始碼下載見文末)
不同考生的成績分佈圖
首先對山東新高考模擬考的成績進行總體描述:
fig = make_subplots(rows=4,cols=2, #4行2列 subplot_titles=('所有考生',"物理", "歷史", "化學", "地理", "生物", "政治"), specs=[[{'colspan': 2},None],[{},{}],[{},{}],[{},{}], ]) #specs引數定義瞭如何分配檢視區間, 本案例中的“specs=[[{}, {}],[{'colspan': 2},None]]”表示其他行的兩個子圖平均分配區間, 第一行的第一個子圖佔據 2列的區間, 並且不存在第二個子圖 fig.add_trace(go.Scatter( x = raw_data['分數段'], y = raw_data['所有考生本段人數'], fill = 'tozeroy', mode = 'lines', marker = dict( size = 8, color = 'rgb(88, 182, 192)' )), row=1, col=1, ) #儲存圖片 img_file = os.path.join(img_dir, 'img1.svg') fig.write_image(img_file, scale=1) fig.show()
選考物理、化學、生物的學生的成績呈正態分佈,大多數學生的成績集中於中間,成績兩端學生的人數分佈較少。而選考文科類(歷史、地理、政治)學科的學生的成績成偏態分佈,一段線以下的人數佔比較大,尤其歷史和地理學科上這種趨勢更加明顯。
本科上線率
通過計算各科所有選擇的人中有多少人的總分在一段線以上,發現,選考物理的學生的上線率最高,達到了67%,而選考歷史的學生的上線率較低,只有37%。
選考科目情況
#所有考生的科目選擇情況 sum_people = raw_data['所有考生累計人數'].iloc[-1] subj_select = [] subj_name = ['物理','化學','生物','歷史','地理','政治'] subj_select_percent = pd.DataFrame(index = subj_name,columns=['比例']) for i in subj_name: singel_subj = raw_data['選考'+i+'累計人數'].iloc[-1] singel_percent = round(singel_subj/sum_people,4)*100 subj_select.append(singel_percent) subj_select_percent.loc[i, '比例'] = singel_percent
在此次模擬考中,分數在150分以上的考生共有489567人,其中選考地理的人數最多,選考比率為63.6%,選考政治的人數最少,選考比率只有34.31%,而備受大家關注的選考物理的比率為41.59%。
需要注意的是,山東2020年高考的正式選科時間是5.25-29,而模擬考的時間在1月,因此上述資料只能作為學生選科的重要參考。
學霸們的選科組合
根據此次公佈的一分一段表以及高考志願輔導專家的分析,大體推測了全省前100名考生的選科情況。
果然,學霸們還是較忠於傳統的理科組合(物化生),有89%的人選擇了該組合,而傳統的文科組合(史地政)沒有人選擇。或許因為,理科受題目的難度影響較大,當題目較簡單時,考生更容易考出高分,而文科更多開放題,考取的高分的概率更小。這也間接導致了,考生傾向選擇純理科或者至少1門理科。
雙一流高校錄取情況分析
我們統計了近三年雙一流高校在山東的理工類專業錄取最低分,位次靠前的依次是北京大學,復旦大學,上海交通大學,浙江大學,中國科學技術大學。
我們統計了近三年雙一流高校在山東的文史類專業錄取最低分,位次靠前的依次是清華大學,北京大學,上海交通大學,復旦大學,中國人民大學。
雙一流高校專業錄取情況分析
#南丁格爾圖 pie_Nightingale(sci_top10['專業'].values.tolist(), sci_top10['頻數'].values.tolist(), '錄取最低分排名\n前10的理工類專業', '理科專業top10.html')
我們統計了雙一流高校錄取最低分所對應的專業頻次,結果發現,理工類專業中工科實驗班的出現頻次最高,雙一流高校中有25個學校的錄取最低分所對應的專業是工科實驗班。
我們同樣統計了雙一流高錄取最低分所對應的文史類專業的頻次,結果發現,文史類專業中日語出現的頻次最高,雙一流高校中有25個學校的錄取最低分對應的專業是日語。
高考加油
2020年的寒冬,讓所有人的步伐變得蹣跚
1月,教育部下發學生延期開學通知;
2月,關於停課的訊息層出不窮;
3月中旬,全國陸續開始實行網路授課;
3月底,正式確認2020年高考將延期一個月舉行;
……
在一則又一則“刷新歷史”的新聞中,高考生無疑成為了一個備受關注的群體——除了需要面臨的學習壓力,還要時刻保持著安全距離進行學習和生活……對他們來說,無論疫情還是高考,都成為了一場重大的考驗。[1]
祝願2020高考學子都能考出自己的最佳成