1. 程式人生 > >2020 北京積分落戶結果公示,落戶指標最多的公司竟然又是 ?

2020 北京積分落戶結果公示,落戶指標最多的公司竟然又是 ?

 

關於作者:程式猿石頭(ID: tangleithu),現任阿里巴巴技術專家,清華學渣,前大疆後端 Leader。歡迎關注,交流和指導!

本文首發於微信公眾號,原文連結,轉載請全文保留。

背景

就在昨天,一年一度的北京積分落戶結果出來了,我們照舊來看看今年(2020年)的資料情況。

在看這篇文章之前,你可以通過如下文章來得到石頭是如何快速拿到這些資料分析結果的:

  • 優秀的程式設計師是如何利用工具來提升工作效率的?
  • Shell 助力開發效率提升
  • 提升開發效率N倍的20+命令列神器!(附 demo)

資料可以通過北京市人力資源和社會保障局官方網站下載獲取,關於2020年積分落戶公示及落戶辦理有關工作的通告。公示名單 形如:

![2020 年積分落戶公式名單](https://www.tanglei.name/resources/use-shell-to-analysis-2020-people-of-getting-residence-of-beijing-by-score/2020 年積分落戶公式名單.png)

點選每一項明細可以獲得積分具體數值,以最高分為例:

2020積分落戶最高分明細

然後,稍微動點小技巧即可獲取完整的 6032 條記錄。若你想獲取石頭初步處理後的 excel 資料,可直接後臺回覆 “2020積分落戶” 取得。

資料分析

輸入就是下載處理後的 csv,每行分別為“姓名、出生年月、單位名稱、積分分值”。

本文將從 積分分數分佈、公司分佈、年齡分佈 等幾個方面做簡單分析。

2020年積分落戶資料CSV

分數分佈

我們來看看積分分佈情況,大部分人積分分佈在 97~102 分之間。這個分數雖然沒有高考相差那麼誇張,但一個 0.01 也能相差不少人,比如有 98 人都得了 97.5 分。98.17 有 39 人,少 0.01 的 98.16 有 21 人。

➜  積分落戶2020資料分析 git:(master) ✗ awk '{print $5}' 10000.csv |sort | uniq -c | sort -nr -k 1  | head -n 10
  98 97.50
  84 97.25
  80 97.33
  73 97.17
  72 97.21
  67 98.50
  66 98.00
  61 97.46
  57 98.46
  54 97.13
➜  積分落戶2020資料分析 git:(master) ✗ awk '{print $5}' 10000.csv |sort | uniq -c | sort -nr -k 1  | grep 98.17
  39 98.17
➜  積分落戶2020資料分析 git:(master) ✗ awk '{print $5}' 10000.csv |sort | uniq -c | sort -nr -k 1  | grep 98.16
  21 98.16
➜  積分落戶2020資料分析 git:(master) ✗ 

2020年北京積分落戶積分分佈

按照上次首批積分落戶資料分析 的老規矩,拿到這個檔案,比如希望你用最快的方法獲得以下資訊,你將會怎麼做?

  • 獲取取得戶口名額最多的top10公司
  • 獲取取得戶口名額的人中姓氏最多的
  • 獲取年齡分佈

當然,方法有很多,比如熟悉各種程式語言的,例如 python, php, java 等等寫個簡單的指令碼程式,也能比較快獲取答案。或者把相應的資料提取出來,放到 excel 中也可以。

如果你對 Shell 很熟悉,那真的是分分鐘,應該是秒秒鐘就能獲取答案。本文不對 Shell 具體每個命令做過多的解釋,不熟悉的同學可以直接 man $cmd 或者 $cmd --help 等等檢視。

之前我也寫過一篇名叫 Shell 助力開發效率提升 的文章,算是給常用的命令的常用引數做了一個解釋和示例,有興趣的同學可以前往查閱。 顯然這次的輸入資料比上次 首批的 json 資料 更簡單。

獲取取得戶口名額最多的top10公司

直接awk 得到公司名字,對結果進行sort排序進行去重uniq統計得到重複次數,次時結果為重複次數 公司名,再對第一列-k 1重複數字進行按照數字排序逆序-nrsort -nr -k 1,最後取結果的前10行 head -n 10

➜  首批積分落戶  > grep 'unit' jifenluohu.json| cut -f2 -d: | sort | uniq -c | sort -nr -k 1 | head -n 10
 137  "北京華為數字技術有限公司"
  73  "中央電視臺"
  57  "北京首鋼建設集團有限公司"
  55  "百度線上網路技術(北京)有限公司"
  48  "聯想(北京)有限公司"
  40  "北京外企人力資源服務有限公司"
  40  "中國民生銀行股份有限公司"
  39  "國際商業機器(中國)投資有限公司"
  29  "中國國際技術智力合作有限公司"
  27  "華為技術有限公司北京研究所"
  
  ➜  積分落戶2020資料分析 git:(master) ✗ awk '{print $4}' 10000.csv |sort | uniq -c | sort -nr -k 1 | head -n 10
 112 北京華為數字技術有限公司
  71 中央電視臺
  28 北京外企人力資源服務有限公司
  28 華為技術有限公司北京研究所
  27 中國石油天然氣股份有限公司管道北京輸油氣分公司
  27 北京首鋼建設集團有限公司
  24 中國建築第二工程局有限公司
  24 騰訊科技(北京)有限公司
  24 聯想(北京)有限公司
  23 中國新華航空集團有限公司

對比上次的結果看, “華為” 又是榜首,中央電視臺又位列第二,百度下去了,騰訊起來了。(“北京外企人力資源服務有限公司”)掛靠在 FESCO 下的外企,仍然擠進前 10 了。

以下是有戶口指標前 50 的公司分佈,快看看你的公司是否在榜(完整公司排名名單請後臺回覆“2020積分落戶”獲取)。

2020年北京積分落戶公司分佈

獲取取得戶口名額的人中姓氏最多的

看看想通過積分落戶,最好是姓啥,哈哈。

看結果還是姓 "張, 王" 之類的最有戲。