1. 程式人生 > >武漢二手房價分析(原創分析,資料現勢性2018年6月)

武漢二手房價分析(原創分析,資料現勢性2018年6月)

摘要:自編爬蟲從某二手房交易網爬取武漢市全市13個區範圍內6月份所有掛牌二手房交易資訊,包括房屋所在小區名稱、房間數、單價、總價、所屬區域等,儲存在表格中;根據小區名稱和所屬區域從高德網路地圖API獲取小區經緯度;通過RGui進行資料排序顯示;通過ArcGIS軟體疊加房源點和行政區劃圖,製作房間熱力圖。分析房價高地分佈情況,對二手房購房者提供參考借鑑意義。二手房交易網上的資訊純屬市場行為,存在一定的不真實,總體算是可靠的,與在小區中介詢問的調查價格基本一致。

1、爬取某房價網二手房交易價格,儲存在csv檔案

<<武漢市房價分佈.csv>>


2、在RGui中匯入資料:

 mydata<-read.table(header=T,file="F:\\武漢市房價分佈.csv",sep=

",") 

3、提取子資料集

wc<-subset(mydata,"區"="武昌") 

4、繪製單個區的箱形圖

boxplot(單價~區,mydata)

設定縱軸座標單位,設定箱體顏色為lightblue,

 boxplot(單價~區,mydata,col="lightblue")

以千元為單位,

 boxplot(單價/1000~區,mydata,col="lightblue")

新增縱座標標籤,

 boxplot(單價/1000~區,mydata,ylab="二手房單價(單位:千元)",col="lightblue")

4、清洗掉極值,如單價超過6萬元的資料

5、對資料進行排序

對分組箱圖按中位數進行逆序排列後顯示:

> aggregate(.~區,data=mydata,mean)

         區 小區全稱     單價 省 市      地址   郵編     經度     緯度

1    蔡甸區 1665.875 10350.895  1  1 102.3711 420114 114.0867 30.53099

2  東西湖區 1580.328 14260.978  1  1 320.5690 420112 114.1852 30.64115

3    漢南區 1511.643  7002.554  1 1  450.6786 420113 114.081130.32355

4    漢陽區 1743.552 16095.344  1  1 571.2365 420105 114.2273 30.54636

5    洪山區 1439.315 16145.331  1  1 905.0126 420111 114.3861 30.52368

6    黃陂區 1576.626 10191.703  1  1 1226.0659 420116 114.3232 30.76294

7    江岸區 1725.614 20703.460  1  1 1484.5160 420102 114.2965 30.61917

8    江漢區 1653.395 19961.476  1  1 1814.8360 420103 114.2661 30.60400

9    江夏區 1639.555 13091.987  1  1 2074.5378 420115 114.3701 30.40724

10   礄口區 1693.725 18655.192  1  1 2303.4353 420104 114.2363 30.58428

11   青山區 1530.238 16611.338  1  1 2486.2615 420107 114.3999 30.62462

12   武昌區 1718.217 21570.117  1  1 2704.9765 420106 114.3265 30.55031

13   新洲區 1799.209  6063.743  1  12927.2230 420117 114.6385 30.71597

 d[order(d$單價,decreasing=TRUE),]

         區 小區全稱     單價 省 市      地址   郵編     經度     緯度

12   武昌區 1718.217 21570.117  1  1 2704.9765 420106 114.3265 30.55031

7    江岸區 1725.614 20703.460  1  1 1484.5160 420102 114.2965 30.61917

8    江漢區 1653.395 19961.476  1  1 1814.8360 420103 114.2661 30.60400

10   礄口區 1693.725 18655.192  1  1 2303.4353 420104 114.2363 30.58428

11   青山區 1530.238 16611.338  1  1 2486.2615 420107 114.3999 30.62462

5    洪山區 1439.315 16145.331  1  1 905.0126 420111 114.3861 30.52368

4    漢陽區 1743.552 16095.344  1  1 571.2365 420105 114.2273 30.54636

2  東西湖區 1580.328 14260.978  1  1 320.5690 420112 114.1852 30.64115

9    江夏區 1639.555 13091.987  1  1 2074.5378 420115 114.3701 30.40724

1    蔡甸區 1665.875 10350.895  1  1 102.3711 420114 114.0867 30.53099

6    黃陂區 1576.626 10191.703  1  1 1226.0659 420116 114.3232 30.76294

3    漢南區 1511.643  7002.554  1 1  450.6786 420113 114.081130.32355

13   新洲區 1799.209  6063.743  1  12927.2230 420117 114.6385 30.71597

按中數排序

> aggregate(.~區,data=mydata,median)

         區 小區全稱   單價 省 市   地址   郵編     經度     緯度

1    蔡甸區   1609.5  9307.5 1  1   94.5 420114 114.0629 30.53492

2  東西湖區   1508.0 13964.0  1 1  318.5 420112 114.1941 30.64014

3    漢南區   1501.5  6595.5 1  1  452.5 420113 114.0813 30.31732

4    漢陽區   1798.0 16296.0  1 1  567.0 420105 114.2212 30.54925

5    洪山區   1335.5 17159.0  1 1  897.5 420111 114.3789 30.50579

6    黃陂區   1660.5 10561.0  1  11224.0 420116 114.3191 30.71850

7    江岸區   1771.5 19619.0  1  11482.5 420102 114.2943 30.61687

8    江漢區   1587.0 19330.0  1  11814.0 420103 114.2664 30.60592

9    江夏區   1662.0 12764.5  1  12073.5 420115 114.3727 30.40792

10   礄口區   1614.0 18238.0  1  12306.0 420104 114.2433 30.57883

11   青山區   1632.0 17366.0  1  12488.5 420107 114.3951 30.62510

12   武昌區   1857.0 21344.0  1  12710.0 420106 114.3260 30.54703

13   新洲區   2044.5  5944.5 1  1 2927.5 420117 114.576230.67016

> d[order(d$單價,decreasing=TRUE),]

         區 小區全稱     單價 省 市      地址   郵編     經度     緯度

12   武昌區 1718.217 21570.117  1  1 2704.9765 420106 114.3265 30.55031

7    江岸區 1725.614 20703.460  1  1 1484.5160 420102 114.2965 30.61917

8    江漢區 1653.395 19961.476  1  1 1814.8360 420103 114.2661 30.60400

10   礄口區 1693.725 18655.192  1  1 2303.4353 420104 114.2363 30.58428

11   青山區 1530.238 16611.338  1  1 2486.2615 420107 114.3999 30.62462

5    洪山區 1439.315 16145.331  1  1 905.0126 420111 114.3861 30.52368

4    漢陽區 1743.552 16095.344  1  1 571.2365 420105 114.2273 30.54636

2  東西湖區 1580.328 14260.978  1  1 320.5690 420112 114.1852 30.64115

9    江夏區 1639.555 13091.987  1  1 2074.5378 420115 114.3701 30.40724

1    蔡甸區 1665.875 10350.895  1  1 102.3711 420114 114.0867 30.53099

6    黃陂區 1576.626 10191.703  1  1 1226.0659 420116 114.3232 30.76294

3    漢南區 1511.643  7002.554  1 1  450.6786 420113 114.081130.32355

13   新洲區 1799.209  6063.743  1  12927.2230 420117 114.6385 30.71597

mydata<- mydata[order(mydata$房價中位數,decreasing=TRUE),] 

 boxplot(單價/1000~序號,mydata,ylab="二手房單價(單位:千元)",col="lightblue")

id

區位

房價中位數

序號

01

武昌區

21570.117

01武昌區

02

江岸區

20703.46

02江岸區

03

江漢區

19961.476

03江漢區

04

礄口區

18655.192

04礄口區

05

青山區

16611.338

05青山區

06

洪山區

16145.331

06洪山區

07

漢陽區

16095.344

07漢陽區

08

東西湖區

14260.978

08東西湖區

09

江夏區

13091.987

09江夏區

10

蔡甸區

10350.895

10蔡甸區

11

黃陂區

10191.703

11黃陂區

12

漢南區

7002.554

12漢南區

13

新洲區

6063.743

13新洲區

 

在arcgis中做屬性連線,給資料加上中位數排序倒序排序後製圖如下:

 boxplot(單價/1000~序號,mydata,ylab="二手房單價(單位:千元)",col="lightblue",main="武漢二手房交易價格按中位數分割槽排序統計圖")

     

6、房價趨勢分析

      武漢市房價按區分析,較為集中的幾個區中心城區有江岸區、江漢區、礄口區、青山區、漢陽區;遠城區有東西湖區、蔡甸區、黃陂、漢南、新洲;

     波動較大的有武昌、洪山、江夏,一定程度上存在房產市場過熱,洪山區上市交易的樓盤為557,全市各區排名第一為,超過第二名30%,洪山區受東湖高新開發區、國家自貿區等開發板塊政策刺激,增速迅猛,為未來樓盤看漲區域。

   江漢、江岸存在部分變異值,包括極高和極低值,與老城區上市交易的棚戶區和部分優質房源高價基本相符,同樣作為老城區的礄口,僅存在極大值,和個別極小值,這與其基本完成棚戶區改造相關。存在極大值的還有洪山區、漢陽、江夏、蔡甸、黃陂等,均為部分別墅,不在考察範圍之列。

      從房價集中程度來看武昌區、洪山區、江夏區存在較大的離散狀態,這與三個板塊活躍程度有關,武昌是教育中心,高校雲集,洪山區是高新技術企業所在地,江夏與之毗鄰,高技能人才對優質房源的剛需崔生了高房價,同時還遷房和房齡超過20年的老房需求疲軟,導致了房價離散程度較高,從中線位置來看,武昌明顯處於左偏狀態,洪山區為右偏,江夏則居中,這說明武昌房價均值低估趨勢,洪山則虛高,投資者可考慮選擇武昌好地段房源,或選擇江夏,洪山區需謹慎,如光谷金融港片區,2016-2018年連續兩年增幅超過30%,投機過熱,此時接盤短期來看比較危險,相較之選擇江夏比較划算和保險。

7、武漢市房屋交易熱度圖


  (以上資料均來源於網路,若有侵權請及時通知博主處理。)

相關推薦

武漢二手房價分析原創分析資料現勢20186

摘要:自編爬蟲從某二手房交易網爬取武漢市全市13個區範圍內6月份所有掛牌二手房交易資訊,包括房屋所在小區名稱、房間數、單價、總價、所屬區域等,儲存在表格中;根據小區名稱和所屬區域從高德網路地圖API獲取小區經緯度;通過RGui進行資料排序顯示;通過ArcGIS軟體疊加房源點和

201863號線段樹3

錯誤 格式 是個 每一個 並且 限制 自己 輸出結果 IT   今天想分享一下一道題的心得:   P1198 [JSOI2008]最大數   題目描述 現在請求你維護一個數列,要求提供以下兩種操作: 1、 查詢操作。 語法:Q L

201864號線段樹4

描述 content IV region 編號 枚舉 sticky har bsp   今天想和大家一起了解下今天我剛寫的一道題:   P1558 色板遊戲   題目背景   阿寶上學了,今天老師拿來了一塊很長的塗色板。   題目描述

Linux CentOS7 學習第一天201864日

CentOS初學1今天學習的內容是:1、VMware的安裝,硬盤大小正常設置20G到30G,如果你的電腦內存夠大,安裝時想快點就把內存設置為2G,(我的硬盤是SSD硬盤,安裝時非常快)2、CentOS 的安裝CentOS的安裝中,比較重要的是分區,選擇的是標準分區,/boot 分區的大小是200M,/swap

201866P1541 烏龜棋

int 四種 自己 nbsp mat UNC 沒有 eset -s   今天做提高組題時,無意間看見了這道題就立刻興致勃勃的去做,結果突然發現自己不會dp了,死磕了一下發現自己根本不會 沒辦法就只好點開題解,瞬間明白(突然覺得自己好笨): 題目: 題目背景 小明過生

CentOSLinux 學習第三臺201866

CentOS安裝ifconfig 命令方式yum -y install net-toos運行這個命令就安裝了安裝完Putty,後,設置Putty秘鑰putty 秘鑰設置,在安裝putty的壓縮包裏有一個putty證,執行文件(PUTTYGEN),打開後點擊:Generate 這個時候就會生出秘鑰公鑰,這個秘鑰

201868號過河

++ col c++ 所有 容易 thml pan 大於 暴力 題目描述 在河上有一座獨木橋,一只青蛙想沿著獨木橋從河的一側跳到另一側。在橋上有一些石子,青蛙很討厭踩在這些石子上。由於橋的長度和青蛙一次跳過的距離都是正整數,我們可以把獨木橋上青蛙可能到達的點看成數軸上的一

Linux CentOS 學習第4天201867日

單用戶模式 網絡超級管理員密碼後怎樣操作 一、單用戶模式(忘記管理員密碼的時候怎麽辦?)重啟命令:rebootinit 6shutdown -r now關機命令init 0poweroff1、重啟機器出現以下界面的時候,按鍵盤上的方向鍵(上或下鍵)選擇下面的選項CentOS Linux (3.10.0

Linux CentOS 學習第62018612日

目錄 mkdir rmdir rmmkdir 創建目錄命令rmdir 刪除目錄命令 rm 刪除文件命令-f 命令選項,強制刪除文件命令!tree使用命令歷史裏面最近一次tree的命令history 可以看見之前使用過的命令rm -r 刪除目錄和文件rm -rf 強制刪除該目錄及該目錄以下的目錄和文件-v 選

Linux CentOS學習第7天2018614日

cat查看文件內容命令touch 創建文件命令mv 移動文件命令在當前目錄就相當於更改文件名文本文檔相關的命令cat查看文件內容的命令tac倒敘查看文件的內容cat /etc/passwd >> /tmp/1.txt 將passwd文件內容追加到 1.txt文件中去man cat查看cat命令的用

OpenCV&C++ 零散-筆記201811

size font nbsp art csdn pan open tor log 1、vector<> https://blog.csdn.net/ak201605050122/article/details/80225297 2、Open

ArcGIS API for JavaScript 4.10201812的新增功能

原網址https://www.esri.com/arcgis-blog/products/js-api-arcgis/announcements/whats-new-in-arcgis-api-for-javascript-4-10-december-2018/ 4.10版引入了大量新功能和改進

ROS機器人作業系統資料與資訊201812

要聞一覽: ROS 2新版 開源機器人論文集徵稿 機器人導航新功能 適用18.04+16.04的ROS QT 4.8 行為樹 釋出ROS版本號命名 Existing ROS 2 names and codenames: Ardent Apa

國家區域行政編碼201812

行政區劃程式碼 單位名稱 110000 北京市 110101 東城區 110102 西城區 110105 朝陽區 110106 豐臺區 110107 石景山區 110108 海淀區

第十三次CCF CSP認證20183真題棋局評估

問題描述   Alice和Bob正在玩井字棋遊戲。   井字棋遊戲的規則很簡單:兩人輪流往3*3的棋盤中放棋子,Alice放的是“X”,Bob放的是“O”,Alice執先。當同一種棋子佔據一行、一列

平安科技Java開發三面面經201812

上週接到平安HR邀約面試的電話,約在上週6,過去面試。因為之前面過平安壽險,所以 應該是簡歷被撈了一下。說是現場直接走完 面試流程,於是就去了。現場共2輪技術面+1輪HR面,3輪面試過了的話,後面會做一份IQ和EQ測試題(這個測試掛了,就GG,而且3個月不 能再面平安任何崗位,要認真點

自考總結201810

本次自考感受 學習是一個反覆的過程 在考前複習知識點階段,找到了自己的很多知識漏洞。比如,資料結構中的集合這種邏輯結構已經被我拋之腦後完全沒有印象;線性表的鏈式儲存中,才瞭解到單鏈表還有有無頭結點之分

第十三次CCF CSP認證20183真題棋局評估 題解

問題描述   Alice和Bob正在玩井字棋遊戲。   井字棋遊戲的規則很簡單:兩人輪流往3*3的棋盤中放棋子,Alice放的是“X”,Bob放的是“O”,Alice執先。當同一種棋子佔據一行、一列或一條對角線的三個格子時,遊戲結束,該種棋子的持有者獲勝。當棋盤被填滿的時候,

第十三次CCF CSP認證20183真題跳一跳

跳一跳 問題描述   近來,跳一跳這款小遊戲風靡全國,受到不少玩家的喜愛。   簡化後的跳一跳規則如下:玩家每次從當前方塊跳到下一個方塊,如果沒有跳到下一個方塊上則遊戲結束。   如果跳到了方塊

如何關閉QQ電腦端的“騰訊網 今日最新資訊推薦”彈窗20182

這個需求很讓人無語。因為辦公室的電腦有時候一直登入QQ(我這裡的版本是QQ 8.9.5),重新回到桌面的時候就會彈出“騰訊網 今日最新資訊推薦”的彈窗,讓人感覺智商又被騰訊侮辱了。關閉方法如下:主選單