武漢二手房價分析(原創分析,資料現勢性2018年6月)
摘要:自編爬蟲從某二手房交易網爬取武漢市全市13個區範圍內6月份所有掛牌二手房交易資訊,包括房屋所在小區名稱、房間數、單價、總價、所屬區域等,儲存在表格中;根據小區名稱和所屬區域從高德網路地圖API獲取小區經緯度;通過RGui進行資料排序顯示;通過ArcGIS軟體疊加房源點和行政區劃圖,製作房間熱力圖。分析房價高地分佈情況,對二手房購房者提供參考借鑑意義。二手房交易網上的資訊純屬市場行為,存在一定的不真實,總體算是可靠的,與在小區中介詢問的調查價格基本一致。
1、爬取某房價網二手房交易價格,儲存在csv檔案
<<武漢市房價分佈.csv>>
2、在RGui中匯入資料:
mydata<-read.table(header=T,file="F:\\武漢市房價分佈.csv",sep=
3、提取子資料集
wc<-subset(mydata,"區"="武昌")
4、繪製單個區的箱形圖
boxplot(單價~區,mydata)
設定縱軸座標單位,設定箱體顏色為lightblue,
boxplot(單價~區,mydata,col="lightblue")
以千元為單位,
boxplot(單價/1000~區,mydata,col="lightblue")
新增縱座標標籤,
boxplot(單價/1000~區,mydata,ylab="二手房單價(單位:千元)",col="lightblue")
4、清洗掉極值,如單價超過6萬元的資料
5、對資料進行排序
對分組箱圖按中位數進行逆序排列後顯示:
> aggregate(.~區,data=mydata,mean)
區 小區全稱 單價 省 市 地址 郵編 經度 緯度
1 蔡甸區 1665.875 10350.895 1 1 102.3711 420114 114.0867 30.53099
2 東西湖區 1580.328 14260.978 1 1 320.5690 420112 114.1852 30.64115
3 漢南區 1511.643 7002.554 1 1 450.6786 420113 114.081130.32355
4 漢陽區 1743.552 16095.344 1 1 571.2365 420105 114.2273 30.54636
5 洪山區 1439.315 16145.331 1 1 905.0126 420111 114.3861 30.52368
6 黃陂區 1576.626 10191.703 1 1 1226.0659 420116 114.3232 30.76294
7 江岸區 1725.614 20703.460 1 1 1484.5160 420102 114.2965 30.61917
8 江漢區 1653.395 19961.476 1 1 1814.8360 420103 114.2661 30.60400
9 江夏區 1639.555 13091.987 1 1 2074.5378 420115 114.3701 30.40724
10 礄口區 1693.725 18655.192 1 1 2303.4353 420104 114.2363 30.58428
11 青山區 1530.238 16611.338 1 1 2486.2615 420107 114.3999 30.62462
12 武昌區 1718.217 21570.117 1 1 2704.9765 420106 114.3265 30.55031
13 新洲區 1799.209 6063.743 1 12927.2230 420117 114.6385 30.71597
d[order(d$單價,decreasing=TRUE),]
區 小區全稱 單價 省 市 地址 郵編 經度 緯度
12 武昌區 1718.217 21570.117 1 1 2704.9765 420106 114.3265 30.55031
7 江岸區 1725.614 20703.460 1 1 1484.5160 420102 114.2965 30.61917
8 江漢區 1653.395 19961.476 1 1 1814.8360 420103 114.2661 30.60400
10 礄口區 1693.725 18655.192 1 1 2303.4353 420104 114.2363 30.58428
11 青山區 1530.238 16611.338 1 1 2486.2615 420107 114.3999 30.62462
5 洪山區 1439.315 16145.331 1 1 905.0126 420111 114.3861 30.52368
4 漢陽區 1743.552 16095.344 1 1 571.2365 420105 114.2273 30.54636
2 東西湖區 1580.328 14260.978 1 1 320.5690 420112 114.1852 30.64115
9 江夏區 1639.555 13091.987 1 1 2074.5378 420115 114.3701 30.40724
1 蔡甸區 1665.875 10350.895 1 1 102.3711 420114 114.0867 30.53099
6 黃陂區 1576.626 10191.703 1 1 1226.0659 420116 114.3232 30.76294
3 漢南區 1511.643 7002.554 1 1 450.6786 420113 114.081130.32355
13 新洲區 1799.209 6063.743 1 12927.2230 420117 114.6385 30.71597
按中數排序
> aggregate(.~區,data=mydata,median)
區 小區全稱 單價 省 市 地址 郵編 經度 緯度
1 蔡甸區 1609.5 9307.5 1 1 94.5 420114 114.0629 30.53492
2 東西湖區 1508.0 13964.0 1 1 318.5 420112 114.1941 30.64014
3 漢南區 1501.5 6595.5 1 1 452.5 420113 114.0813 30.31732
4 漢陽區 1798.0 16296.0 1 1 567.0 420105 114.2212 30.54925
5 洪山區 1335.5 17159.0 1 1 897.5 420111 114.3789 30.50579
6 黃陂區 1660.5 10561.0 1 11224.0 420116 114.3191 30.71850
7 江岸區 1771.5 19619.0 1 11482.5 420102 114.2943 30.61687
8 江漢區 1587.0 19330.0 1 11814.0 420103 114.2664 30.60592
9 江夏區 1662.0 12764.5 1 12073.5 420115 114.3727 30.40792
10 礄口區 1614.0 18238.0 1 12306.0 420104 114.2433 30.57883
11 青山區 1632.0 17366.0 1 12488.5 420107 114.3951 30.62510
12 武昌區 1857.0 21344.0 1 12710.0 420106 114.3260 30.54703
13 新洲區 2044.5 5944.5 1 1 2927.5 420117 114.576230.67016
> d[order(d$單價,decreasing=TRUE),]
區 小區全稱 單價 省 市 地址 郵編 經度 緯度
12 武昌區 1718.217 21570.117 1 1 2704.9765 420106 114.3265 30.55031
7 江岸區 1725.614 20703.460 1 1 1484.5160 420102 114.2965 30.61917
8 江漢區 1653.395 19961.476 1 1 1814.8360 420103 114.2661 30.60400
10 礄口區 1693.725 18655.192 1 1 2303.4353 420104 114.2363 30.58428
11 青山區 1530.238 16611.338 1 1 2486.2615 420107 114.3999 30.62462
5 洪山區 1439.315 16145.331 1 1 905.0126 420111 114.3861 30.52368
4 漢陽區 1743.552 16095.344 1 1 571.2365 420105 114.2273 30.54636
2 東西湖區 1580.328 14260.978 1 1 320.5690 420112 114.1852 30.64115
9 江夏區 1639.555 13091.987 1 1 2074.5378 420115 114.3701 30.40724
1 蔡甸區 1665.875 10350.895 1 1 102.3711 420114 114.0867 30.53099
6 黃陂區 1576.626 10191.703 1 1 1226.0659 420116 114.3232 30.76294
3 漢南區 1511.643 7002.554 1 1 450.6786 420113 114.081130.32355
13 新洲區 1799.209 6063.743 1 12927.2230 420117 114.6385 30.71597
mydata<- mydata[order(mydata$房價中位數,decreasing=TRUE),]
boxplot(單價/1000~序號,mydata,ylab="二手房單價(單位:千元)",col="lightblue")
id | 區位 | 房價中位數 | 序號 |
01 | 武昌區 | 21570.117 | 01武昌區 |
02 | 江岸區 | 20703.46 | 02江岸區 |
03 | 江漢區 | 19961.476 | 03江漢區 |
04 | 礄口區 | 18655.192 | 04礄口區 |
05 | 青山區 | 16611.338 | 05青山區 |
06 | 洪山區 | 16145.331 | 06洪山區 |
07 | 漢陽區 | 16095.344 | 07漢陽區 |
08 | 東西湖區 | 14260.978 | 08東西湖區 |
09 | 江夏區 | 13091.987 | 09江夏區 |
10 | 蔡甸區 | 10350.895 | 10蔡甸區 |
11 | 黃陂區 | 10191.703 | 11黃陂區 |
12 | 漢南區 | 7002.554 | 12漢南區 |
13 | 新洲區 | 6063.743 | 13新洲區 |
在arcgis中做屬性連線,給資料加上中位數排序倒序排序後製圖如下:
boxplot(單價/1000~序號,mydata,ylab="二手房單價(單位:千元)",col="lightblue",main="武漢二手房交易價格按中位數分割槽排序統計圖")
6、房價趨勢分析
武漢市房價按區分析,較為集中的幾個區中心城區有江岸區、江漢區、礄口區、青山區、漢陽區;遠城區有東西湖區、蔡甸區、黃陂、漢南、新洲;
波動較大的有武昌、洪山、江夏,一定程度上存在房產市場過熱,洪山區上市交易的樓盤為557,全市各區排名第一為,超過第二名30%,洪山區受東湖高新開發區、國家自貿區等開發板塊政策刺激,增速迅猛,為未來樓盤看漲區域。
江漢、江岸存在部分變異值,包括極高和極低值,與老城區上市交易的棚戶區和部分優質房源高價基本相符,同樣作為老城區的礄口,僅存在極大值,和個別極小值,這與其基本完成棚戶區改造相關。存在極大值的還有洪山區、漢陽、江夏、蔡甸、黃陂等,均為部分別墅,不在考察範圍之列。
從房價集中程度來看武昌區、洪山區、江夏區存在較大的離散狀態,這與三個板塊活躍程度有關,武昌是教育中心,高校雲集,洪山區是高新技術企業所在地,江夏與之毗鄰,高技能人才對優質房源的剛需崔生了高房價,同時還遷房和房齡超過20年的老房需求疲軟,導致了房價離散程度較高,從中線位置來看,武昌明顯處於左偏狀態,洪山區為右偏,江夏則居中,這說明武昌房價均值低估趨勢,洪山則虛高,投資者可考慮選擇武昌好地段房源,或選擇江夏,洪山區需謹慎,如光谷金融港片區,2016-2018年連續兩年增幅超過30%,投機過熱,此時接盤短期來看比較危險,相較之選擇江夏比較划算和保險。
7、武漢市房屋交易熱度圖
相關推薦
武漢二手房價分析(原創分析,資料現勢性2018年6月)
摘要:自編爬蟲從某二手房交易網爬取武漢市全市13個區範圍內6月份所有掛牌二手房交易資訊,包括房屋所在小區名稱、房間數、單價、總價、所屬區域等,儲存在表格中;根據小區名稱和所屬區域從高德網路地圖API獲取小區經緯度;通過RGui進行資料排序顯示;通過ArcGIS軟體疊加房源點和
2018年6月3號(線段樹(3))
錯誤 格式 是個 每一個 並且 限制 自己 輸出結果 IT 今天想分享一下一道題的心得: P1198 [JSOI2008]最大數 題目描述 現在請求你維護一個數列,要求提供以下兩種操作: 1、 查詢操作。 語法:Q L
2018年6月4號(線段樹(4))
描述 content IV region 編號 枚舉 sticky har bsp 今天想和大家一起了解下今天我剛寫的一道題: P1558 色板遊戲 題目背景 阿寶上學了,今天老師拿來了一塊很長的塗色板。 題目描述
Linux CentOS7 學習第一天(2018年6月4日)
CentOS初學1今天學習的內容是:1、VMware的安裝,硬盤大小正常設置20G到30G,如果你的電腦內存夠大,安裝時想快點就把內存設置為2G,(我的硬盤是SSD硬盤,安裝時非常快)2、CentOS 的安裝CentOS的安裝中,比較重要的是分區,選擇的是標準分區,/boot 分區的大小是200M,/swap
2018年6月6號(P1541 烏龜棋)
int 四種 自己 nbsp mat UNC 沒有 eset -s 今天做提高組題時,無意間看見了這道題就立刻興致勃勃的去做,結果突然發現自己不會dp了,死磕了一下發現自己根本不會 沒辦法就只好點開題解,瞬間明白(突然覺得自己好笨): 題目: 題目背景 小明過生
CentOSLinux 學習第三臺(2018年6月6日)
CentOS安裝ifconfig 命令方式yum -y install net-toos運行這個命令就安裝了安裝完Putty,後,設置Putty秘鑰putty 秘鑰設置,在安裝putty的壓縮包裏有一個putty證,執行文件(PUTTYGEN),打開後點擊:Generate 這個時候就會生出秘鑰公鑰,這個秘鑰
2018年6月8號(過河)
++ col c++ 所有 容易 thml pan 大於 暴力 題目描述 在河上有一座獨木橋,一只青蛙想沿著獨木橋從河的一側跳到另一側。在橋上有一些石子,青蛙很討厭踩在這些石子上。由於橋的長度和青蛙一次跳過的距離都是正整數,我們可以把獨木橋上青蛙可能到達的點看成數軸上的一
Linux CentOS 學習第4天(2018年6月7日)
單用戶模式 網絡超級管理員密碼後怎樣操作 一、單用戶模式(忘記管理員密碼的時候怎麽辦?)重啟命令:rebootinit 6shutdown -r now關機命令init 0poweroff1、重啟機器出現以下界面的時候,按鍵盤上的方向鍵(上或下鍵)選擇下面的選項CentOS Linux (3.10.0
Linux CentOS 學習第6天(2018年6月12日)
目錄 mkdir rmdir rmmkdir 創建目錄命令rmdir 刪除目錄命令 rm 刪除文件命令-f 命令選項,強制刪除文件命令!tree使用命令歷史裏面最近一次tree的命令history 可以看見之前使用過的命令rm -r 刪除目錄和文件rm -rf 強制刪除該目錄及該目錄以下的目錄和文件-v 選
Linux CentOS學習第7天(2018年6月14日)
cat查看文件內容命令touch 創建文件命令mv 移動文件命令在當前目錄就相當於更改文件名文本文檔相關的命令cat查看文件內容的命令tac倒敘查看文件的內容cat /etc/passwd >> /tmp/1.txt 將passwd文件內容追加到 1.txt文件中去man cat查看cat命令的用
OpenCV&C++ 零散-筆記(2018年11月)
size font nbsp art csdn pan open tor log 1、vector<> https://blog.csdn.net/ak201605050122/article/details/80225297 2、Open
ArcGIS API for JavaScript 4.10(2018年12月)的新增功能
原網址https://www.esri.com/arcgis-blog/products/js-api-arcgis/announcements/whats-new-in-arcgis-api-for-javascript-4-10-december-2018/ 4.10版引入了大量新功能和改進
ROS機器人作業系統資料與資訊(2018年12月)
要聞一覽: ROS 2新版 開源機器人論文集徵稿 機器人導航新功能 適用18.04+16.04的ROS QT 4.8 行為樹 釋出ROS版本號命名 Existing ROS 2 names and codenames: Ardent Apa
國家區域行政編碼(2018年12月)
行政區劃程式碼 單位名稱 110000 北京市 110101 東城區 110102 西城區 110105 朝陽區 110106 豐臺區 110107 石景山區 110108 海淀區
第十三次CCF CSP認證(2018年3月)真題棋局評估
問題描述 Alice和Bob正在玩井字棋遊戲。 井字棋遊戲的規則很簡單:兩人輪流往3*3的棋盤中放棋子,Alice放的是“X”,Bob放的是“O”,Alice執先。當同一種棋子佔據一行、一列
平安科技Java開發三面面經(2018年12月)
上週接到平安HR邀約面試的電話,約在上週6,過去面試。因為之前面過平安壽險,所以 應該是簡歷被撈了一下。說是現場直接走完 面試流程,於是就去了。現場共2輪技術面+1輪HR面,3輪面試過了的話,後面會做一份IQ和EQ測試題(這個測試掛了,就GG,而且3個月不 能再面平安任何崗位,要認真點
自考總結(2018年10月)
本次自考感受 學習是一個反覆的過程 在考前複習知識點階段,找到了自己的很多知識漏洞。比如,資料結構中的集合這種邏輯結構已經被我拋之腦後完全沒有印象;線性表的鏈式儲存中,才瞭解到單鏈表還有有無頭結點之分
第十三次CCF CSP認證(2018年3月)真題棋局評估 題解
問題描述 Alice和Bob正在玩井字棋遊戲。 井字棋遊戲的規則很簡單:兩人輪流往3*3的棋盤中放棋子,Alice放的是“X”,Bob放的是“O”,Alice執先。當同一種棋子佔據一行、一列或一條對角線的三個格子時,遊戲結束,該種棋子的持有者獲勝。當棋盤被填滿的時候,
第十三次CCF CSP認證(2018年3月)真題跳一跳
跳一跳 問題描述 近來,跳一跳這款小遊戲風靡全國,受到不少玩家的喜愛。 簡化後的跳一跳規則如下:玩家每次從當前方塊跳到下一個方塊,如果沒有跳到下一個方塊上則遊戲結束。 如果跳到了方塊
如何關閉QQ電腦端的“騰訊網 今日最新資訊推薦”彈窗(2018年2月)
這個需求很讓人無語。因為辦公室的電腦有時候一直登入QQ(我這裡的版本是QQ 8.9.5),重新回到桌面的時候就會彈出“騰訊網 今日最新資訊推薦”的彈窗,讓人感覺智商又被騰訊侮辱了。關閉方法如下:主選單