1. 程式人生 > 實用技巧 >針對廣州這一城市,運用Python來進行資料分析房地產市場

針對廣州這一城市,運用Python來進行資料分析房地產市場

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

以下文章來源於菜J學Python ,作者J哥

前言

為什麼要分析房地產市場?房地產行業具有鮮明的地域特徵,從房地產企業角度來講,城市的選擇在一定程度上決定了投資的成敗。因此,對一個城市的市場研判就顯得至關重要。早在幾年前,同樣的資金配置到南京和長沙兩個城市,獲得的投資回報差別是巨大的。

2017年至2019年南京和長沙二手房(元/㎡)

那麼,我們該如何分析房地產市場?我從資料分析的角度,歸納梳理了一下思路,我認為一個城市的房地產市場分析應該包括城市經濟、相關政策、土地市場和房產市場四個方面。城市經濟反映了一個城市的經濟實力和潛能,可以細分出以下幾個指標:人均GDP和單位面積GDP、人均財政收入和單位面積財政收入、高淨值人群規模、人口淨流入、第三產業佔比、產業互補、房地產投資依賴度、城市友好度等。政府制定的政策對房地產市場影響也是巨大的,相關性較高的政策有金融政策、人口政策、土地政策和購房政策等。最後就是城市土地市場和房產市場分析,這也是整個分析最核心的部分。

房地產市場分析框架

接下來,我將結合Python,以廣州為例,嘗試著分析廣州的土地市場和房產市場,城市經濟和相關政策的分析將留在以後的文章中敘述。

廣州土地市場分析

土地市場包括一級市場和二級市場,一級市場是土地使用權出讓的市場,即國家通過其指定的政府部門將城鎮國有土地或將農村集體土地徵收為國有土地後出讓給使用者的市場,出讓的土地,可以是生地,也可以是經過開發達到“七通一平”的熟地。二級市場即土地使用權出讓後的再交易,土地使用者將達到規定、可以交易的土地使用權,進入流通領域進行交易的市場。限於篇幅,本文僅從土地一級市場著手進行資料分析。

獲取土地資料

土地市場資料一般會公示在當地的公共資源交易中心,但經常會出現只公示當週或當月資料的情況,因此,我們可以去找專業的土地網站獲取交易資料。

本文以土流網為例,這個網站結構簡單,簡單的url翻頁構造,然後用xpath解析資料即可。限於篇幅,爬蟲程式碼不做贅述,僅提供核心程式碼。

def main():
    for page in range(1,46):   #這裡設定頁數
        url = 'https://www.tudinet.com/market-213-0-0-0/list-o1ctime-pg{}.html'.format(page)
        print(url)
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36
', } response = requests.request("GET", url, headers = headers) #print(response.status_code) if response.status_code == 200: re = response.content.decode('utf-8') print("正在提取第" + str(page) + "") time.sleep(random.uniform(1,2)) print("-" * 80) # print(re) parse = etree.HTML(re) #解析網頁 items = parse.xpath('.//div[@class="land-l-cont"]/dl') parse_page(items) if len(items) < 10: print('獲取完成') break if __name__ == '__main__': time.sleep(random.uniform(1,2)) main()

執行爬蟲程式碼,提取到廣州1238塊土地資料。以下為簡單清洗後部分資料:

分析土地資料

土地成交狀態

近10年廣州土地招拍掛成交情況

2011年至2020年,廣州土地招拍掛未成交和流拍土地規模佔到一半,成交土地佔比僅為49.71%,整體成交率並不高。未成交的原因主要集中在沒有意向競拍人、出價未達到規定的底價等。

土地成交面積

近10年廣州土地招拍掛成交面積(萬㎡)

2011年至2016年廣州市土地招拍掛成交土地較少,2016年成交規劃建築面積僅為77.30萬㎡。2017年以後成交規模開始步入高潮,2018年成交規劃建築面積達到1635.50萬㎡。

2019年以來廣州土地招拍掛成交面積(萬㎡)

從各月份土地成交來看,廣州2019年前半年土拍市場相對沉寂,年中以後開始恢復正常,2019年年底土拍市場進入火熱狀態。2019年11月和12月分別成交宗地21塊和38塊。

土地成交結構

近10年廣州土地招拍掛成交土地型別佔比(%)

近10年來廣州成交土地主要以工業用地、其他用地和住宅用地為主,工業用地佔比高達41.19%,這也是廣州工業企業發達的重要動因。

土地成交區域

近10年廣州各區土地招拍掛成交面積(萬㎡)

從成交區域來看,南沙區和番禺區各年都有一定土地成交,越秀區和天河區成交土地較少。2020年以來,南沙區土地市場火熱,成交面積遠高於廣州其他地區。

廣州房產市場分析

房產市場分析主要包括新房和二手房交易市場,由於一般的房產資訊釋出平臺二手房數量遠大於新房,為儘可能獲取更大樣本資料,提高分析的準確性,本文以廣州二手房成交資料進行房產市場分析。

獲取二手房資料

本文通過Python獲取房天下公佈的廣州二手房成交資料。房天下的爬蟲也較為簡單,爬蟲邏輯類似貝殼找房,唯一需要注意的是當遍歷完一個子地區後跳轉下一個子地區的處理。以下給出核心程式碼:

def main():
    #增城a080;番禺a078;南沙a084;花都a0639;白雲a076;海珠a074;越秀a072;荔灣a071;天河a073;從化a079;黃埔a075
    district_list = ['a084', 'a078','a080', 'a0639','a076', 'a074','a072', 'a071','a073', 'a079','a075']  #地區
    for district in district_list:
        for page in range(1,101):   #這裡設定頁數
            url = 'https://gz.esf.fang.com/chengjiao-{0}/i3{1}/'.format(district, page)
            print(url)
            headers = {
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36',
            }
            response = requests.request("GET", url, headers = headers)
            if response.status_code == 200:
                re = response.content.decode('utf-8')
                print("正在提取" + district +'' + str(page) + "")
                time.sleep(random.uniform(1,2))
                print("-" * 80)
                # print(re)
                parse = etree.HTML(re)  # 解析網頁
                items = parse.xpath('.//div[@name="div_houselist"]/dl')
                parse_page(items)
                if len(items) < 30:  #遍歷完子地區後跳轉
                    print('獲取完成')
                    break

if __name__ == '__main__':
    time.sleep(random.uniform(1,2))
    main()

程式碼執行幾分鐘就提取下22170套廣州二手房資料,簡單清洗後部分資料展示如下:

分析二手房資料

量價走勢

近5年廣州二手房量價走勢

從廣州近幾年二手房的量價走勢來看,自2015年以來房價一直在上漲,2018年二手房均價達到35000元/㎡。2019年房價有所回落,但成交二手房數量達到近幾年峰值,全年成交8940套。

2020年1月至6月廣州二手房量價走勢

2020年1月至6月,廣州二手房均價與2019年基本持平。從成交量來看,2月份受疫情影響僅成交70套二手房,3月份以來,疫情逐漸得到控制,房產市場向好,6月份成交二手房1337套。

房價分佈

2020年上半年廣州各區二手房均價(元/㎡)

從房價分佈來看,2020年1月至6月二手房均價最高的地區為越秀區和天河區,均價分別為46767.52元/㎡和46433.89元/㎡。從化區房價最低,僅為12190.67元/㎡。

樓盤成交TOP20

2020年1月至6月廣州二手房成交TOP20樓盤

從樓盤成交來看,2020年1月至6月廣州二手房成交數量最多的樓盤為位於增城區的錦繡天倫花園,共計成交78套,成交均價為18565.40元/㎡。

相關性分析

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns
%matplotlib inline
sns.set_style('white')   #設定圖形背景樣式為白色
df = pd.read_excel("D:\data\地產資料分析\廣州二手房.xlsx")
df = df[['','','面積(㎡)','層數','成交單價(元/㎡)']] #選擇需要的列
df.rename(columns={'': 'room', '': 'hall', '面積(㎡)': 'area', '層數': 'floor', '成交單價(元/㎡)': 'price'}, inplace=True)
fig,axes=plt.subplots(1,2,figsize=(12,5))
sns.regplot(x= 'room',y='price',data=df,color='r',marker='+',ax=axes[0])
sns.regplot(x='hall',y='price',data=df,color='g',marker='*',ax=axes[1])

近5年廣州二手房居室、面積、樓層與房價的關係

通過繪製廣州二手房迴歸圖,我們發現,廣州二手房居室數、面積與房價相關性並不大。房屋樓層與房價看似具有較強的正相關,其實是受三個異常值影響,並不具有相關性。

廣州房地產市場小節

從廣州土地市場來看,近年來土地市場有所回暖,尤其是南沙區和番禺區土地市場成交穩定,未來仍具有發展潛力。從房產市場來看,廣州二手房自2019年來價格變動幅度不大,維持30000元/㎡左右。疫情下二手房交易受挫,部分房企嘗試以價換量爭取更大去化量。疫情逐漸得到控制後,二手房交易明顯恢復。城中心房價維持高位,廣州以北的從化和增城房價較低,仍具有上升空間。

宣告

1.本資料分析只做學習研究之用途,提供的結論僅供參考;

2.作者對地產行業瞭解甚微,相關描述可能存在不盡完善之處,請勿對號入座。