爬取某房源網資料 - Python

阿新 • • 發佈：2021-11-04

爬取某房源資料，算加深對parsel庫的使用。

 1 """
 2     爬取房源
 3 """
 4 
 5 import requests
 6 import csv
 7 import parsel
 8 
 9 # 請求頭
10 headers = {
11     'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36',
12 }
13 # 要請求的地址
14 url = 'https://xx.newhouse.xx.com/house/s/ 
'
15 
16 # 請求後返回的狀態碼
17 response = requests.get(url, headers=headers)
18 
19 # 開始解析資料
20 selector = parsel.Selector(response.text)
21 
22 # 找到所有li標籤
23 lis = selector.xpath('//div[@class="nl_con clearfix"]/ul/li[not(@style)]') # 取頁面中所有的li標籤，但是不要包含li有style屬性的那行
24 
25 # 開始迴圈
26 for li in lis:
27     name = li.xpath(' 
.//div[@class="nlcd_name"]/a/text()').get() # 提取名稱.表示當前節點
28     # 但是發現很多空白，假定這個name都有值
29     if name:
30         name = name.strip() # 去除左右兩邊的空白
31     price = li.xpath('.//div[@class="nhouse_price"]/*/text()').getall() # 價格
32     if price:
33         price = ''.join(price) # 將價格轉換成字串
34     else:
35         price = ' 
暫未取得預售證！'
36 
37     room = li.xpath('.//div[@class="house_type clearfix"]/a/text()').getall() # 幾居室
38     if room:
39         room = '/'.join(room)
40     else:
41         room = '未知！'
42 
43     area = li.xpath('.//div[@class="house_type clearfix"]/text()').re('[\d~平米]+')
44     if area: # 可能會存沒有值的情況
45         area = area[0]
46     else:
47         area = '未知'
48     address = li.xpath('.//div[@class="address"]/a/@title').get() # 地址
49     sale = li.xpath('.//div[@class="fangyuan"]/span/text()').get().strip() # 是否在售
50     tel = li.xpath('.//div[@class="tel"]/p/text()').getall() # 電話聯絡方式
51     if tel:
52         tel = '轉'.join(tel)
53     else:
54         tel = '電話號碼未知！'
55     detailPage = li.xpath('.//div[@class="nlcd_name"]/a/@href').get()
56     print(name, price, room, area, address, sale, tel, detailPage, sep='---')
57 
58     # 開始儲存資料
59     with open('謀天下房源.csv', mode='a', encoding='utf-8-sig', newline='') as f: # 不加newline的話會有空行，後面的''表示消除空行
60         csvWriter = csv.writer(f) # 例項化一個物件
61         csvWriter.writerow([name, price, room, area, address, sale, tel, detailPage]) #把列表按一行一行寫入

爬取某房源網資料 - Python

爬取某房源資料，算加深對parsel庫的使用。 1 \"\"\" 2爬取房源 3 \"\"\" 4 5 import requests

Python爬蟲 scrapy框架爬取某招聘網存入mongodb解析

建立專案 scrapy startproject zhaoping 建立爬蟲 cd zhaoping scrapy genspider hr zhaopingwang.com 目錄結構

用Python爬取某蔬菜網的行情，分析底哪個地區的蔬菜便宜

前言夏季到來，合理飲食很關鍵。夏季的飲食講究清淡，多吃蔬菜有利於養生。那麼哪個地區的蔬菜批發價格要便宜一些呢?讓我們用Python爬取某蔬菜網的行情價格，來分析下，到底哪個地區的蔬菜，要更便宜一些。

Python爬取某東羽絨服資料，用視覺化幫你挑選心儀的衣服

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

教你如何爬取美團網資料，就是那麼的簡單

本文的文字及圖片過濾網路，可以學習，交流使用，不具有任何商業用途，如有問題請及時聯絡我們以作處理。

爬取某APP的資料

好久沒寫部落格了，也許人還處在迷茫狀態一天渾渾噩噩的。最近寫了一個爬蟲指令碼爬某APP的使用者廠商資料，由於資料有12W+加上sleep的時間跑起來花費的時間很長。所以我將指令碼分開寫了先抓一級頁面的請求引數再抓

手把手教你用Python爬取某網小說資料，並進行視覺化分析

網路文學是以網際網路為展示平臺和傳播媒介，藉助相關網際網路手段來表現文學作品及含有一部分文字作品的網路技術產品，在當前成為一種新興的文學現象，並快速興起，各種網路小說也是層出不窮，今天我們使用seleniu

Python爬取食品商務網蔬菜價格資料，看看蔬菜最近的價格情況

前言蔬菜是指可以做菜、烹飪成為食品的一類植物或菌類，蔬菜是人們日常飲食中必不可少的食物之一。近期，蔬菜價格有所上漲，引起廣泛關注。“雙節”將至，物價走勢如何？9月16日，國家發改委召開9月份例行

python爬取天天基金網所有基金資料

多執行緒+代理池爬取天天基金網、股票資料(無需使用爬蟲框架) 簡介提到爬蟲，大部分人都會想到使用Scrapy工具，但是僅僅停留在會使用的階段。為了增加對爬蟲機制的理解，我們可以手動實現多執行緒的爬蟲過

python爬蟲：爬取某圖外賣資料有這篇文章就夠了

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲：爬取窮遊網的地點資料，世界那麼大，我想去看看。

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬蟲利用selenium實現自動翻頁爬取某魚資料的思路詳解

基本思路: 首先用開發者工具找到需要提取資料的標籤列利用xpath定位需要提取資料的列表

python協程爬取某網站的老賴資料

import re import json import aiohttp import asyncio import time import pymysql from asyncio.locks import Semaphore

Python爬取獵聘網的資料進行分析

前言：一、選題的背景　　　近年來，越來越多的年輕人在尋找工作這個方面呢的事情上會出現各種問題，而好的工作非常難找，差的工作很多年輕人也不想做，所以我選擇做一份資料分析一下招聘網站上各個工作的情況。

Python使用mongodb儲存爬取豆瓣電影的資料過程解析

建立爬蟲專案douban scrapy startproject douban 設定items.py檔案，儲存要儲存的資料型別和欄位名稱

Python爬蟲爬取煎蛋網圖片程式碼例項

這篇文章主要介紹了Python爬蟲爬取煎蛋網圖片程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python爬蟲爬取筆趣網小說網站過程圖解

首先：文章用到的解析庫介紹 BeautifulSoup： Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。

基於Python爬取fofa網頁端資料過程解析

FOFA-網路空間安全搜尋引擎是網路空間資產檢索系統（FOFA）是世界上資料覆蓋更完整的IT裝置搜尋引擎，擁有全球聯網IT裝置更全的DNA資訊。探索全球網際網路的資產資訊，進行資產及漏洞影響範圍分析、應用分佈統計、應

Python爬蟲例項——scrapy框架爬取拉勾網招聘資訊

本文例項為爬取拉勾網上的python相關的職位資訊,這些資訊在職位詳情頁上,如職位名,薪資,公司名等等.

Python爬蟲實戰：爬取美團美食資料

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

爬取某房源網資料 - Python

相關推薦