Python：晚上把附近的足浴店都給爬了一遍，好兄弟真不錯

阿新 • • 發佈：2021-10-29

兄弟們，我來了！今天整個好玩的，你們肯定喜歡~

咱們上班累了，不得好好犒勞一下自己，是吧，於是我整了一手爬取附近洗jio的店子，浴皇大帝們，衝鴨！

很多人學習python，不知道從何學起。

很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。

很多已經做案例的人，卻不知道如何去學習更加高深的知識。

那麼針對這三類人，我給大家提供一個好的學習平臺，免費領取視訊教程，電子書籍，以及課程的原始碼！

QQ群：701698587

歡迎加入，一起討論 一起學習！

話不多說，衝！兄弟們，都是正規的正規的！

用的環境是

python 3.8 直譯器
pycharm 編輯器

用的大多數的知識點都是屬於基礎的知識點內容，以及爬蟲基礎入門一些知識點。

要用的模組
requests >>> pip install requests 第三方模組需要大家去安裝
csv
win + R 輸入cmd 輸入安裝命令 pip install 模組名 (如果你覺得安裝速度比較慢, 你可以切換國內映象源)

既然是爬蟲，那我們不得分析一下爬蟲的基本思路。

資料來源分析
我們不管是爬什麼，都要先找到資料來源對波。有來源才有下一步的行動。

1. 確定我們要爬取資料內容是什麼?
店鋪基本資料資訊
2. 通過開發者工具進行抓包分析分析資料從哪裡可以獲取
美團資料, 從第一頁資料進行分析的, 沒辦法實現翻頁爬取操作

程式碼流程步驟
有了來源目標之後，再請求獲取資料，解析資料，最後建立資料夾儲存到Excel表格。當然，如果想爬更多的，肯定就得實現自動翻頁

傳送請求, 對於店鋪資訊資料包url地址傳送請求
獲取資料, 獲取伺服器返回的response響應資料
解析資料, 提取我們想要的一些資料內容 (店鋪資訊)
儲存資料, 把相應的資料內容儲存csv表格裡面
多頁爬取：多頁爬取資料內容

所有程式碼
程式碼都在這，大家可以去試試，不限正規足浴，其實想爬啥都行。

import requests
import pprint
import re
import csv
import time

f = open(' 
按摩data.csv', mode='a', encoding='utf-8', newline='')

csv_writer = csv.DictWriter(f, fieldnames=[
    '店鋪名稱',
    '人均消費',
    '店鋪評分',
    '評論人數',
    '所在商圈',
    '店鋪型別',
    '店鋪地址',
    '聯絡方式',
    '營業時間',
    '詳情頁',
])
csv_writer.writeheader()


def get_shop_info(html_url):
    headers = {
        'Cookie': '_lxsdk_cuid=1742973e754c8-0755662a43e0a2-3962420d-1fa400-1742973e754c8; iuuid=1F1D4BFAA0B9CA777B0EC2B899C43AD6C5C9CDB370B86A51322AB71211B94277; cityname=%E9%95%BF%E6%B2%99; _lxsdk=1F1D4BFAA0B9CA777B0EC2B899C43AD6C5C9CDB370B86A51322AB71211B94277; _hc.v=f4f02748-8eb7-1ea7-385c-5899047aa1c1.1618907157; __mta=251035321.1598423295952.1598423295952.1621410161604.2; uuid=05f4abe326934bf19027.1634911815.1.0.0; rvct=1%2C70%2C30; _lx_utm=utm_source%3DBaidu%26utm_medium%3Dorganic; mtcdn=K; lt=knaBbvVTfN50cupoV5b87GJMXzkAAAAAAw8AAELrweWvhGhrM0fw6oTkLe5c6DGXJ6PCtxfyHgUPl3k-SVVR-Vs0LjzrGfewJhX8-g; u=266252179; n=qSP946594369; token2=knaBbvVTfN50cupoV5b87GJMXzkAAAAAAw8AAELrweWvhGhrM0fw6oTkLe5c6DGXJ6PCtxfyHgUPl3k-SVVR-Vs0LjzrGfewJhX8-g; unc=qSP946594369; firstTime=1634974011563; ci=70; _lxsdk_s=17cac0b849b-b3e-dac-85e%7C%7C10',
        'Host': 'www.meituan.com',
        'Referer': 'https://bj.meituan.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36',
    }
    response = requests.get(url=html_url, headers=headers)
    # print(response.text)
    phone = re.findall('"phone":"(.*?)"', response.text)[0]
    openTime = re.findall('"openTime":"(.*?)"', response.text)[0].replace('\\n', '')
    address = re.findall('"address":"(.*?)"', response.text)[0]
    shop_info = [address, phone, openTime]
    # print(shop_info)
    return shop_info


# def get_shop_info(html_url):
#     headers_1 = {
#         'Cookie': '_lxsdk_cuid=1742973e754c8-0755662a43e0a2-3962420d-1fa400-1742973e754c8; iuuid=1F1D4BFAA0B9CA777B0EC2B899C43AD6C5C9CDB370B86A51322AB71211B94277; cityname=%E9%95%BF%E6%B2%99; _lxsdk=1F1D4BFAA0B9CA777B0EC2B899C43AD6C5C9CDB370B86A51322AB71211B94277; _hc.v=f4f02748-8eb7-1ea7-385c-5899047aa1c1.1618907157; uuid=96d0bfc90dfc441b81fb.1630669508.1.0.0; ci=30; rvct=30; mtcdn=K; lt=1vyIlUgnzqEfhjpxic8Whf_WGfwAAAAAbg4AAOEUVbolB83IgwxL1wwOGfvIpVZsnHpwF6bGZZ5yT_SL4V8GRr4_WKkQ4s2AcF6Tmg; u=266252179; n=qSP946594369; token2=1vyIlUgnzqEfhjpxic8Whf_WGfwAAAAAbg4AAOEUVbolB83IgwxL1wwOGfvIpVZsnHpwF6bGZZ5yT_SL4V8GRr4_WKkQ4s2AcF6Tmg; firstTime=1630669549381; unc=qSP946594369; _lxsdk_s=17bab7a163a-27-d8f-8fd%7C%7C113',
#         # 'Referer': 'https://sz.meituan.com/',
#         'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
#     }
#     response_1 = requests.get(url=html_url, headers=headers_1)
#     html_data = re.findall('"address":"(.*?)","phone":"(\d+)"', response_1.text)[0]
#     return html_data


# get_shop_info('https://www.meituan.com/meishi/193587069/')
for page in range(0, 1537, 32):
    time.sleep(2)
    url = 'https://apimobile.meituan.com/group/v4/poi/pcsearch/30'
    data = {
        'uuid': '05f4abe326934bf19027.1634911815.1.0.0',
        'userid': '266252179',
        'limit': '32',
        'offset': page,
        'cateId': '-1',
        'q': '按摩',
        'token': 'knaBbvVTfN50cupoV5b87GJMXzkAAAAAAw8AAELrweWvhGhrM0fw6oTkLe5c6DGXJ6PCtxfyHgUPl3k-SVVR-Vs0LjzrGfewJhX8-g'
    }
    headers = {
        'Referer': 'https://sz.meituan.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
    }
    response = requests.get(url=url, params=data, headers=headers)
    result = response.json()['data']['searchResult']
    for index in result:
        shop_id = index['id']
        index_url = f'https://www.meituan.com/meishi/{shop_id}/'
        shop_info = get_shop_info(index_url)
        dit = {
            '店鋪名稱': index['title'],
            '人均消費': index['avgprice'],
            '店鋪評分': index['avgscore'],
            '評論人數': index['comments'],
            '所在商圈': index['areaname'],
            '店鋪型別': index['backCateName'],
            '店鋪地址': shop_info[0],
            '聯絡方式': shop_info[1],
            '營業時間': shop_info[2],
            '詳情頁': index_url,
        }
        csv_writer.writerow(dit)
        print(dit)

還可以實現資料分析啥的，我就不往下寫了，前兩天的一篇，有實現資料分析的，同一個平臺的。

兄弟們，看完記得點個贊三連啥的，這樣我更新就更快了，我就喜歡快~
給你們獎勵一個女朋友！

Python：晚上把附近的足浴店都給爬了一遍，好兄弟真不錯

兄弟們，我來了！今天整個好玩的，你們肯定喜歡~ 咱們上班累了，不得好好犒勞一下自己，是吧，於是我整了一手爬取附近洗jio的店子，浴皇大帝們，衝鴨！

實探華為賣車：有粉絲進店直言“給我來一輛”，銷量與特斯拉等差距大

從事汽車銷售行業近 5 年的張玲（化名）月初從北汽 4S 店跳槽到了華為體驗店，上崗半個月拿下 5 臺車訂單，提前完成了他給自己制定的 KPI—— 第一個月先賣 3 臺車，試試水。

360 政企安全集團 CEO 葉健：願把全網的安全能力開放給業界

7 月 27 日訊息，由中國網際網路協會、中國網路空間安全協會、全國工商聯大資料運維（網路安全）委員會、360 網際網路安全中心主辦等機構主辦的“第九屆網際網路安全大會”（簡稱“ISC2021”）在北京召開。在大會首日

python小程式-把產品1中的需求移到產品2中，產品1中的用例需要匯入產品2，則對應的需求id發生變化，需要進行替換

1、需求把產品1中的需求移到產品2中，產品1中的用例需要匯入產品2，則對應的需求id發生變化，需要進行替換

不會多執行緒？把這20個原始碼自己執行一遍，你就會明白了

提示：認真看完，花費不了多少時間，但是對你幫助應該很大，內容是阿里P7手打測試專案，這也是我讓我朋友教自己家親戚的時候，他留下的，一手資料，和大家分享

連Python產生器（Generator）的原理都解釋不了，還敢說Python用了5年？

最近有很多學Python同學問我，Python Generator到底是什麼東西，如何理解和使用。Ok，現在就用這篇文章對Python Generator做一個敲骨瀝髓的深入解析。

如果把 4 個訊息佇列都拉到一個群裡，他們會聊些什麼？

本篇的靈感來自我超級喜歡的一篇文章：《如果把中國 442 位皇帝都放在一個群裡面，他們會聊些什麼》。

週末我把HashMap原始碼又過了一遍

為什麼在Java面試中總是會問HashMap？ HashMap一直是Java面試官喜歡考察的題目，無論應聘者你處於哪個級別，在多輪的技術面試中似乎總有一次會被問到有關 HashMap 的問題。

codeforces 1424J，為了過這題，我把祖傳的C++都用上了！

大家好，我們選擇的是Bubble Cup比賽Div2場次的J題，不用問我Bubble Cup是什麼比賽，我也不清楚。總之是一場演算法比賽就是了。可能是這個比賽知名度比較低吧，參與的人數也不是很多，我們選擇了一道中等通過人數的J

王者榮耀：莊周為什麼一直被嫌棄？技能決定了風評，玩法決定高度

莊周這個英雄相信大家都不陌生，而且大部分玩家在聽到莊周這個名字的時候，都會覺得這是一個混分英雄，當他作為我們的隊友出現的時候，都會感到後背一涼，覺得這一把遊戲可能要輸了，而莊周在遊戲內為什麼一直會被嫌

這波印度疫情大坑，把蘋果和富士康都陷進去了，全球手機大廠打一陣“寒顫”

5 月 11 日，路透社報道稱，有訊息人士透露，由於感染了新冠肺炎的工人無法上班，印度富士康工廠的蘋果 iPhone 12 產能已經下降了 50％以上。也就是說，剛遷過去一年多時間，專注於生產 iPhone 12 機型的富士康，也遭

實習週記（三）：學了一半的spring security，看了一遍的swagger，不太熟悉的定時與郵件

SpringSecurity 提供了一套Web應用安全性的完整解決方案使用者認證驗證某個使用者是否為系統中的合法主體，通俗意義上為系統驗證使用者是否能夠登入

BCI：11 月首周小米手機市場份額達到了 18.6%，僅次於蘋果位居第二位

11 月 16 日訊息，市場研究機構 BCI 於 11 月 13 日公佈了 11 月首週中國智慧手機銷量資料。本週小米銷量為 127.7 萬臺，市場份額達到了 18.6%，僅次於蘋果位居第二。根據小米雙 11 戰報，該品牌在 11 月 1-11 日獲

聯想拯救者官方詳解：Y90 / Y700 的領域新功能都在這裡了

2 月 16 日訊息，拯救者電競手機和電競平板使用者可能對於“拯救者領域”不算陌生，這是聯想拯救者手機的專屬遊戲入口和功能聚合中心，可以讓玩家獲得更沉浸式的遊戲體驗。在拯救者領域中，我們可以在進入遊戲前進行

python 使用opencv 把視訊分割成圖片示例

我就廢話不多說了，直接上程式碼吧！ #--coding:utf-8-- import cv2 #影象路徑名字錯誤不提示

Python操作Excel把資料分給sheet

需求：根據country列的不同值，將內容分到不同sheet 方法一：讀取原Excel，根據country列將不同的內容放到不同的sheet，並根據國家名稱命名，將結果放到新的輸出檔案中。

Python：模組（二）

一、jsonpath 用來解析多層巢狀的json資料;JsonPath 是一種資訊抽取類庫，是從JSON文件中抽取指定資訊的工具，提供多種語言實現版本。

前端科普系列（4）：Babel —— 把 ES6 送上天的通天塔

本文首發於 vivo網際網路技術微信公眾號連結： https://mp.weixin.qq.com/s/plJewhUd0xDXh3Ce4CGpHg作者：Morrain

Python：函式基礎

Blog：https://www.cnblogs.com/Rohn 目錄函式基礎函式的作用函式的定義函式的呼叫如何呼叫呼叫規則函式的返回值什麼時候需要有返回值？什麼時候不需要有返回值？多個返回值丟棄返回值函式呼叫時的*和**函式的引數

Python：介面框架：資料驅動和程式碼驅動

驅動：1、資料驅動：用例是通過資料驅動的;比如python檔案需要從yaml檔案裡取資料，沒有yaml檔案就執行不了py檔案2、程式碼驅動：用例是通過程式碼實現的，沒有資料檔案例一：資料驅動：import unittestimport ddtim

Python：晚上把附近的足浴店都給爬了一遍，好兄弟真不錯

相關推薦