同樣是在招聘資訊凌亂的網站上找工作，同學的騷操作把我給整蒙了

阿新 • • 發佈：2020-07-09

前言

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

作者：Python進階者

現在在疫情階段，想找一份不錯的工作變得更為困難，很多人會選擇去網上看招聘資訊。可是招聘資訊有一些是錯綜複雜的。而且不能把全部的資訊全部羅列出來，以外賣的58招聘網站來看，資料整理的不清晰。

專案目標

獲取招聘資訊，並批量把地點、公司名、工資、下載儲存在txt文件。

專案準備

軟體：PyCharm

需要的庫：requests、lxml、fake_useragent

網站如下：

https://gz.58.com/job/pn2/?param7503=1&from=yjz2_zhaopin&PGTID=0d302408-0000-3efd-48f6-ff64d26b4b1c&ClickID={}

點選下一頁時，ClickID={}每增加一頁自增加1，用{}代替變換的變數，再用for迴圈遍歷這網址，實現多個網址請求。

反爬措施

該網站上的反爬主要有兩點：

1、直接使用requests庫，在不設定任何header的情況下，網站直接不返回資料

2、同一個ip連續訪問多次，直接封掉ip，起初我的ip就是這樣被封掉的。

為了解決這兩個問題，最後經過研究，使用以下方法，可以有效解決。

1、獲取正常的 http請求頭，並在requests請求時設定這些常規的http請求頭。

2、使用 fake_useragent ，產生隨機的UserAgent進行訪問。

專案實現

1、定義一個class類繼承object，定義init方法繼承self，主函式main繼承self。匯入需要的庫和網址，程式碼如下所示。

import requests
from lxml import etree
from fake_useragent import UserAgent


class  Zhaopin(object):
    def __init__(self):
        self.url = "https://gz.58.com/job/pn2/?param7503=1&from=yjz2_zhaopin&PGTID=0d302408-0000-3efd-48f6-ff64d26b4b1c&ClickID={}"  # /zhuanchang/:搜尋的名字的拼音縮寫

    def main(self):
        pass

if __name__ == '__main__':
    Spider =  Zhaopin()
    Spider.main()

2、隨機產生UserAgent。

  for l in one:
    o = l.xpath('.//a/span[1]/text()')[0].strip()
    t = l.xpath('.//a//span[@class="name"]/text()')[0].strip()
    f = l.xpath('.//p[@class="job_salary"]/text()')
    thr = l.xpath('.//div[@class="comp_name"]//a/text()')[0].strip()
    for e in f:
        boss = '''

 %s:||%s: 
 公司：%s,
 工資：%s元/月
 =========================================================
                                ''' % (o, t, thr, e)
    print(str(boss)

3、傳送請求，獲取響應, 頁面回撥，方便下次請求。

def get_page(self, url):
    res = requests.get(url=url, headers=self.headers)
    html = res.content.decode("utf-8")
    return html

4、xpath解析找到對應的父節點。

def page_page(self, html):
    parse_html = etree.HTML(html)
    one = parse_html.xpath('//div[@class="main clearfix"]//div[@class="leftCon"]/ul/li')

5、for遍歷，定義一個變數food_info儲存，獲取到二級頁面對應的菜名、原料、下載連結。

  for l in one:
    o = l.xpath('.//a/span[1]/text()')[0].strip()
    t = l.xpath('.//a//span[@class="name"]/text()')[0].strip()
    f = l.xpath('.//p[@class="job_salary"]/text()')
    thr = l.xpath('.//div[@class="comp_name"]//a/text()')[0].strip()
    for e in f:
        boss = '''

 %s:||%s: 
 公司：%s,
 工資：%s元/月
 =========================================================
                                ''' % (o, t, thr, e)
    print(str(boss)

6、將結果儲存在txt文件中，如下所示。

f = open('g.txt', 'a', encoding='utf-8')  # 以'w'方式開啟檔案
f.write(str(boss))
# print(house_dict)
f.write("\n")  # 鍵和值分行放，鍵在單數行，值在雙數行
f.close()

7、呼叫方法，實現功能。

html = self.get_page(url)
self.page_page(html)

效果展示

1、點選綠色小三角執行輸入起始頁，終止頁。

2、執行程式後，結果顯示在控制檯，如下圖所示。

3、儲存txt文件到本地，如下圖所示。

4、雙擊檔案，內容如下圖所示。

同樣是在招聘資訊凌亂的網站上找工作，同學的騷操作把我給整蒙了

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

直接從國家統計局上找資料，並分析人口資料變化，做成視覺化圖

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

“找工作，我要和老闆談”涉嫌廣告欺詐？BOSS 直聘客服：HR 也是 BOSS 的一員

4 月 23 日上午訊息，有網友在微博發文質疑 BOSS 直聘的廣告語“找工作，我要和老闆談”涉嫌廣告欺詐，該網友表示不是直接跟老闆談嗎，怎麼還是跟人力談？並表示 BOSS 直聘做不到就不要打這個廣告詞。

課得軟體 | 職場小白找工作，是薪資重要還是去到適應的環境重要？

如今，我已經做著第三份工作了，之前兩份工作一次是我主動辭職，另一次則是被單位解僱，這次被解僱的經歷讓我終身難忘。每次想起這件事兒，都會有一股羞愧與羞恥感湧上心頭。本文，我將詳細講述整個過程。

使用Vue.extend實現iview Upload在單檔案上傳時，拖拽多個檔案給出錯誤提示

1. 擴充套件Select元件，註冊新的元件（global-components.js檔案中進行） import Vue from \'vue\';

“知乎評論區崩了”登上熱搜，網友：以為是自己的網路壞了

8 月 24 日訊息今日有多個網友反饋稱，知乎評論區無法留言，能看到回答但是看不到評論，而且切換網路也無法解決。

“蘋果 iPhone 13 拍照翻車自帶炫屏”上熱搜，網友：沒想到我也“中獎”了

10 月 12 日訊息，蘋果在 9 月 15 日的秋季釋出會上推出了 iPhone 13 系列等新品。該手機於 9 月 24 日正式開售，目前已經有很多人用上了 iPhone 13 系列手機。今日，多位網友稱，自己的 iPhone 13 拍照有問題，開啟

亞洲遊戲行業遭遇史上最大黑客 DDoS 攻擊，峰值達 3.74Tbps，微軟：我給扛下來了

感謝網友 AMD引領未來的線索投遞！

自學 Python 到什麼程度能找到工作，1300+ 條招聘資訊告訴你答案

隨著移動網際網路的發展以及機器學習等熱門領域帶給人們的衝擊，讓越來越多的人接觸並開始學習 Python。無論你是是科班出身還是非科班轉行，Python 無疑都是非常適合你入門計算機世界的第一門語言，其語法非常簡潔，

任天堂釋出招聘資訊崗位不限工作經驗

今日，任天堂在官網釋出招聘資訊，接受截止到2023年3月從技術學院、職業學校、大專、大學和研究生院畢業未滿三年的人員，不限工作經驗。招聘崗位包括科學與工程、系統設計、音響系統、生產計劃系統、辦公室等。主要工

同樣的SQL語句在查詢分析器執行很快，但是網站上執行超時的詭異問題

同樣的SQL語句在查詢分析器執行很快，但是網站上執行超時，這個問題以前遇到過，解決辦法是重新啟動伺服器，但過一段時間後（時間長短不一定，一般為一天後），這次又出現了，不能總是重新啟動伺服器了事吧，

JS指令碼實現定時到網站上籤到/簽退功能

之前介紹過使用temperMonkey遮蔽CSDN廣告的方法，主要就是要針對性地分析網站結構，然後用程式碼去改變或者操作DOM。今天也一樣，我們需要觀察網頁結構，找到我們要操作的按鈕，觸發他的click事件就可以了。下面以公

win10在網站上傳圖片總顯示照片太大如何解決

現在很多網站對上傳圖片都有格式要求了，太大太小都不行，必須壓縮後才可以。想必很多小夥伴都遇到win10在網站上傳圖片總顯示太大了的問題，又不懂怎麼用ps軟體，有沒有什麼其他簡單方法？今天小編和大家分享一款簡單

win10系統下怎麼在第二個顯示器上禁用工作列

在win10系統中，很多使用者都喜歡使用雙屏功能，通常會使用第二個螢幕來呈現一些東西，如果您要呈現某些內容，工作列完全沒必要，那麼win10系統下怎麼在第二個顯示器上禁用工作列呢？具體步驟如下。

當你忘記網站上的密碼時怎麼辦？Python如何快速幫你找回？

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

Python爬蟲例項——scrapy框架爬取拉勾網招聘資訊

本文例項為爬取拉勾網上的python相關的職位資訊,這些資訊在職位詳情頁上,如職位名,薪資,公司名等等.

LeetCode演算法題編號891“子序列寬度之和”演算法分析和解題思路在前兩篇隨筆中（在找工作的途中）

我在研究該演算法題的時候是先經過最笨的方法，然後慢慢優化得到計算量相對較少的演算法。在研究該演算法中斷斷續續的花了10個小時吧，基本都是晚上思考，白天為找工作準備。晚上思考演算法並進行程式碼實現。

找出一個二維陣列中的鞍點，即該位置上的元素在該行上最大，在該列上最小，也可能沒有鞍點

找工作的你不容錯過的45個PHP面試題附答案（下篇）

找工作的你不容錯過的45個PHP面試題附答案（上篇） Q28：你將如何使用PHP建立Singleton類？

python 爬取位元組內推招聘資訊

　　今天收到一個任務，用 python 爬取招聘網站資訊。招聘網址是這個：https://job.toutiao.com/s/JNcJSRo。開啟之後自動跳轉到了這裡：https://job.bytedance.com/referral/pc/position?token=MzsxNTk0NDQzMDMxOTkz

同樣是在招聘資訊凌亂的網站上找工作，同學的騷操作把我給整蒙了

2、隨機產生UserAgent。

3、傳送請求，獲取響應, 頁面回撥，方便下次請求。

4、xpath解析找到對應的父節點。

5、for遍歷，定義一個變數food_info儲存，獲取到二級頁面對應的菜 名、 原料 、下載連結。

6、將結果儲存在txt文件中，如下所示。

7、呼叫方法，實現功能。

相關推薦

5、for遍歷，定義一個變數food_info儲存，獲取到二級頁面對應的菜名、原料、下載連結。