python爬蟲判斷招聘資訊是否存在的例項程式碼

阿新 • • 發佈：2020-11-23

在找工作的時候，我們會選擇上網查詢招聘的資訊，或者是通過一些招聘會進行現場面試。但由於資訊更新不及時，有一些崗位會出現下架的情況，如果我們不注意的話，可能就撲了空。在時間上耽誤了不說，面試的資訊也會受到一點點打擊。今天小編就教大家python爬蟲來判斷招聘資訊是否存在。

首先這裡需要一個判斷某條招聘是否還掛在網站上的方法，這個暫時想到了還沒弄，然後對於釋出時間在兩個月之前的資料，就不進行統計計算。

以下是完成程式碼：

{
  "_id" : ObjectId("5a30ad2068504386f47d9a4b"),"city" : "蘇州","companyShortName" : "藍海彤翔","companySize" : "100-499人","education" : "本科","financeStage" : "B輪","industryField" : "網際網路","level" : 3,"pid" : "11889834","positionLables" : [
    "PHP","ThinkPHP"
  ],"positionName" : "php研發工程師","salary" : {
    "avg" : 7500.0,"low" : 7000,"high" : 8000
  },"time" : "2017-06-06","updated_at" : "2017-12-13 18:31:15","workYear" : "1-3年","detail" : "1、處理landcloud雲端計算相關係統的各類開發和調研工作；2、處理coms高效能運算的各類開發和調研工作崗位要求：1、本科學歷，兩年以上工作經驗，熟悉PHP開發，瞭解常用的php開發技巧和框架；2、瞭解C++，python及Java開發；3、有一定的研發能力和鑽研精神；4、有主動溝通能力和吃苦耐勞的精神。","location" : "蘇州市高新區科技城錦峰路158號101park8幢"

例項擴充套件：

python爬蟲爬取騰訊招聘資訊（靜態爬蟲）

import requests
from bs4 import BeautifulSoup
from math import ceil

header = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML,like Gecko) Chrome/67.0.3396.99 Safari/537.36'}


# 獲取崗位頁數
def getJobPage(url):
  ret = requests.get(url,headers=header)
  ret.encoding = "utf-8" # 解決亂碼問題
  html = ret.text
  soup = BeautifulSoup(html,'html.parser')
  # 獲取崗位總數，< span class ="lightblue total" > 512 < / span >
  totalJob = soup.select('span[class="lightblue total"]')[0].text
  jobPage = ceil(int(totalJob) / 10)
  return jobPage


def getJobOrder(url):
  ret = requests.get(url,'html.parser')
  # 工作職責
  jobRequests = soup.select('ul[class="squareli"]')[0].text
  # 工作要求
  jobOrder = soup.select('ul[class="squareli"]')[1].text
  return jobRequests,jobOrder


# 獲取崗位資訊
def getJobInfo(url):
  myfile = open("tencent_job.txt","a",encoding='gb18030',errors='ignore') # 解決亂碼問題
  ret = requests.get(url,'html.parser')
  jobList = soup.find_all('tr',class_=['even','odd'])
  for job in jobList:
    # url
    jobUrl = "https://hr.tencent.com/" + job.select('td:nth-of-type(1) > a')[0]['href']
    # 職位名稱
    jobName = job.select('td:nth-of-type(1) > a')[0].text
    # 人數
    jobPeople = job.select('td:nth-of-type(3)')[0].text
    # 地點
    jobAddre = job.select('td:nth-of-type(4)')[0].text
    # 釋出時間
    jobTime = job.select('td:nth-of-type(5)')[0].text
    # 工作職責
    jobRequests = getJobOrder(jobUrl)[0]
    # 工作要求
    jobOrder = getJobOrder(jobUrl)[1]

    #print(jobName,jobUrl,jobAddre,jobPeople,jobTime,jobRequests,jobOrder)

    tt = jobName + " " + jobUrl + " " + jobAddre + " " + jobPeople + " " + jobTime + " " + jobRequests + " " + jobOrder
    myfile.write(tt + "\n")


if __name__ == '__main__':
  mainurl = 'https://hr.tencent.com/position.php?keywords=python'
  jobPage = getJobPage(mainurl)
  print(jobPage)
  for page in range(jobPage):
    pageUrl = 'https://hr.tencent.com/position.php?keywords=python&start=' + str(page * 10) + '#a'
    print("第" + str(page + 1) + "頁")
    getJobInfo(pageUrl)

到此這篇關於python爬蟲判斷招聘資訊是否存在的例項程式碼的文章就介紹到這了,更多相關python判斷招聘資訊的存在內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

python爬蟲判斷招聘資訊是否存在的例項程式碼

在找工作的時候，我們會選擇上網查詢招聘的資訊，或者是通過一些招聘會進行現場面試。但由於資訊更新不及時，有一些崗位會出現下架的情況，如果我們不注意的話，可能就撲了空。在時間上耽誤了不說，面試的資訊也會受

Python爬蟲爬取煎蛋網圖片程式碼例項

這篇文章主要介紹了Python爬蟲爬取煎蛋網圖片程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python爬蟲資料儲存到mongoDB的例項方法

爬蟲資料儲存到mongoDB的方法： importpymongo #首先需要注意，mongodb資料庫儲存的型別是以鍵值對型別進行儲存，所以在儲存以前一定要進行資料篩選

python爬蟲之Beautiful Soup基礎知識+例項

python爬蟲之Beautiful Soup基礎知識 Beautiful Soup是一個可以從HTML或XML檔案中提取資料的python庫。它能通過你喜歡的轉換器實現慣用的文件導航，查詢，修改文件的方式。

python爬蟲中PhantomJS載入頁面的例項方法

PhantomJS作為常用獲取頁面的工具之一，我們已經講過頁面測試、程式碼評估和捕獲螢幕這幾種使用的方式。當然最厲害的還是網頁方面的捕捉，這裡就不再講述了。今天我們要講的是它載入頁面的新方法，這個可能很多人不知

python爬蟲隨機裝置資訊生成模板

一.直接上上程式碼 import string import base64 import uuid import json import random import math class Mask(object):

python爬蟲用scrapy獲取影片的例項分析

我們平時生活的娛樂中，看電影是大部分小夥伴都喜歡的事情。周圍的人總會有意無意的在談論，有什麼影片上映，好不好看之類的話題，沒事的時候談論電影是非常不錯的話題。那麼，一些好看的影片如果不去電影院的話，在

python爬蟲中抓取指數的例項講解

有一些資料我們是沒法直觀的檢視的，需要通過抓取去獲得。聽到指數這個詞，有的小夥伴們覺得很複雜，似乎只在股票的時候才聽說的，比如一些資料的漲跌分析都是比較棘手的問題。不過指數對於我們的資料分析還是很有幫

爬取實習吧與python相關的招聘資訊及資料視覺化(含程式碼)

目錄資料爬取資料處理讀取檔案刪除無意義列刪除重複的值資料視覺化工資資訊視覺化城市資訊視覺化實習時間資訊視覺化 Jieba分詞對職位描述視覺化

MYSQL自定義函式判斷是否正整數的例項程式碼

可以寫一個函式：主要是使用正則來判斷。另外輸入字元是空的話，使用\"-\"來替換。

python通過elixir包操作mysql資料庫例項程式碼

本文研究的主要是python通過elixir包操作mysql資料庫的相關例項，具體如下。 python操作資料庫有很多方法，下面介紹elixir來操作資料庫。elixir是對sqlalchemy lib的一個封裝，classes和tables是一一對應的，能夠一步

python與sqlite3實現解密chrome cookie例項程式碼

本文研究的主要問題：有一個解密chrome cookie的事情，google出了程式碼，卻不能正常執行，原因在於sqlite3的版本太低，雖然我切換到了python3.5的環境，但sqlite3的版本也只有3.6。

python列印直角三角形與等腰三角形例項程式碼

前言本文通過示例給大家詳細介紹了關於python列印三角形的相關，分享出來供大家參考學習，下面話不多說了，來一起看看詳細的介紹吧

python畫微信表情符的例項程式碼

#@project = facepalm #@file = main #@author = Maoliang Ran #@create_time = 2018/8/28 22:57 import turtle # 畫指定的任意圓弧

Python連線Oracle之環境配置、例項程式碼及報錯解決方法詳解

Oracle Client 安裝 1、環境日期：2019年8月1日公司已經安裝好Oracle服務端 Windows版本：Windows10專業版

Python統計文字詞彙出現次數的例項程式碼

問題描述有時在遇到一個文字需要統計文字內詞彙的次數的時候，可以用一個簡單的python程式來實現。

Python爬蟲實現vip電影下載的示例程式碼

爬蟲目的實現對各大視訊網站vip電影的下載，因為第三方解析網站並沒有提供下載的渠道，因此想要實現電影的下載。

Python繪製全球疫情變化地圖的例項程式碼

目前全球疫情仍然比較嚴重，為了能清晰地看到疫情爆發以來至現在全球疫情的變化趨勢，我繪製了一張疫情變化地圖。廢話不多說，先上圖

Python實現七個基本演算法的例項程式碼

1.順序查詢當資料儲存在諸如列表的集合中時，我們說這些資料具有線性或順序關係。每個資料元素都儲存在相對於其他資料元素的位置。由於這些索引值是有序的，我們可以按順序訪問它們。這個過程產實現的搜尋即為順

使用Python畫了一棵聖誕樹的例項程式碼

分享給大家一篇文章，教你怎樣用Python畫了一棵聖誕樹，快來學習。如何用Python畫一個聖誕樹呢？

python爬蟲判斷招聘資訊是否存在的例項程式碼

相關推薦