前程無憂網站爬取

阿新 • • 發佈：2021-01-10

爬取前程無憂網站寫入excel

from urllib.request import urlopen,Request
from bs4 import BeautifulSoup
import json
import xlwt
lentitles=[]
job_href=[]
company_name=[]
providesalary_text=[]
workarea_text=[]
jobwelf=[]
companyind_text=[]
careerinfo=[]

workbook=xlwt.Workbook(encoding='utf-8')
worksheet=workbook.add_sheet( 
'hzh zhaping wb')
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36'}
def updateurl(url,headers):
    ret = Request(url, headers=headers)
    html = urlopen(ret)
    bs = BeautifulSoup(html, "html.parser")
    return 
 bs

for link in range(1,2):
    url="https://search.51job.com/list/080200,000000,0000,00,9,99,%25E5%25A4%25A7%25E6%2595%25B0%25E6%258D%25AE,2,{}.html?lang=c&postchannel=0000&workyear=99&cotype=99&degreefrom=99&jobterm=99&companysize=99&ord_field=0&dibiaoid=0&line=&welfare=".format 
(link)
    bs = updateurl(url, headers)
    info=bs.find_all('script',{"type":"text/javascript"})
    def get_V(dct,key):
        return dct[key] if key in dct else 'none'

    for x in info:
        t=x.get_text()
        if len(t)>0:
            t=t.replace("window.__SEARCH_RESULT__ = ","")
        # print(t)
            jsonobj = json.loads(t)

    for i in jsonobj['engine_search_result']:
        job_name=get_V(i,'job_name')
        lentitles.append(job_name)
        # print(lentitles)

        job_href1 = get_V(i, 'job_href')
        job_href.append(job_href1)
        # print(job_href1)
        take=updateurl(job_href1,headers)

        job_href2=take.find_all('div',class_='bmsg job_msg inbox')
        for kk in job_href2:
            try:
                careerinfo.append(kk.get_text())
            except:
                careerinfo.append('')

        company_name1 = (get_V(i, 'company_name'))
        company_name.append(company_name1)
        # print(company_name)
        providesalary_text1 = (get_V(i, 'providesalary_text'))
        providesalary_text.append(providesalary_text1)

        workarea_text1 = (get_V(i, 'workarea_text'))
        workarea_text.append(workarea_text1)

        jobwelf1 = (get_V(i, 'jobwelf'))
        jobwelf.append(jobwelf1)

        companyind_text1 = (get_V(i, 'companyind_text'))
        companyind_text.append(companyind_text1)
# print(len(careerinfo))
# print(len(lentitles))
# print(careerinfo)
careerinfo.append('')
# print(len(careerinfo))
        # print(job_href1)
worksheet.write(0,0,label='職位名稱')
worksheet.write(0,1,label='職業網址')
worksheet.write(0,2,label='公司名字')
worksheet.write(0,3,label='薪資福利')
worksheet.write(0,4,label='工作地址')
worksheet.write(0,5,label='工作福利')
worksheet.write(0,6,label='公司前景')
worksheet.write(0,7,label='職業資訊')
for i in range(1,len(lentitles)):
        worksheet.write(i, 0, label=lentitles[i])
        worksheet.write(i, 1, label=job_href[i])
        worksheet.write(i, 2, label=company_name[i])
        worksheet.write(i, 3, label=providesalary_text[i])
        worksheet.write(i, 4, label=workarea_text[i])
        worksheet.write(i, 5, label=jobwelf[i])
        worksheet.write(i, 6, label=companyind_text[i])
        worksheet.write(i, 7,label=careerinfo[i])
workbook.save('hzh_sevse.xls')

前程無憂網站爬取

爬取前程無憂網站寫入excel from urllib.request import urlopen,Request from bs4 import BeautifulSoup

前程無憂職位資訊爬取

技術標籤：pythonpython 前程無憂職位資訊爬取 # coding=UTF-8 from urllib.request import urlopen, Request

Python爬取前程無憂職位資訊

一、選題背景剛畢業往往會為自己不知道每個職位之間各種待遇的差異而迷茫,所以為了瞭解畢業後職位的待遇等方面做多種參考，貨比三家。

前程無憂崗位資料爬取+Tableau視覺化分析

一、專案背景隨著科技的不斷進步與發展，資料呈現爆發式的增長，各行各業對於資料的依賴越來越強，與資料打交道在所難免，而社會對於“資料”方面的人才需求也在不斷增大。因此瞭解當下企業究竟需要招聘什麼樣的人

315 晚會曝光智聯招聘/前程無憂/獵聘網等平臺：個人簡歷資訊被肆意販賣

3月15日訊息一年一度的央視財經 3.15 晚會正在進行中，剛剛第二彈曝光了 “伸向個人簡歷的黑手”。

前程無憂：安全管理和資訊保護面臨諸多不足，感謝媒體監督和批評

3 月 16 日訊息昨晚央視 3·15 晚會點名智聯招聘、前程無憂和獵聘等求職應用洩露求職者簡歷。對此，前程無憂釋出宣告表示，高度重視並深刻地意識到求職簡歷的安全管理和資訊保護仍然面臨諸多不足。感謝央視和各界媒

被央視 315 點名，智聯招聘、前程無憂、獵聘等已被華為 / 小米 / OPPO/vivo 等應用商店下架

3月16日訊息據央視財經報道，昨晚 315 晚會上點名曝光，智聯招聘獵聘平臺大量簡歷流向黑市，知名招聘平臺簡歷給錢隨意下載，有人硬盤裡存 700 萬條。獲悉，目前，華為、小米、OPPO、vivo 等應用商店已經下架了智聯招

前程無憂擲 20 億元在上海購買新總部大樓

北京時間 7 月 22 日晚間訊息，前程無憂今日宣佈，已達成一項協議，在上海購買一座辦公樓，作為公司的新總部。

訊息稱前程無憂收購方降低報價，此前報價 57 億美元

北京時間 1 月 12 日晚間訊息，據報道，知情人士透露，計劃購買中國人力資源公司前程無憂的私募股權投資財團正在討論下調其報價。據報道，此前該收購報價為 57 億美元。該不願具名的人士稱，由德弘資本牽頭的這個投資

訊息稱有財團擬 40 億美元收購前程無憂，後者股價盤前漲超 10%

3 月 1 日訊息，訊息稱有財團擬 40 億美元收購前程無憂，美股盤前，前程無憂漲超 10%。資料顯示，前程無憂成立於 1998 年，2004 年 9 月登陸納斯達克掛牌上市，成為首家在美國納斯達克上市的中國人力資源服務企業。據

前程無憂：已簽訂私有化交易協議，交易價 43 億美元

3 月 1 日訊息，前程無憂宣佈已簽訂與 Garnet Faith Limited 的合併協議。根據經修訂的合併協議，交易中前程無憂的股權價值為約 43 億美元。此次合併目前預計將於 2022 年上半年完成。瞭解到，前程無憂成立於 1998

Java爬取網站原始碼和連結程式碼例項

1. 網路爬蟲是一個自動提取網頁的程式，它為搜尋引擎從全球資訊網上下載網頁，是搜尋引擎的重要組成。傳統爬蟲從一個或若干初始網頁的URL開始，獲得初始網頁上的URL，在抓取網頁的過程中，不斷從當前頁面上抽取新的U

python爬蟲爬取筆趣網小說網站過程圖解

首先：文章用到的解析庫介紹 BeautifulSoup： Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。

python爬蟲爬取幽默笑話網站

爬取網站為：http://xiaohua.zol.com.cn/youmo/ 檢視網頁機構，爬取笑話內容時存在如下問題：

Python3 實現爬取網站下所有URL方式

獲取首頁元素資訊：目標 test_URL：http://www.xxx.com.cn/ 首先檢查元素，a 標籤下是我們需要爬取得連結，通過獲取連結路徑，定位出我們需要的資訊

Python基於requests庫爬取網站資訊

requests庫是一個簡介且簡單的處理HTTP請求的第三方庫 get()是獲取網頁最常用的方式，其基本使用方式如下

SpringBoot中使用Jsoup爬取網站資料的方法

爬取資料匯入jar包 <properties> <java.version>1.8</java.version> <elasticsearch.version>7.6.1</elasticsearch.version>

爬取求職網站的相關資訊

程式碼如下： import requests import openpyxl import time from bs4 import BeautifulSoup #用於解析和提取網頁資料的

python爬蟲使用正則爬取網站的實現

本文章的所有程式碼和相關文章，僅用於經驗技術交流分享，禁止將相關技術應用到不正當途徑，濫用技術產生的風險與本人無關。

實用python爬取妹子圖網站圖片

參考自: https://gitee.com/52itstyle/Python/blob/master/Day01/%E8%84%9A%E6%9C%AC/%20mzitu_win.py 注: 未成年請在家長的陪同下使用該指令碼與訪問該網站

前程無憂網站爬取

爬取前程無憂網站 寫入excel

相關推薦

爬取前程無憂網站寫入excel