爬取求職網站的相關資訊

阿新 • • 發佈：2020-08-01

程式碼如下：

import requests
import openpyxl
import time
from bs4 import BeautifulSoup #用於解析和提取網頁資料的
lst=[]#列表
def send_request(id,page):
    url = 'https://www.jobui.com/company/{0}/jobs/p{1}/'.format(id,page)
    headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.81 Safari/537.36 SE 2.X MetaSr 1.0 
'}  # 建立頭部資訊
    resp = requests.get(url, headers=headers)
    return resp.text
#進行資料的提取
def parse_html(html):
    bs=BeautifulSoup(html,'html.parser') #得到Bea--的物件了
    job_lst=bs.find_all('div',class_='c-job-list')#因為class是關鍵字，所以加一個下劃線
    for item in job_lst: #分別遍歷每一個職位資料
        name=item.find('h3 
').text#職位的名稱
        div_tag=item.find('div',class_='job-desc')
        span_tag=div_tag.find_all('span')
        url=item.find('a',class_='job-name')['href']#提取class樣式為job-name的a標籤，獲取屬性href的值
        lst.append([name,span_tag[0].text,span_tag[1].text,'https://www.jobui.com'+url])
#儲存excel
def save(lst):
    wk  
= openpyxl.Workbook()
    sheet = wk.active
    for item in lst:
        sheet.append(item)
    wk.save('招聘資訊.xlsx')
#啟動爬蟲程式
def start(id,pages):
    for page in range(1,pages+1):
        resp_data=send_request(id,page)
        parse_html(resp_data)
        time.sleep(2)
    save(lst)

if __name__=='__main__':
    id='10375749'
    pages=2
    start(id,pages)

執行結果：

爬取求職網站的相關資訊

程式碼如下： import requests import openpyxl import time from bs4 import BeautifulSoup #用於解析和提取網頁資料的

辦公自動化24-爬取CMB網站理財產品的基本資訊（產品程式碼、產品名稱、收益率、淨值）

#匯入包import re import time import pandas as pd import numpy as np from selenium import webdriver from selenium.webdriver.common.keys import Keys

python爬取12306網站獲取火車票資訊

利用requests傳送請求，prettytable表格輸出，需要安裝requests，prettytable python -m pip install requests

python3 實現爬取TOP500的音樂資訊並存儲到mongoDB資料庫中

爬取TOP500的音樂資訊，包括排名情況、歌曲名、歌曲時間。網頁版酷狗不能手動翻頁進行下一步的瀏覽，仔細觀察第一頁的URL：

Python進階之使用selenium爬取淘寶商品資訊功能示例

本文例項講述了Python進階之使用selenium爬取淘寶商品資訊功能。分享給大家供大家參考，具體如下：

Python通過正則庫爬取淘寶商品資訊程式碼例項

使用正則庫爬取淘寶商品的商品資訊，首先我們需要確定想要爬取的物件我們在淘寶裡搜尋“python”,出來的結果

使用Python爬取彈出視窗資訊的例項

此文僅當學習筆記用. 這個例項是在Python環境下如何爬取彈出視窗的內容,有些時候我們要在頁面中通過點選,然後在彈出視窗中才有我們要的資訊,所以平常用的方法也許不行.

Python爬取阿拉丁統計資訊過程圖解

背景目前專案在移動端上，首推使用微信小程式。各專案的小程式訪問資料有必要進行採集入庫，方便後續做統計分析。雖然阿拉丁後臺也提供了趨勢分析等功能，但一個個的獲取資料做資料分析是很痛苦的事情。通過將資料轉

Python利用Xpath選擇器爬取京東網商品資訊

HTML檔案其實就是由一組尖括號構成的標籤組織起來的，每一對尖括號形式一個標籤，標籤之間存在上下關係，形成標籤樹；XPath 使用路徑表示式在 XML 文件中選取節點。節點是通過沿著路徑或者 step 來選取的。

Python CSS選擇器爬取京東網商品資訊過程解析

CSS選擇器目前，除了官方文件之外，市面上及網路詳細介紹BeautifulSoup使用的技術書籍和部落格軟文並不多，而在這僅有的資料中介紹CSS選擇器的少之又少。在網路爬蟲的頁面解析中，CCS選擇器實際上是一把效率甚高的利

爬取京東商城商品資訊

0x01 基於chrome+selenium爬取京東商城8G記憶體條 from selenium import webdriver from selenium.webdriver import ActionChains #獲取屬性

python爬取12306的車次資訊

詳情檢視下面的程式碼：如果被識別就要新增一個cookie如果沒有被識別的話就要一個user—agent就好了。如果出現亂碼就設定編碼格式為utf-8

辦公自動化25-爬取CMB網站理財產品的投資報告並格式化輸出

# -*- coding: utf-8 -*- \"\"\" Created on Aug 5 2020 @author: lizitingxue \"\"\" #基礎包 import numpy as np

Python爬取豆瓣Top250電影資訊

1、爬取豆瓣Top250電影資訊以文字形式儲存資料：豆瓣電影 2、程式碼 import requests

python如何爬取動態網站

python有許多庫可以讓我們很方便地編寫網路爬蟲，爬取某些頁面，獲得有價值的資訊！但許多時候，爬蟲取到的頁面僅僅是一個靜態的頁面，即網頁的原始碼，就像在瀏覽器上的“檢視網頁原始碼”一樣。一些動態的東西如j

scrapy與selenium結合爬取資料(爬取動態網站)的示例程式碼

scrapy框架只能爬取靜態網站。如需爬取動態網站，需要結合著selenium進行js的渲染，才能獲取到動態載入的資料。

Python爬取素材網站3000多條音訊素材檔案

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

Request爬取各類網站的資料（例項爬取）

1. 先上程式碼 1 # !/usr/bin/env python 2 # ! _*_ coding:utf-8 _*_ 3 # @TIME: 2020/10/1213:29 4 # @Author : Noob

基於Python爬取素材網站音訊檔案

基本環境配置 python 3.6 pycharm requests parsel 相關模組pip安裝即可目標網頁請求網頁 import requests

爬取電影網站

code import time import sys,os import requests import shutil from selenium import webdriver from selenium.webdriver.common.keys import Keys

爬取求職網站的相關資訊

相關推薦