使用bs4爬蟲當前網頁，並下載網頁資料

阿新 • • 發佈：2020-12-08

需求：

"""獲取所有的職業資訊，並以崗位、公司、地區、薪資格式來分別顯示資料"""


# 匯入需要的庫或包
import bs4,csv 
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

# 喚起chrome瀏覽器
browser = webdriver.Chrome()
browser.get('https://www.zhipin.com/')
browser.implicitly_wait(10)

# 輸入關鍵詞搜尋
check_ele = browser.find_element_by_css_selector('.ipt-search')
check_ele.send_keys('python開發工程師')
# 回車
check_ele.send_keys(Keys.ENTER)

# 資訊提取
info = []

def get_info(html):
    soup = BeautifulSoup(html, 'lxml')
    job_primary = soup.select_one('#main').select('.job-primary')
    # print(type(job_primary))
    for job in job_primary:
        if isinstance(job, bs4.element.Tag):
            job_name = job.select_one('.job-name').text
            job_area = job.select_one('.job-area').text
            job_limit = job.select_one('.red').text
            company_name = job.select_one('.company-text').select_one('.name').text
            sub_info = [job_name, job_area, job_limit, company_name]
            info.append(sub_info)
# 儲存資料
def save_data(data):
    with open('../job_info.csv', 'w', newline='', encoding='utf-8') as f:
        writer = csv.writer(f)
        writer.writerow(['崗位名稱', '工作區域', '薪資', '公司名稱'])
        for a in data:
            print(a)
            writer.writerow(a)
# 呼叫 資訊提取 & 儲存資料 ，關閉瀏覽器
get_info(browser.page_source)
save_data(info)
browser.close()

使用bs4爬蟲當前網頁，並下載網頁資料

需求： \"\"\"獲取所有的職業資訊，並以崗位、公司、地區、薪資格式來分別顯示資料\"\"\"

php抓取網頁body內容，並過濾網頁標籤

php只抓取網頁文字內容，並過濾其標籤，說幹就幹，開始！ <?php function curl_request ( $url , $post = \'\' , $cookie = \'\' ,$returnCookie = 0 ) {

Java抓取網頁圖片並下載到本地（HTTP）

直接上程式碼： package com.clzhang.sample.net; import java.io.File; import java.io.FileOutputStream;

初學python爬蟲，爬取“豆瓣電影 Top 250”相關資訊，並下載電影封面

注：所學的視訊教程：B站Python爬蟲基礎5天速成（2021全新合集）Python入門+資料視覺化

java.net.*爬取網頁，Jsoup解析網頁內容

java.net.* 建立網路連線 Jsoup解析網頁內容 package com.sun.util; import java.io.BufferedReader;

JS獲取當前日期，並將其格式化為 YYYY-MM-DD

相關程式碼： var myDate = new Date(); myDate.getYear();//獲取當前年份(2位) myDate.getFullYear();//獲取完整的年份(4位,1970-????)

獲取當前時間，並將其轉換成Date格式

技術標籤：其它 public boolean addComment(Comment comment) { //先建立一個空的Date物件 Date date=new Date();

使用 qrcode.react 繪製二維碼，並下載二維碼

/** * 將svg匯出成圖片 * @param node svg節點 => document.querySelector(\'svg\') * @param name 生成的圖片名稱

scrapy爬取網站，並下載照片

scrapy爬取網站，並下載照片 items中定義實體 spider中編寫爬取邏輯 settings開啟一系列東西，

向資料庫中插入一條新的資料，並返回新增資料的ID

解決方案：在編寫Mapper時，加入以下配置Mybatis 配置檔案 useGeneratedKeys 引數只針對 insert 語句生效，預設為 false。當設定為 true 時，表示如果插入的表以自增列為主鍵，則允許 JDBC 支援自動生成主

通過Openssl提供FTP+SSL/TLS認證功能，並實現安全資料傳輸

注：通過筆者”FTP伺服器工作原理及如何通過PAM認證實現虛擬使用者登入“博文，我們瞭解到FTP是一種檔案共享協議，而且使用的是明文傳輸機制，所以在網際網路上傳輸使用者和密碼是不安全的，所以要採用S

直接從國家統計局上找資料，並分析人口資料變化，做成視覺化圖

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

原生sql 查詢返回一個實體_python連線SQLServer執行給定的查詢SQL語句，並返回結果資料...

技術標籤：原生sql 查詢返回一個實體今天寫這篇文章的初衷就是在我昨天發表的文章《Python連線SQLServer資料庫執行增刪改查操作》後，一些讀者反饋說跟Python完全沒有關係，這裡我想說的是：內容的確是與Pytho

【JQuery外掛】把網頁或某div或table表格內容轉為圖片並下載

今天介紹一個非常好用的JQuery外掛，它可以把網頁或某個div或table表格內容轉為圖片並下載儲存。這個外掛叫html2canvas，它只有一個js檔案html2canvas.js，而使用起來也非常簡單。

Python selenium如何打包靜態網頁並下載

需求：單純的將page.source寫入檔案的方式，會導致一些圖片無法顯示，對於google瀏覽器，直接將頁面打包下載成一個mhtml格式的檔案，則可以進行離線下載。對應python selenium 微信公眾號歷史文章隨手一點就返回首頁

Java 根據網路URL獲取該網頁上面所有的img標籤並下載圖片

說明：根據網路URL獲取該網頁上面所有的img標籤並下載符合要求的所有圖片所需jar包：jsoup.jar

Python爬蟲進階之爬取某視訊並下載，沒有廣告的視訊看起來不爽嗎？

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

ext js 選擇本地路徑_使用node爬取網頁上的圖片，並儲存在本地目錄

技術標籤：ext js 選擇本地路徑專案需求使用NodeJS爬取指定網頁上的圖片，並將其儲存在本地目錄裡。

微軟將改進 Win11 應用商店搜尋演算法，並支援瀏覽器網頁端安裝應用

6 月 30 日訊息6 月 24 日，微軟揭開了 Win11 的神祕面紗，帶來了一系列新改進。除了花哨的新系統介面，另一個重要的改進是微軟商店。

【網路爬蟲學習】實戰，爬取網頁以及貼吧資料

實戰一抓取您想要的網頁，並將其儲存至本地計算機。首先我們對要編寫的爬蟲程式進行簡單地分析，該程式可分為以下三個部分：

使用bs4爬蟲當前網頁，並下載網頁資料

相關推薦