selenium 爬取某基金網站資料

阿新 • • 發佈：2019-02-07

# coding: utf-8
from selenium import webdriver
import time

driver = webdriver.Chrome()

driver.get(
    'http://fund.eastmoney.com/data/fundranking.html#tall;c0;r;szzf;pn100;ddesc;qsd20170531;qed20180531;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb')
i = 1
while i < 41:
    i = i + 1
    driver.find_element_by_xpath('//label[@value={}]'.format(i)).click()
    time.sleep(5)
    trs = driver.find_elements_by_xpath('//table[@id="dbtable"]//tr')
    for tr in trs:
        ths = tr.find_elements_by_xpath('./td')
        with open('foundation.csv', 'a', encoding='utf-8') as f:
            for th in ths:
                f.write(th.text.replace('\n', '\r\r') + ',' if th.text else '')
            f.write('\n')
        print('儲存成功')

這個網站的基金資料是jQuery請求返回的，然後通過渲染到頁面上，請求下一頁也是ajax請求進行區域性重新整理，

但是，這個ajax返回的資料是類似於js指令碼的格式，不好直接提取，因此採用的selenium模擬點選的方式，

點選下一頁按鈕，直到沒有最後一頁，通過xpath提取頁面的資料，存入csv檔案中，方便在excle或者pandas分析。

selenium 爬取某基金網站資料

# coding: utf-8 from selenium import webdriver import time driver = webdriver.Chrome() driver.get( 'http://fund.eastmoney.com/data/f

生產者消費者模型爬取某金融網站資料！Python無所不爬！

那麼這個模型和爬蟲有什麼關係呢？其實，爬蟲可以認為是一個生產者，它不斷從網站爬取資料，爬取到的資料就是食物；而所得資料需要消費者進行資料清洗，把有用的資料吸收掉，把無用的資料丟棄。以上便是對生產者消費者模型的簡單介紹了，下面針對本次爬取任務予以詳細說明。分析站點http://www.cfachina.org/

java爬取某電影網站資料

使用jsoup獲取動態網站的資料部分程式碼： /** * 獲取分類的所有相對連結地址和名稱，儲存到map中，返回資料 * */ public class GetMoviesName { private String url; H

批量爬取某圖片網站的圖片

批量爬取某圖片網站的圖片宣告：僅用於爬蟲學習，禁止用於商業用途謀取利益 1、網頁解析（1）開啟veer首頁，F12(谷歌瀏覽器)，輸入關鍵字，點選搜尋，點選檢視如圖畫圈位置（2）檢視search中的Headers，找到請求的URL和請求的paylo

python 3 爬取某小說網站小說，註釋詳細

每一行都有註釋，不多解釋了 import requests from bs4 import BeautifulSoup import os if __name__ == '__main__': # 要下載的網頁 url = 'https://www.b

使用selenium爬取機構化的資料及過程中遇到的問題總結

pattern = r'<div class="l-grid-row-cell-inner" style="width:112px;height:22px;min-height:22px; ">(.*?)</div>.*?<div class="l-grid-row-ce

用Python Scrapy爬取某電影網站並存儲入mysql

爬取目標：javlib，使用框架Scrapy 首先使用在命令列裡scrapy startproject projectname和scrapy genspider spidername指令建立爬蟲。首先定義items.pyimport scrapy class Av

用python爬取某視訊網站彈幕

文章以bilibili的《變態王子與不笑貓》（這是一部正常的日漫，請放心觀看）為例，爬取該番劇下所有視訊的彈幕。困難的地方主要在尋找視訊的cid上，確實花了點時間，最好找到了也有點恍然大悟，再就是請求彈幕的連結地址，也需要去所有請求裡找，耐心很重要。最後，採用多執行緒

爬取某招聘網站的招聘資訊（獵聘）

這該找工作了，俗話說的胡奧，金九銀十嘛。一個一個招聘資訊找著看，有點麻煩。所以心動了下，不如把我想找的資訊都爬取下來，直接sql語句查詢所有相關資訊，多方便，是吧~ 注：如果start-urls只設置一個的話，那麼只會爬取等於或者小於40條資料

Python3.7爬蟲大量爬取某小說網站小說並寫入mysql(持續完善中...) 未解決問題:mysql長時間新增超過百萬條數據表鎖甚至崩潰

oot req val page src sele 爬蟲 use uwa 練手之作代碼中還有很多問題持續完善中渣渣阿裏T5 99包郵服務器只開了6個進程 #encoding:utf-8 import requests # 請求 from lxml import

程式設計師的福利：使用WebCollector爬取某美女網站上的圖片

程式設計師的福利：使用WebCollector爬取某美女網站上的圖片 0x00 需求某網站，有海量美女圖片，裡面預設是按美女的英文名字（A-Z）排序的。估算了一下，至少也得有3000+位美女照片，每位的照片數目從幾十張到幾百張不等。瀏覽了幾天，才瀏覽了很少的一部分。心想，

Python selenium 爬取天天基金網股票型基金

對於股票市場長期的判斷，普通上班族沒有多少時間和資料可以分析。那麼，就應該藉助基金機構選擇的股票來分析，藉助各基金經理管理的股票基金來統計，哪些股票是基金經理或團隊分析購買的。所以選擇的是股票型基金，最終將分析得出哪類股票是機構最多選擇的，那隻股票是機構購買最多的。利用基金

HtmlUnit java爬蟲入門真實案例講解爬取電商網站資料

最近利用空閒時間幫朋友做了個爬取幾個電商網站的資料的小程式使用的是htmlUnit 自我感覺htmlUnit爬取的速度和穩定性還是很不錯的所以寫一篇博文介紹下htmlUnit的使用相關也算記錄一下這是該網站的主頁面具體的思路是獲取商品所在的div 通過div獲

使用selenium爬取網站動態資料

處理頁面動態載入的爬取 selenium selenium是python的一個第三方庫，可以實現讓瀏覽器完成自動化的操作，比如說點選按鈕拖動滾輪等環境搭建：安裝:pip install selenium 獲取瀏覽器的驅動程式：下載地址http://chromedrive

scrapy結合selenium爬取淘寶等動態網站

ice 網站 -i war 原因 def exe imp span 1.首先創建爬蟲項目 2.進入爬蟲 class TaobaoSpider(scrapy.Spider): name = ‘taobao‘ allowed_domains = [‘taobao.c

python 爬取新浪網站 NBA球員最近2個賽季庫裡前20場資料

1. 分析新浪網站中球員資料的獲取方式(F12 開發者模式，除錯網頁)：一般網站儲存資料的方式分為2種：1. 靜態網頁儲存；2. 動態請求；對於靜態網頁儲存來說，就是開啟瀏覽器中檢視原始碼，就可以從原始碼中獲取所需要的資料；對於動態請求來說，採用F12的開發者模式中，才能從伺服器的

Python3+Selenium爬取動態網頁資料

背景：有時候想獲取網頁的資訊，然後下載裡面的圖片資料等等遇到的問題：有時一些網頁是動態的，一些內容是通過js非同步拉取，甚至拉取時間是懶載入的，例如滾動到元素位置的時候才載入解決方案：這個時候就需要Selenium神器了 Selenium 是什麼？一句話

一起學爬蟲——如何爬取通過ajax載入資料的網站

目前很多網站都使用ajax技術動態載入資料，和常規的網站不一樣，資料時動態載入的，如果我們使用常規的方法爬取網頁，得到的只是一堆html程式碼，沒有任何的資料。請看下面的程式碼： url = 'https://www.toutiao.com/search/?keyword=美女' headers = {

Eclipse使用Java Selenium抓取眾籌網站的資料

Selenium簡介百度百科 Selenium 是一個用於Web應用程式測試的工具。Selenium測試直接執行在瀏覽器中，就像真正的使用者在操作一樣。支援的瀏覽器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Go

python+selenium——爬取網站

#coding:utf-8 import re import xlrd import xlwt import time import pandas as pds from selenium import webdriver from selenium.common.exception

selenium 爬取某基金網站資料

相關推薦