爬取網易財經全部A股上市公司年報

阿新 • • 發佈：2019-02-13

首先要找到所有A股上市公司的股票程式碼，將東方財富網列表中所有的股票的程式碼（6位數字號）取下來

從網頁中找到我們要的資訊，儲存在字典中，寫入"stock_name.txt"檔案

# -*- coding: utf-8 -*-
"""
Created on Tue Oct  9 00:03:46 2018

@author: South
"""

import requests
import time
import sys
import json
import os 
def get_file(url, filename):    
    r = requests.get(url)    
    try:
        with open(filename, 'wb') as file:        
            file.write(r.content)
    except:
        print(filename)
        pass

def check_file(filename):    
    '''檢查有沒有被反爬'''    
    if os.path.exists(filename):        
        with open(filename, 'r') as f:            
            line = f.readline()            
            if 'Doc' in line:                
                return False            
            else:                
                return True    
    else:        
        return False 

def check_item(num):    
    '''檢查檔案是否下載完整'''    
    zcfzb = './data/zcfzb/' + num + '.csv'    
    lrb = './data/lrb/' + num + '.csv'    
    xjllb = './data/xjllb/' + num + '.csv'    
    if check_file(zcfzb) == False | check_file(lrb) == False | check_file(xjllb) == False:        
        return False    
    else:        
        return True 

f = open('stock_name.txt', 'r')
stockdict = json.loads(f.read())
f.close()
count = 0
for num, v in stockdict.items():    
    count = count + 1    
    if count%100  == 0:        
        print(int(count*100/len(stockdict)), '% completed downloading')    
    #存放檔案的路徑    
    zcfzb = './data/zcfzb/' + num + '.csv'    
    lrb = './data/lrb/' + num + '.csv'    
    xjllb = './data/xjllb/' + num + '.csv'    
    #檔案下載網址
    zcfzb_url = "http://quotes.money.163.com/service/zcfzb_"+ num + ".html?type=year"    
    lrb_url = "http://quotes.money.163.com/service/lrb_"+ num + ".html?type=year"    
    xjllb_url = "http://quotes.money.163.com/service/xjllb_"+ num + ".html?type=year"     
    get_file(zcfzb_url, zcfzb)    
    get_file(lrb_url, lrb)    
    get_file(xjllb_url, xjllb)
    #time.sleep(1)        
    if check_item(num):        
        pass    
    else:        
        print("被反爬了，休息10s")        
        time.sleep(5)

有了股票程式碼就可以去網易財經上下報表了。以貴州茅臺為例，股票程式碼：600519

後得到3654家A股上市公司的三張表

爬取網易財經全部A股上市公司年報

首先要找到所有A股上市公司的股票程式碼，將東方財富網列表中所有的股票的程式碼（6位數字號）取下來 <a target="_blank" href="http://quote.eastmoney.com/sh500001.html">基金金泰(500001

python爬取網易雲音樂歌單音樂

string attrs default textarea bsp color read contents dom 在網易雲音樂中第一頁歌單的url：http://music.163.com/#/discover/playlist/ 依次第二頁：http://music.1

爬取網易熱評做成網易雲熱門截圖形式（給自己看的很亂有待更改）

lac post 更改 with con requests true ext2 .post 1 import requests,json,os,datetime,math,re 2 from PIL import Image,ImageDraw,ImageFont

爬取網易熱評做成網易雲熱門截圖形式（給自己看的很亂有待更改+）

json roman reply 熱門 req fan sta strftime ram # coding: utf-8 import requests, json, os, time, math, re from PIL import Image, Image

我用Python爬取網易雲音樂上的Hip-hop歌單，分析rapper如何押韻

line gone 謠言大致 -i 態度大眾其中當前緣起《中國有嘻哈》這個節目在這個夏天吸引了無數的目光，也讓嘻哈走進了大眾的視野。作為我今年看的唯一一個綜藝節目，它對我的影響也蠻大。這個夏天，我基本都在杭州度過，在上下班的taxi上，我幾乎都在刷這個節目，最後

爬取網易雲音樂評論並使用詞雲展示

referer top readlines target ner ads 詞雲 pos 參考最近聽到一首很喜歡的歌，許薇的《我以為》，評論也很有趣，遂有想爬取該歌曲下的所有評論並用詞雲工具展示。我們使用chrome開發者工具，發現歌曲的評論都隱藏在以 R_S

爬取網易雲音樂(包括歌詞和評論)

輸入 random 字節 sim main dal 需要 ssi wow # http://music.163.com/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&off

如何用Python網絡爬蟲爬取網易雲音樂歌曲

今天 http 分享圖片分享圖片分分鐘參考 down 技術今天小編帶大家一起來利用Python爬取網易雲音樂，分分鐘將網站上的音樂down到本地。跟著小編運行過代碼的筒子們將網易雲歌詞抓取下來已經不再話下了，在抓取歌詞的時候在函數中傳入了歌手ID和歌曲名兩個參數

如何用Python網絡爬蟲爬取網易雲音樂歌詞

網易雲歌詞 Python網絡爬蟲網絡爬蟲前幾天小編給大家分享了數據可視化分析，在文尾提及了網易雲音樂歌詞爬取，今天小編給大家分享網易雲音樂歌詞爬取方法。本文的總體思路如下：找到正確的URL，獲取源碼；利用bs4解析源碼，獲取歌曲名和歌曲ID；調用網易雲歌曲API，獲取歌詞；將歌詞寫入

python爬取網易雲音樂歌曲評論信息

webkit fun 數據包 cond bubuko ret value selenium apple 　　網易雲音樂是廣大網友喜聞樂見的音樂平臺，區別於別的音樂平臺的最大特點，除了“它比我還懂我的音樂喜好”、“小清新的界面設計”就是它獨有的評論區了——————各種故事匯

利用python廣西快樂十分源碼出租爬取網易雲歌手top50歌曲歌詞

代碼提示安裝 json 如果 https enc utf _id ebp python廣西快樂十分源碼出租 dsluntan.com Q:3393756370 VX:17061863513近年來，發展迅速，成為了最炙手可熱的語言。那麽如何來進行網易雲歌手top50的歌

菜鳥學爬蟲之爬取網易新聞

學習了python基本語法後，對爬蟲產生了很大的興趣，廢話不多說，今天來爬取網易新聞，實戰出真知。開啟網易新聞（https://news.163.com/）可以發現新聞分為這樣的幾個板塊：這次選擇國內板塊來爬取文章。 1.準備環境：python3 編譯器：PyChar

無論你是小白還是萌新！這篇都能教會你爬取網易雲付費音樂！

目標偶然的一次機會聽到了房東的貓的《雲煙成雨》，瞬間迷上了這慵懶的嗓音和學生氣的歌詞，然後一直去迴圈聽她們的歌。然後還特意去刷了動漫《我是江小白》，好期待第二季… 我多想在見你，哪怕匆匆一眼就別離… 好了，不說廢話了。這次的目標主要是根據網易雲中歌手的ID，下載該歌手的熱門音樂的歌詞和

java實現爬蟲，爬取網易歌單資訊

之前一直對爬蟲很好奇，覺得它很神祕，而我有個朋友是做爬蟲的，最近有空就向他學習了一下，並試著寫了個小程式。首先是獲得httpclient物件及httpresponse物件，此兩者是用於傳送請求及接受資料。 CloseableHttpClient httpClient

python3.基礎爬取網易雲音樂【超詳細版】

簡單學習了python爬蟲之後，我們就可以嘿咻嘿咻了...因為平時就是用網易雲聽的歌，也喜歡看歌裡的評論，所以就爬網易雲音樂評論吧！正式進入主題首先還是去找目標網頁並開始分析網頁結構，如下上面的三個箭頭都是所要找的資料，分別是評論使用者，評論和點贊數，都可以用正則表示式找出來，接下來繼續找怎樣

python 爬蟲爬取網易嚴選全網商品價格評論資料

1.獲取商品目錄在Chrome瀏覽器開發者工具中，可以找到目錄的JS地址： http://you.163.com/xhr/globalinfo//queryTop.json 得到商品資料 def get_categoryList():

【Python】【爬蟲】爬取網易、騰訊、新浪、搜狐新聞到本地

這個實驗主要爬取新聞網站首頁的新聞內容儲存到本地，爬取內容有標題、時間、來源、評論數和正文。工具：python 3.6 谷歌瀏覽器爬取過程：一、安裝庫：urllib、requests、BeautifulSoup 1、urllib庫：Urlli

python爬取網易雲歌曲資訊及下載連結並簡單展示

我們選取的爬取目標是歌單這一塊兒 chrome瀏覽器 f12抓包經過簡單的解析，拿到歌曲分類名字 create_table_sql = 'create table ’ + i + ‘(id int auto_increment primary key,song_name varch

【Java爬蟲學習】WebMagic框架爬蟲學習實戰一：爬取網易雲歌單資訊，並存入mysql中

最近，需要使用Java進行爬蟲編寫，就去學了Java的爬蟲。因為之前學習了Scrapy框架，所以學Java的爬蟲使用了WebMagic框架，這個框架是基於Scrapy框架開發的。大家有興趣可以去看看操作文件：這個框架是國人開發的，所以說明文件都是中文，簡單易懂。

python爬取網易雲歌單

背景這學期報了一門海量資料處理，在資料處理前需要爬取一些內容。所以做了一個小練習，爬取網易雲的歌單。其中包括歌單名稱，播放量和url地址。網易雲還是具有一些反爬措施的，這裡主要說以下幾個方面以及我的應對措施。無法直接訪問我沒有實踐過直接訪問網易雲音樂

爬取網易財經全部A股上市公司年報

相關推薦