1. 程式人生 > 實用技巧 >python爬取新浪財經

python爬取新浪財經

我們來獲取這裡的title和url然後再獲取這裡面url的編輯作者

可以看到右邊的幾個就對應的左邊不同的div

.m-p1-mb2-list.m-list-container ul li a
import requests
from bs4 import BeautifulSoup

html = requests.get('https://finance.sina.com.cn/')
html.encoding='utf-8'

soup = BeautifulSoup(html.text,'lxml')
zq = soup.select('.m-p1-mb2-list.m-list-container ul li a')
for z in zq:
    print('title:',z.text)
    print('url:',z['href'])
    Innerhtml = requests.get(z['href'])
    Innerhtml.encoding='utf-8'
    soup2 = BeautifulSoup(Innerhtml.text,'lxml')
    writers = soup2.select('.article-editor')
    for w in writers:
        print(w.text)
        print('*'*50)

結果

G:\python3.8\python.exe "F:/python post/code/實戰/新浪財經.py"
title: 創業板現場督導來了:有投行已接通知 監管帶著問題來 
url: https://finance.sina.com.cn/stock/zqgd/2020-09-14/doc-iivhuipp4150274.shtml
責任編輯:常福強 
**************************************************
title: 2020金牌董祕評選開啟 尋上市公司資本品牌最佳代言人
url: http://finance.sina.com.cn/zt_d/2020jinpaidongmi/
title: 直播|
url: http://finance.sina.com.cn/zt_d/jjzbj/
title: 陳果、華夏嘉實長盛長安富國大通等直播解盤
url: https://finance.sina.com.cn/money/fund/original/2020-09-12/doc-iivhvpwy6361399.shtml?cref=cj
責任編輯:常福強 
**************************************************
title: 研報|
url: http://finance.sina.com.cn/stock/reportch/jinqilin.shtml
title: 內部經濟復甦仍是主線 關注政府性投資需求帶動
url: https://finance.sina.com.cn/stock/marketresearch/2020-09-13/doc-iivhvpwy6487946.shtml
責任編輯:陳志傑 
**************************************************
title: 
url: https://finance.sina.com.cn/stock/s/2019-07-09/doc-ihytcitm0843478.shtml
責任編輯:陳志傑 
**************************************************
title: 公司
url: http://finance.sina.com.cn/roll/index.d.html?cid=56592&page=1
title: 業績虧損套現不斷 朗姿股份實控人的資產騰挪術
url: https://finance.sina.com.cn/roll/2020-09-14/doc-iivhuipp4201666.shtml
責任編輯:張熠 
**************************************************
title: 老大哥燕京啤酒危險時刻:營收淨利降 增長率十年新低
url: https://finance.sina.com.cn/stock/t/2020-09-14/doc-iivhuipp4175419.shtml
責任編輯:常福強 
**************************************************
title: 
url: https://finance.sina.com.cn/wm/2020-07-12/doc-iivhuipn2580833.shtml
責任編輯:逯文雲 
**************************************************
title: 違規代客炒股 萬和、新時代、民生等多券商密集受罰
url: https://finance.sina.com.cn/stock/zqgd/2020-09-14/doc-iivhvpwy6527324.shtml
責任編輯:常福強 
**************************************************
title: 超級打新周:19只新股 火箭、美妝、醫美…全是熱點
url: https://finance.sina.com.cn/stock/zqgd/2020-09-14/doc-iivhvpwy6557166.shtml

Process finished with exit code -1