jupyterLab學習第二天

阿新 • • 發佈：2020-11-05

簡單爬取一個小說網站

首先得在控制檯中下載安裝requests-html

安裝requests-html非常簡單，一行命令即可做到。需要注意一點就是，requests-html只支援Python 3.6及更新的版本，所以使用老版本的Python的同學需要更新一下Python版本了。看了下原始碼，因為requests-html廣泛使用了一個Python 3.6中的新特性——型別註解。

pip install requests-html

具體程式碼

from requests_html import HTMLSession

import requests

session = HTMLSession()

url = 'http://bbs.tianya.cn/post-culture-488321-1.shtml'

r = session.get('http://bbs.tianya.cn/post-culture-488321-1.shtml')

author = r.html.find('div.atl-info span a', first=True).text

div = r.html.find('div.atl-pages', first=True)

links = div.find('a')

total_page = 1 if links == [] else int 
(links[-2].text)

title = r.html.find('span.s_title span', first=True).text

with open('douban.txt', 'w+', encoding='utf-8') as f:
    for i in range(1, total_page + 1):
        s = url.rfind('-')
        r = session.get(url[:s + 1] + str(i) + '.shtml')
        # 從剩下的裡面找樓主的帖子
        items = r.html.find(f' 
div.atl-item[_host={author}]')
        for item in items:
            content: str = item.find('div.bbs-content', first=True).text
            # 去掉回覆
            if not content.startswith('@'):
                f.write(content + "\n")

這裡需要在目錄下新建一個douban文字檔案儲存爬取後的資料

jupyterLab學習第二天

簡單爬取一個小說網站首先得在控制檯中下載安裝requests-html 安裝requests-html非常簡單，一行命令即可做到。需要注意一點就是，requests-html只支援Python 3.6及更新的版本，所以使用老版本的Python的同學需要更新

java學習第二天 20207/7

一. 1.對傳參進行了瞭解 2. 2.java的變數命名與c/c++有些不同在java中有￥，字母，下劃線和數字，同樣不可以是數字開頭。

Docker的學習第二天

Docker架構圖映象：image，類似於模板的意思，通過這個模板建立容器服務，如tomcat 映象，---》run--->tomcat1容器，提供給伺服器

建模學習第二天——優劣解距離法

TOPSIS法 (優劣解距離法) 來源：清風老師數學建模ppt，全手打 TOPSIS法：又名為：逼近理想排序法或優劣解距離法。

機器學習第二天---資料預處理和清洗

1.numpy.genfromtxt用於處理資料矩陣 numpy.genfromtxt(fname, dtype=<type \'float\'>, comments=\'#\', delimiter=None, skip_header=0, skip_footer=0, converters=None, missing_values=None, filling_va

Java學習第二天

前言: 　　今天老師說需要學一點前端的知識,於是乎,我們花了一天的時間學了一點前端,今天的故事由此開啟!!!

jupyterLab學習第一天

jupyterLab執行.py檔案這裡的test.py是寒假在家裡是學習的疫情爬取並匯入mysql中首先要在cmd控制檯，下載安裝PyMySQL ，PyMySQL 是在 Python3.x 版本中用於連線 MySQL 伺服器的一個庫

Docker學習第二天

1、安裝docker （1）解除安裝舊版docker yum removedocker \\ docker-client \\docker-client-latest \\docker-common \\docker-latest \\docker-latest-logrotate \\docker-logrotate \\docker-engine