爬蟲學習記錄 ----持續更新

阿新 • • 發佈：2018-11-10

本博文主要記錄一些在學習爬蟲過程遇到的一些小技巧

============================================================================

3、獲取網頁的文字的編碼格式

import  requests

url = 'https://movie.douban.com/top250?start=25&filter='
r = requests.get(url)
print(r.encoding)

執行結果如下：

utf-8

============================================================================

2、傳遞URL引數（此內容轉摘自 https://blog.csdn.net/kangyan__/article/details/78506243 ）

例如， httpbin.org/get?key=val

想傳遞 key1=value1和 key2=value2到 httpbin.org/get
程式碼如下：

import requests

payload = {'key1': 'value1', 'key2': 'value2'}
r = requests.get("http://httpbin.org/get", params=payload)
print(r.url)

執行結果如下：

http://httpbin.org/get?key1=value1&key2=value2

還可以將一個列表作為值傳入：

import requests

payload = {'key1': 'value1', 'key2': ['value2', 'value3']}
r = requests.get('http://httpbin.org/get', params=payload)
print(r.url)

執行結果如下：

http://httpbin.org/get?key1=value1&key2=value2&key2=value3

============================================================================

1、用chrome檢視審查元素

以"豆瓣電影 Top 250"網頁為例，網址：https://movie.douban.com/top250
用chrome開啟網址，有兩種方式開啟審查元素：
①按“F12”鍵，點"Elements",點左上角的箭頭，箭頭變藍後點擊左側頁面的網頁內容，Elements就會跳轉至相應的位置
②快捷組合鍵“Ctrl+Shift+c”可直接開啟審查元素功能，如下圖：
在這裡插入圖片描述

再次按“F12”即可關閉審查元素頁面。

爬蟲學習記錄 ----持續更新

本博文主要記錄一些在學習爬蟲過程遇到的一些小技巧 ============================================================================ 3、獲取網頁的文字的編碼格式 import requests url =

《演算法圖解》學習記錄------持續更新

最近在學習演算法，選用的是《演算法題解》這本書，作為演算法的入門書籍。為了以後方便複習以及加強記憶，每次看完一章以後都會把知識點記錄到這個文章當中。本文的結構會參考《演算法圖解》的目錄結構，方便自己記錄。在文章中，可能會有一些LZ自己簡單實現的演算法程式碼，僅供參考。文章

學習flex&as的記錄(持續更新)

這次真的要學Flex 和 as 了突然覺得在ajax這一條路上走太深沒有太大必要深度廣度要兼顧下一步打算開始學習 flex 和 as (這個想法一年前就有) 這次是真的要開始學了 ===================== 然後爭取基於 flex 再做幾個免費的元件

各項兼容坑的記錄-持續更新

min sch http wid 出現 css 註意 www phone 1,腦袋短路了，竟然設置了min-width: auto 來覆蓋之前的min-width，在大部分手機中都沒有問題也沒註意到，只有三部iphone5s有兩部出現了錯位，找了半天才發現問題，不要使用mi

oracle學習筆記持續更新

.net 情況 style 空間 resource sdn detail reat net 1、創建表空間DATA_BASIC (1)Orale用戶登錄系統 (2)sqlplus / as sysdba; DBA用戶登錄數據庫；執行：create tablespace T

學習Question---持續更新Question和Answer進度20170812

整理 grid table 編碼 ans 配置問題 question global 作用 Q1、MySQL新建table時各字段類型對應的字節長度？ Q2、MySQL設置默認編碼utf-8，需要設置系統編碼、db默認編碼、表默認編碼等，設計global變量等 Q3、Pyth

2017年9月秋招記錄--持續更新

更新十六蘑菇街高德信用卡信用美團三次筆試一、騰訊校招提前批（一面跪）二、網易內推（筆試跪）三、今日頭條（免筆試，二面跪）四、蘑菇街（免筆試，一面跪）五、好未來（免筆試，一面跪）六、360（筆試跪）七、大疆（筆試跪）八、美團（筆試等通知）九、

簡單爬蟲學習記錄

技術 RM block 管理 ffffff png size images 51cto 實現思路解析：爬蟲調度器：啟動/停止爬蟲，規定爬蟲的範圍；URL管理器：管理2個URL：新的沒有爬過的urls；舊的爬過的urls；URL下載器：下載url對應的html數據；

[ C# ] C# 學習筆記 [ 持續更新 ]

sed bject 持續更新 clas sys 筆記 nbsp dispose tdi //[#20180815]:[#1]:[C#][Check if object is disposed][檢查對象是否已經釋放] catch (System.ObjectDispos

hive學習筆記-持續更新

hive --適用於ETL方面的工作首先我們要知道hive到底是做什麼的。下面這幾段文字很好的描述了hive的特性：　　1.hive是基於Hadoop的一個數據倉庫工具，可以將結構化的資料檔案對映為一張資料庫表，並提供完整的sql查詢功能，可以將sql語句轉換為MapRedu

hadoop學習筆記-持續更新

hadoop學習 25 cyg_server 使用者名稱 net start Sshd 開啟ssh服務 ssh localhost 連線本機快速切換到bin目錄：cd /cygdrive/d/軟體和資料/hadoop/hadoo

etl學習筆記-持續更新

關於資料的ETL 用來描述將資料從來源端經過抽取E(extract)、清洗,轉換T(transform)、載入L(load)至目的端的過程。ETL一詞較常用在資料倉庫，但其物件並不限於資料倉庫. 目標：資料優化，以最小代價將針對日常業務操作的資料轉換成針對資料倉庫而儲

dock學習筆記-持續更新

Docker 是一個開源的應用容器引擎，讓開發者可以打包他們的應用以及依賴包到一個可移植的容器中，然後釋出到任何流行的 Linux 機器上，也可以實現虛擬化。容器是完全使用沙箱機制，相互之間不會有任何介面。 Docker核心解決的問題是利用LXC來實現類似VM的功能，從而利

weka學習筆記-持續更新

weka記錄 evaluator：評估者 supervised：監督資料分析是確定性問題的處理，資料探勘是不確定性問題的處理資料分析:一般要分析的目標比較明確，分析條件也比較清楚。資料探勘:目標不是很清晰，要依靠挖掘演算法來找出隱藏在大量資料中的規則、模式、規

node學習筆記-持續更新

pdf 40 設定node代理 node安裝express npm install -g express npm install -g express-generator 檢視安裝的版本express --version nod

深度學習筆記-持續更新

深度學習演算法：過去幾年以來，深度學習（簡稱 DL）架構及演算法已經在影象識別與自然語言處理（NLP）、資料科學、機器學習和預測分析領域領域取得了令人印象深刻的進展 TPU/CPU/GPU：深度學習晶片，因為複雜的深度學習網路需要同時進行數百萬次計算，耗能會變成一

ESB學習筆記-持續更新

ESB全稱為Enterprise Service Bus，即企業服務匯流排。它是傳統中介軟體技術與XML、Web服務等技術結合的產物。 ESB提供了網路中最基本的連線中樞，是構築企業神經系統的必要元素。 ESB的出現改變了傳統的軟體架構，可以提供比傳統中介軟體產品更為廉價的

mysql 的一些有意思的sql記錄,持續更新...

insert into db.tableA (feild1,feild2) select value1,value2 from db.tableB where id=1; 2018-10-10 這是在一個同事寫的儲存過程中看見的,第一次見這種寫法,挺有意思的,把原始碼貼上: 將db

linux基礎操作記錄...持續更新

df -ah df 檢視磁碟情況主要是這兩個引數，-a表示所有磁碟，-h表示以人類讀懂方式顯示大小 du -sh *顯示當前目錄下各資料夾大小。 -s表示計算大小，-h表示通俗方式顯示， *表示遍歷當前目錄 ps -A 顯示所有程序 ps -ef 顯示所有程序資訊，

Swift 全面系統的學習（持續更新...）

最近專案不算緊，於是就學了學 Swift ，看了一大神寫的專案https://github.com/hrscy/DanTang，很受益，感謝開源！另外自己也寫了一些基礎程式碼，分享出來，第一是希望得到同行前輩的指導，第二是希望對需要的朋友有所幫助。

爬蟲學習記錄 ----持續更新

本博文主要記錄一些在學習爬蟲過程遇到的一些小技巧

3、獲取網頁的文字的編碼格式

2、傳遞URL引數（此內容轉摘自 https://blog.csdn.net/kangyan__/article/details/78506243 ）

1、用chrome檢視審查元素

相關推薦