Python爬蟲(二)“我想要很多很多的表情包”
阿新 • • 發佈:2019-02-02
Python爬蟲之二:“我想要很多很多的表情包”
哈哈hhh,標題寫的神神經經的不知所云,其實這是一個關於圖片抓取的小運用程式。一、前期準備
開啟百度貼吧中的“表情包吧”-->"http://tieba.baidu.com/p/5059180075",這是我們的表情包來源。開啟開發者除錯,抓取一張圖片,其實就是一個<img>標籤: <img class="BDE_Image" src="https://imgsa.baidu.com/forum/w%3D580/sign=a4d059db24f5e0feee1889096c6234e5/6652f8deb48 f8c54c02193ed33我們首先運用正則表示式把頁面的所有<img>標籤篩選出來。關於"爬蟲",我的理解是根據我們的需求從網頁中找到我們需要的內容,如果用字串匹配的話if-else夠我們寫到天荒地老了(不信你可以寫個demo識別一個字串如"-12.3"等是不是數字看看),所以正則表示式
二、.py程式
程式也很簡短,30行程式碼,沒辦法,“人生苦短,我用Python!”。結果就是我們用30行程式碼換來了500多張表情圖,媽媽再也不用擔心我和你們鬥圖了!