1. 程式人生 > >bs4爬蟲的一點心得----坑

bs4爬蟲的一點心得----坑

soup eth 嘗試 BE 字符串 遇到 運行循環 section 屬性

bs4 裏提取a標簽裏的坑啊

今天遇到了一個很坑的事情

使用bs4(全稱:BeautifulSoup)提取一個網頁裏所有a標簽裏的href屬性

比較坑的地方是這個網頁裏有的a標簽裏沒有href屬性,所以一運行循環提取a標簽的href就可勁的報錯,搞得人很焦灼

我嘗試用控制循環的次數和字符串的替換來跳過這個坑。

你懂的

都失敗了

最後

我將提取href的方式從[‘href’]改為get(‘href’)就逃過這個坑!!!!!!

這個bug!!!好坑!!!

bs4爬蟲的一點心得----坑