Python爬蟲9-----實例-抓取上海高級人民法院網開庭公告數據

阿新 • • 發佈：2018-10-16

web bsp 實例上海取數 tro arc http 融合

通過前面的文章已經學習了基本的爬蟲知識，通過這個例子進行一下練習，畢竟前面文章的知識點只是一個

一個單獨的散知識點，需要通過實際的例子進行融合。

分析網站

其實爬蟲最重要的是前面的分析網站，只有對要爬取的數據頁面分析清楚，才能更方便後面爬取數據

目標站和目標數據
目標地址：http://www.hshfy.sh.cn/shfy/gweb/ktgg_search.jsp
目標數據：目標地址頁面的中間的案開庭公告數據

對數據頁面分析
從打開頁面後可以看到默認的數據是一個月的數據，即當天到下個月該天的
通過翻頁可以返現這個時候頁面的url地址是不變的，所以這裏我們大致就可以判斷出，中間表格的數據是通過js動態加載的，我們可以通過分析抓包，找到真實的請求地址

Python爬蟲9-----實例-抓取上海高級人民法院網開庭公告數據

web bsp 實例上海取數 tro arc http 融合通過前面的文章已經學習了基本的爬蟲知識，通過這個例子進行一下練習，畢竟前面文章的知識點只是一個一個單獨的散知識點，需要通過實際的例子進行融合。分析網站其實爬蟲最重要的是前面的分析網站，只有對要爬取