1. 程式人生 > >Python爬蟲9-----實例-抓取上海高級人民法院網開庭公告數據

Python爬蟲9-----實例-抓取上海高級人民法院網開庭公告數據

web bsp 實例 上海 取數 tro arc http 融合

通過前面的文章已經學習了基本的爬蟲知識,通過這個例子進行一下練習,畢竟前面文章的知識點只是一個

一個單獨的散知識點,需要通過實際的例子進行融合。

分析網站

其實爬蟲最重要的是前面的分析網站,只有對要爬取的數據頁面分析清楚,才能更方便後面爬取數據

目標站和目標數據
目標地址:http://www.hshfy.sh.cn/shfy/gweb/ktgg_search.jsp
目標數據:目標地址頁面的中間的案開庭公告數據

對數據頁面分析
從打開頁面後可以看到默認的數據是一個月的數據,即當天到下個月該天的
通過翻頁可以返現這個時候頁面的url地址是不變的,所以這裏我們大致就可以判斷出,中間表格的數據是通過js動態加載的,我們可以通過分析抓包,找到真實的請求地址

Python爬蟲9-----實例-抓取上海高級人民法院網開庭公告數據