1. 程式人生 > >新浪微博資訊採集釋出教程

新浪微博資訊採集釋出教程

本文主要介紹“新浪微博採集爬蟲”(以下簡稱“微博爬蟲”)的使用教程以及注意事項。

新浪微博中有大量高價值的軟文資料,應用價值很高,接下來,給你詳細說明用“微博爬蟲”採集並匯出資料的步驟:

步驟1 設定爬蟲

進入“微博爬蟲”總覽頁,點選“應用設定”,您可以選擇“檔案託管”服務託管圖片、視訊等檔案,設定“微博的爬取方式”,以及是否爬取微博評論和轉發等資料,最後別忘了點“儲存”。

步驟2 爬取資料

再次進入“微博爬蟲”總覽頁,點選“啟動爬蟲”,爬蟲變開始爬取微博了,稍等片刻,便可在“爬取結果”頁檢視爬取的微博資料了。

步驟3 資料釋出與匯出

在“爬取結果”中出現爬取的資料後,您可以選擇將資料“釋出到網站或資料庫”中,此外,還可選擇將資料“匯出”。

“新浪微博爬蟲”資料匯出示例,如下圖所示:

對於一般採集器而言,採集新浪微博還是不難的,這當然也難不倒主流採集平臺嘍,比如,神箭手大資料平臺 等。