1. 程式人生 > >九州代理:爬蟲工程師都是做什麼?

九州代理:爬蟲工程師都是做什麼?

爬蟲工程師的日常 爬蟲的工作,爬取一些網站的資料。 爬一些其他部門需要的資料,這類資料是來自一些小的網站。 至於工作上的爬蟲都需要用到哪些技術,這就看公司的要求。我們公司只要你能把對應的資料給我就好,不管你用什麼技術。但還是 scrapy、selenium 用的多,資料的儲存主要是用 mongodb 和 mysql。

還有讀者問過我「我最近看到一則新聞是一個人做爬蟲的工作,抓取別人的資料被法院判刑了。爬蟲的工作真的犯法嗎?」

爬蟲犯不犯法,看你抓取的資料是什麼內容。如果是一些網上公開可看的資訊就不違法的。就這個問題我還專門去問了爬蟲領域的專家「崔慶才」,他給我的答覆是這樣的。

公開可查的就可以爬,這個就沒啥事。那些用某些特殊許可權的賬號登陸才可見的就比較危險。還有必須破解才能爬的就構成犯罪了,另外都建議各種設定代理,一個反爬,一個隱藏真實 ip。

所以只要不去觸碰一些敏感未公開的資料,都是可以爬取。!

在這裡插入圖片描述 九州代理IP:qq3426647516