1. 程式人生 > >java爬蟲入門

java爬蟲入門

學習爬蟲第一天: 目標1:在網路上爬取一個網頁,並儲存成html檔案 開發環境Eclipse+JDK1.8

  1. 爬蟲用到的jar包:Java本身提供了關於網路訪問的包,在java.net中,然後它不夠強大。於是Apache基金會發布了開源的http請求的包,即HttpClient,這個包提供了非常多的網路訪問的功能。該包的全名:httpclient-4.3.jar 。在資料倉庫中的ID
<dependencies>
    <dependency>
        <groupId>org.apache.httpcomponents</groupId>
        <artifactId>httpclient</artifactId>
        <version>4.5.3</version>
    </dependency>
</dependencies>