python 學習 -- 第一天 初涉
阿新 • • 發佈:2018-06-05
電影 fin rop 獲取 利用 n) 類型 rep IE
久聞python大名卻一直沒去了解,趁學校培訓這個機會 開始正式學習python
第一天初步介紹一點關於python的東西
安裝了環境及編譯器
環境是在之前就安裝了
只安裝編譯器anaconda
之後按照國際慣例
編寫了第一個python程序“Hello world!”!
print(‘hello world‘)
之後的幾個程序:
print (100+200)
print (‘傻豬,i love you!‘*100)
今晚主要知識點:
利用python爬取網頁內容
#爬蟲 #引入庫 from bs4 import BeautifulSoup import requests #獲取要爬取的網頁地址#myurl 是自己定義的 myurl=requests.get(‘https://movie.douban.com/‘) #print(myurl) #獲取網頁源代碼數據 v_text=BeautifulSoup(myurl.text,‘lxml‘) #print(v_text) #爬取電影標題 v_title=v_text.find (‘span‘,attrs={‘property‘:‘v:itemreviewed‘}).textprint(v_title) #爬取類型和簡介 #v_lei=v_text.find(‘span‘,attrs={‘class‘:‘pl‘,‘property‘:‘v:genre‘}).text#print(v_lei) /*這一部分自己寫不會。。。是一個集合,不能用find 應該用findAll 參考下面*/ #v_jianjie = v_text.find(‘i‘,attrs={‘class‘:‘‘}).text #print(v_jianjie) /*這部分爬取簡介是正確的!*/ #v_jian = v_text.find(‘div‘,attrs={‘class‘:‘indent‘,‘id‘:‘link-report‘}).text #print(v_jian) /*神奇的逗號,爬取了兩段內容。嘿嘿嘿*/ #爬取熱映電影多個 v_ry=v_text.findAll(‘li‘,attrs={‘class‘:‘title‘}) #print(v_ry) for i in v_ry: print(i.text)
第一次寫博客,感覺寫的不太好。2333333~
python 學習 -- 第一天 初涉