1. 程式人生 > >css提取數據2個常用方法

css提取數據2個常用方法

一點 select checked valid gen focus 屬性 comm nbsp

提取標簽裏的內容

所謂數據就是HTML裏標簽的內容,如下面紅色字體,就是標簽內容

 <title>我只是個實驗 - SCRAPY</title>

提取標簽裏的數據,標簽可以是title、body、div等等,返回第一個元素,但是會有標簽名字。

去掉裏列表去掉多余的標簽名字,在後面加上::text即可,只提取標簽裏的數據,其他的不要。

response.css(‘title::text‘).extract_first()
>>>‘XXXYYYY‘

公式

response.css(‘標簽名::text‘).extract_first() 

提取標簽的屬性