scrapy xpath選擇器多級選擇錯誤

阿新 • • 發佈：2018-10-07

span resp rap spa rac res pat style 出現

在學習scrapy中用xpath提取網頁內容時，有時要先提取出一整個行標簽內容，再從行標簽裏尋找目標內容。出現一個錯誤。

錯誤代碼：

def parse(self, response):
    sel = scrapy.Selector(response)
    sel_li = sel.xpath(‘/html/body/div[2]/div[5]/div[1]/ul/li‘)
    for i in sel_li:
        print(i.xpath(‘//h5/a/text()‘).extract()[0])

結果：

大嘴巴第二季
大嘴巴第二季
大嘴巴第二季
大嘴巴第二季
大嘴巴第二季
大嘴巴第二季
...

提取到的內容都是第一個下的後續內容

修稿後代碼：

def parse(self, response):
    sel = scrapy.Selector(response)
    sel_li = sel.xpath(‘/html/body/div[2]/div[5]/div[1]/ul/li‘)
    for i in sel_li:
        print(i.xpath(‘.//h5/a/text()‘).extract()[0])

結果：

大嘴巴第二季
新百戰天龍第三季
丹麥淫妖第一季
糟糕歷史第七季
無恥之徒第九季
...

在子xpath內路徑前加 . 表示從當前查找，之後後續內容正常得到

其他方法：

def parse(self, response):
    sel = scrapy.Selector(response)
    sel_li = sel.xpath(‘/html/body/div[2]/div[5]/div[1]/ul/li‘)
    for i in sel_li.extract():
        print(scrapy.Selector(text=i).xpath(‘//h5/a/text()‘).extract()[0])
        print(scrapy.Selector(text=i).xpath(‘.//h5/a/text()‘).extract()[0])

scrapy xpath選擇器多級選擇錯誤

span resp rap spa rac res pat style 出現在學習scrapy中用xpath提取網頁內容時，有時要先提取出一整個行標簽內容，再從行標簽裏尋找目標內容。出現一個錯誤。錯誤代碼： def parse(self, response):

Python爬蟲框架 scrapy之xpath選擇器 css選擇器

文章目錄一、xpath 1、節點選擇二、 css css選擇三、xpath函式操作 1

HTML三大選擇器的使用和命名方式,優先順序,以及選擇器中常見錯誤及解決方法

HTML中的三大選擇器1.標籤選擇器:使用標籤的名稱作為選擇器,選中標籤設定樣式, 特點:可以選中多個標籤,給一堆標籤同時設定樣式書寫方式標籤名{ 樣式 }2.類選擇器:在標籤中利用class屬性設

css3的新特性選擇器-------屬性選擇器

屬性選擇器 cnblogs pan 一個 ont log color spa css3 自己學css的時候比較亂，這次趁著復習把css3的新特性選擇器和css2以前不怎麽用的選擇器做一個總結 <div id="parent"> <p>

【ElementUI】日期選擇器時間選擇範圍限制

del this 以及 ui框架 .get led () 設置 ons 　　ElementUI是餓了麽推出的一套基於vue2.x的一個ui框架。官方文檔也很詳細，這裏做一個element-ui日期插件的補充。　　官方文檔中使用picker-options屬性來限制可選擇的

jQuery選擇器基本選擇器

jQuery選擇器基本選擇器form input：查詢form下所有input元素，含有後代關系form>input：查詢form下所有input元素，有有父子關系，沒有後代關系form+input：查詢與form同級的第一個input元素，是兄弟關系form~input：查詢與form同級的所有inp

ElementUI日期選擇器時間選擇範圍限制

date ron let 推出舉例 strong 2.x ons 餓了麽　　ElementUI是餓了麽推出的一套基於vue2.x的一個ui框架。官方文檔也很詳細，這裏做一個element-ui日期插件的補充，官方文檔中使用picker-options屬性來限制可選擇的日

jQuery 基本選擇器層次選擇器過濾選擇器內容過濾選擇器可見過濾選擇器屬性過濾選擇器表單對象屬性過濾選擇器

層次選擇器分享圖片分享技術 info 對象 inf jquery 內容 jQuery 基本選擇器層次選擇器過濾選擇器內容過濾選擇器可見過濾選擇器屬性過濾選擇器表單對象屬性過濾選擇器

【ElementUI】日期選擇器時間選擇範圍限制，只能選今天之前的時間，或者是隻能選今天之後的時間。今天是否可以選

<el-date-picker v-model="value1" type="date" placeholder="選擇日期" :picker-options="pickerOptions0"> </el-date-picke

css的高階選擇器,後代選擇器,子代選擇器,並集選擇器,交集選擇器

高階選擇器: 後代選擇器子代選擇器並集選擇器交集選擇器一、後代選擇器: 　　使用空格表示後代選擇器,父元素的後代(包括兒子,孫子,從孫子) 　　也就是說,box類下的所有span標籤字型顏色都被設定為了紅色 .box span{ color

JQuery選擇器----基本選擇器

基本選擇器: - ID選擇器 : #ID的名稱 - 類選擇器: &nbs

JQuery選擇器-----屬性選擇器

01JQuery選擇器中的屬性選擇器.html <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>04JQuery中的屬性選擇器</title>

JQuery選擇器----層級選擇器

層級選擇器: -- 子元素選擇器: 選擇器1 > 選擇器2 &n

前端網頁學習day46(組合選擇器屬性選擇器盒模型 a標籤,img標籤,list標籤偽類選擇器)

前端網頁學習(html) DAY46 今日內容: css組合選擇器屬性選擇器盒模型盒模型佈局 a標籤、img、list標籤偽類選擇器 css組合選擇器特性: 每個選擇器位可以為任意基本選擇器或選擇器組合群組選擇器:可以控制多個 div, .s,

css的樣式及選擇器跟選擇器權重的學習筆記

一、複習上一週學習過的內容。注意如果在css裡面給table加border值得話，只會顯示table的邊框。如果要給td的邊框應該給td寫一個border值。二、css的介紹三、css的基本結構四、css的四種樣式 1、內嵌式：寫在style標籤對裡面。 2、行內樣式：直接寫

CSS入門系列（三）關聯選擇器&組合選擇器

CSS入門系列（三）關聯選擇器&組合選擇器目錄 1. 關聯選擇器定義是：選擇器中的選擇器。假設如下： <div>這個<b>一個</b>div</div> <span>這

萬用字元選擇器子元素選擇器後代選擇器

<html> <head lang="en"> <meta charset="UTF-8"> <title></title> <style> div{

基本CSS選擇器,複合選擇器,後代選擇器

基本CSS選擇器有標記選擇器、類別選擇器、ID選擇器3種1。標記選擇器每一種HTML標記的名稱都可以作為相應的標記選擇器的名稱，如h1,p,等等2。類別選擇器類別選擇器的名稱可以由使用者自定義格式如下：.class{color:green;font

017子代選擇器後代選擇器

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>選擇器</title> <style> #

CSS選擇器——瞭解選擇器的用法

CSS選擇器 1.瞭解CSS選擇器 CSS選擇器有很多，大家也都不陌生。那先系統的介紹一下： 1.1 *萬用字元選擇器經常用於css reset，清理標籤的預設樣式，一般不提倡直接使用，主要是會匹配所有標籤，相當耗資源。 1.2 #id

scrapy xpath選擇器多級選擇錯誤

相關推薦