第七篇 css選擇器實現字段解析

阿新 • • 發佈：2017-10-02

resp 文章 elf span ext div ant rec normalize

CSS選擇器的作用實際和xpath的一樣，都是為了定位具體的元素

技術分享

舉例我要爬取下面這個頁面的標題

技術分享

In [20]: title = response.css(".entry-header h1")

In [21]: title
Out[21]: [<Selector xpath="descendant-or-self::*[@class and contains(concat(‘ ‘, normalize-space(@class), ‘ ‘), ‘ entry-header ‘)]/descendant-or-self::*/h1" data=‘<h1>谷歌用兩年時間研究了 180 個團隊，發現高效團隊有這五個特征</h1> 
‘>]

In [22]: title = response.css(".entry-header h1").extract()

In [23]: title
Out[23]: [‘<h1>谷歌用兩年時間研究了 180 個團隊，發現高效團隊有這五個特征</h1>‘]

In [24]: ##可以使用css的::text取到內容

In [25]: title = response.css(".entry-header h1::text").extract()

In [26]: title
Out[26]: [‘谷歌用兩年時間研究了 180 個團隊，發現高效團隊有這五個特征 
‘]

獲取文章創建日期：

In [38]: date_text = response.css(".entry-meta-hide-on-mobile").extract()

In [39]: date_text
Out[39]: [‘<p class="entry-meta-hide-on-mobile">\r\n\r\n            2017/08/23 ·  <a href="http://blog.jobbole.com/category/career/" rel="category tag">職場</a>\r\n            \r\n                            · <a href="#article-comment"> 7 評論 </a>\r\n            \r\n\r\n            \r\n             ·  <a href="http://blog.jobbole.com/tag/google/">Google</a>, <a href="http://blog.jobbole.com/tag/%e5%9b%a2%e9%98%9f/">團隊</a>\r\n            \r\n</p> 
‘]

In [40]: date_text = response.css(".entry-meta-hide-on-mobile::text").extract()

In [41]: date_text
Out[41]: 
[‘\r\n\r\n            2017/08/23 ·  ‘,
 ‘\r\n            \r\n                            · ‘,
 ‘\r\n            \r\n\r\n            \r\n             ·  ‘,
 ‘, ‘,
 ‘\r\n            \r\n‘]

In [42]: date_text = response.css(".entry-meta-hide-on-mobile::text").extract()[
    ...: 0]

In [43]: date_text
Out[43]: ‘\r\n\r\n            2017/08/23 ·  ‘

In [44]: date_text = response.css(".entry-meta-hide-on-mobile::text").extract()[
    ...: 0].strip()

In [45]: date_text
Out[45]: ‘2017/08/23 ·‘

In [46]: date_text = response.css(".entry-meta-hide-on-mobile::text").extract()[
    ...: 0].strip().replace("·","").strip()

In [47]: date_text
Out[47]: ‘2017/08/23‘

獲取評論數

技術分享

In [49]: comment_num = response.css("a[href=‘#article-comment‘]")

In [50]: comment_num
Out[50]: 
[<Selector xpath="descendant-or-self::a[@href = ‘#article-comment‘]" data=‘<a href="#article-comment"> 7 評論 </a>‘>,
 <Selector xpath="descendant-or-self::a[@href = ‘#article-comment‘]" data=‘<a href="#article-comment"><span class="‘>]

In [51]: comment_num = response.css("a[href=‘#article-comment‘] span::text").ext
    ...: ract()

In [52]: comment_num
Out[52]: [‘ 7 評論‘]

In [53]: comment_num = response.css("a[href=‘#article-comment‘] span::text").ext
    ...: ract().strip()
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-53-18ae8761867f> in <module>()
----> 1 comment_num = response.css("a[href=‘#article-comment‘] span::text").extract().strip()

AttributeError: ‘list‘ object has no attribute ‘strip‘

In [54]: comment_num = response.css("a[href=‘#article-comment‘] span::text").ext
    ...: ract()[0]

In [55]: comment_num
Out[55]: ‘ 7 評論‘

In [56]:

View Code

PS:css選擇器裏，不同標簽使用空格隔開

第七篇 css選擇器實現字段解析

resp 文章 elf span ext div ant rec normalize CSS選擇器的作用實際和xpath的一樣，都是為了定位具體的元素舉例我要爬取下面這個頁面的標題 In [20]: title = response.css(".ent

精通SpringBoot——第七篇：整合Redis實現快取

專案中用到快取是很常見的事情，快取能夠提升系統訪問的速度，減輕對資料庫的壓力等好處。今天我們來講講怎麼在spring boot 中整合redis 實現對資料庫查詢結果的快取。首先第一步要做的就是在pom.xml檔案新增spring-boot-starter-data-redis。要整合快取，必

css3第三篇，選擇器二(群組，組合選擇器)

群組選擇器給多個選擇器新增同樣的css樣式效果。作用：優化程式碼,減少重複。 <!DOCTYPE html> <html lang="en"> <head>

css3第四篇，選擇器三(偽類選擇器一）

偽類選擇器一語法：。指定選擇器特殊情況下的屬性以及屬性值結構偽類選擇器 1.:nth-child:根據定義的標籤順序,來給指定的標籤新增樣式。先找到符合順序的標籤，再匹配標籤是否符合設定的型別。選擇器作用 :first-child 所有標籤中

深入學習jQuery選擇器系列第三篇——過濾選擇器之索引選擇器

通用形式$(':eq(index)')　　$(':eq(index)')選擇器選擇索引等於index的元素(index從0開始)，返回單個元素索引　　[注意]索引選擇器的索引和子元素選擇器的索引有明顯的不同　　【1】索引選擇器索引從0開始，而子元素選擇器索引從1開始　　【2】索引選擇器的索引是指定元素的索引，

web前端【第三篇】CSS選擇器

方式設置導入標簽 info attr pos pan import 一、css概述 CSS是Cascading Style Sheets的簡稱，中文稱為層疊樣式表，對html標簽的渲染和布局 CSS 規則由兩個主要的部分構成：選擇器，以及一條或多條聲明。例如

Spring Cloud系列教程 | 第七篇：使用Spring Cloud Zuul實現過濾器或攔截器功能案例

推薦 Spring Cloud 視訊：使用Spring Cloud Zuul實現過濾器或攔截器功能案例　Spring Cloud的API閘道器不但可以實現類似NGINX+Lua強大的路由分發，實現動靜頁面的分流，更重要可以實現對所有發往後端微服務請求的攔

CSS基礎第二篇之選擇器

lec blue auto 添加內容 cal device 鍵值對種類 one 我這裏就簡單舉例9種常用選擇器： 1、通配符選擇器說明：為頁面上的所有元素設置樣式。優先級最低。 *{ margin:0; padding:0; } 2、元素選擇器說明：也叫標簽選擇器

MyBatis學習——第四篇（攔截器和攔截器分頁實現）

MyBatis架構體圖 1：mybatis核心物件從MyBatis程式碼實現的角度來看，MyBatis的主要的核心部件有以下幾個： SqlSession &n

HTML+CSS第六課：初識CSS之CSS選擇器的使用、為HTML文件新增CSS樣式的3種方式

知識點：CSS的概念及語法、CSS選擇器的使用、CSS選擇器的優先順序、新增CSS樣式的3種方式。 1、CSS概念理解 CSS 是Cascading Style Sheet的縮寫，可以翻譯為“層疊樣式表”或者“級聯樣式表”，即“樣式

第七篇 Postman+Node.js+Newman+Jenkins實現自動化測試

今天終於不咋忙了，學習整理一下一直想做卻沒實現的事兒，這事已經摺磨團隊半年之久了。因為專案是B端業務的測試，測試過程中需要生產大量的測試資料，而且都是跨多個系統的測試，對於後置流程的測試，這些同學往往要想有一條測試資料，就要自個去一步步的操作前置流程，最關鍵的是太耗時間，一條資料可能要花掉1個小時左右，加上測

【.NET Core專案實戰-統一認證平臺】第七章閘道器篇-自定義客戶端限流

原文: 【.NET Core專案實戰-統一認證平臺】第七章閘道器篇-自定義客戶端限流【.NET Core專案實戰-統一認證平臺】開篇及目錄索引上篇文章我介紹瞭如何在閘道器上增加自定義客戶端授權功能，從設計到編碼實現，一步一步詳細講解，相信大家也掌握了自定義中介軟體的開發技巧了，本篇我們將介紹如

第五十六 css選擇器和盒模型

1.組合選擇器群組選擇器 #每個選擇為可以位三種基礎選擇器任意一個，用逗號隔開，控制多個。 div,#div,.div{ color:red } 後代（子代）選擇器 .sup .sub{ 後代 } .sup .sub{

“毛星雲OpenCV3程式設計入門之python實現”第七篇影象拆分、合併

5.3影象拆分、合併 python程式碼： # -*- coding: utf-8 -*- import cv2 import numpy as np srcImage = cv2.imread("E:/Study/python/OpenCV_study/i

【資料結構與演算法】之排序全家桶(十大排序詳解及其Java實現)---第七篇

本篇文章彙總了10種場常見的排序演算法，篇幅較長，可以通過下面的索引目錄進行定位查閱： 7、桶排序一、排序的基本概念 1、排序的定義排序：就是使一串記錄，按照其中的某個或者某些關鍵字的大小，遞增或遞減的排列起來

JavaScript實現CSS選擇器

先看下面一段程式碼： <!DOCTYPE html> <html> <meta charset="utf-8"/> <head> </head> <body> <div>

pyQuery在python中，實現css選擇器功能

# -*- coding=utf-8 -*- import sys import pdb from pyquery import PyQuery as pyq import urllib url=r'http://list.taobao.com/browse/cat-0.

CSS的七種基本選擇器及其權值

一、學習選擇器的優先順序，我們要知道的是：寫到選擇器裡面的樣式都會生效，只有樣式出現衝突的時候才會有優先順序的概念；二、七種常用的基本選擇器型別： 1.通配選擇器 *{ } 代表文件裡所有標籤，一般

程式設計實現一個css選擇器總結

題目：實現一個getCssSelector方法，可以根據給定的元素生成一個css選擇器，通過這個選擇器可以快速定位到這個元素（document.querySelector(A)）。<!DOCTYPE html> <html> <head>

使用原生JavaScript實現jQuery的css選擇器

使用原生JS實現jQuery的css選擇器，考慮以下幾個問題： 1.jQuery用$符號傳參的形式獲取節點的物件：1)傳參有可能是字串；2）有可能是一個節點物件；3）有可能直接是一個函式，就是$(fu

第七篇 css選擇器實現字段解析

相關推薦