jQuery1.11原始碼分析(1)-----Sizzle原始碼概覽[原創]

阿新 • • 發佈：2019-01-15

最近在啃jQuery1.11原始碼，上來就遇到Sizzle這個jQuery的大核心，雖然已經清楚了Sizzle的用途，先繞過去也沒事，但明知山有虎偏向虎山行才是我們要做的。

本文面向的閱讀物件:正在學習Sizzle原始碼或有一定前端基礎的同學們，可以一邊看原始碼一邊看這些文章進行驗證，所以雖然我會分析原始碼中的正則表示式,有大量的註釋，但不會講正則表示式的基本用法！(我會給出一些連結，但不一定全面，請鍛鍊自主搜尋的能力;為了避免歧義，本文的一些詞會採用原始碼中的英文或js中的屬性名)

Sizzle部分的程式碼已經啃完，本系列還有後續，這幾天將會一一放出。本文主要分為兩個部分：什麼是Sizzle

、Sizzle的原理以及Sizzle結構概覽

什麼是Sizzle？

簡單地來說，Sizzle是一個可以讓你用CSS 選擇器(selector)形式去獲取DOM元素的引擎。

當我們想了解一個函式的用途和原始碼，必須先看它的要求和效果，就是輸入和輸出。

例如:你提供一個CSS selector 'html > body'，Sizzle會返回給你一個數組，陣列中只有一個元素body元素。

還有更復雜的CSS selector，比如 ‘body > div#main div.content input[type="text"]:nth(2)’，更多selector的用法請看

Sizzle的原理

我們先想想，如果讓我們自己寫一個Sizzle，先不考慮其中遇到的設計和細節問題，你會怎麼做？

一個很自然的想法是，從父元素順藤摸瓜往下一層層找下去。比如‘html > body’，我先找到nodeName為html的元素，再檢視html的子元素裡有沒有一個nodeName為body的元素即可。

那麼會面對幾個問題：

你怎麼知道在哪兒找html元素？於是我們需要一個查詢上下文(context)，預設為文件節點(document)

你怎麼知道要找的是html元素而非h元素或者ht元素？所以我們需要一個詞法分析器(tokenize)，把selector切成三個詞元(token)(一個數組(tokens))，[‘html’,'>','body']。（關於詞法分析器，請學習編譯原理相關知識）

難道處理‘html’和處理‘>’的方式是一樣的？你怎麼知道它要查詢子元素？我們知道它們是不同的型別的詞元(token)，所以要記錄詞元的型別，上面的陣列變為[{value:'html',type:'TAG'},{value:'>',type:'>'},{value:'body',type:'TAG'}]，再交給對應的處理函式處理

難道每次我們都來上面這麼一套麼？我們經常用的不就是$('#id')或者$('.className')這樣簡單的用法麼？所以我們可以把這種高頻率的特殊情況拿出來先處理，處理不掉再用統一的方法處理。

上面這一套，從左往右匹配，從邏輯上來看是沒什麼問題的。那麼思考下面這種情況：

‘因為DOM是一種樹形結構，所以越往下層，子節點是越多的，那麼會有這樣一種情況，body元素下有10000個div子元素，其中在5000的位置處有一個div的id為suprise。’這時給你一個內容為body > div#suprise的selector，你寫的引擎會怎麼處理？

繼續用上面的方法，先找出body元素，然後一個個遍歷body的子元素？

可以預見的是效能上的悲劇。。。

所以我們的Sizzle採用的是從右向左的匹配方式:

先呼叫getElementById('suprise')來獲得該DOM元素(find過程)(因為瀏覽器低層目測會建立id的索引，所以獲得非常快，即使需要遍歷DOM樹，也比我們自己遍歷DOM樹快)，

再根據'>'判斷其父元素是否是body元素(filter過程)即可。

OK，到這裡為止效能方面有了一定的改進，再考慮一種情況:

'當我們需要查詢的層次很深時，比如selector為body > div#main div.content input[type="text"]時，我們需要先找到待選(seed)的input，再依次過濾[type="text"]、div.content 、div#main 、body>，你們會怎麼做？'

判斷不同的token型別，再通過查詢找到對應的過濾函式，並呼叫對應的過濾函式(filter)，這是一個正常的想法。

那麼我需要再用該selector來查詢一次呢？(這是使用jQuery非常常見的場景)把上面的過濾過程再重複一遍？

於是另一種提升效能的方式出現了——快取，把上面的多個過濾函式編譯成一個匹配函式(matcher)，然後以key-value的形式存在快取裡面，當我們再次查詢同樣的selector時，只需要把編譯好的匹配函式(matcher)給取出來過濾用就可以了。

Sizzle的全部原理大致如上，至於特性檢測、沙盒、bugfix這些細節，後面再說

Sizzle的結構概覽

Sizzle的結構不用記，大致看看就好，後面會一一說到的，放一張圖，來源：http://www.cnblogs.com/mufc-go/p/3299261.html

Sizzle結構圖

本文完。

剩下的下午健完身回來再發。

感謝@司徒正美（1.3版本原始碼分析），@nuysoft(1.7版本原始碼分析)，@Aaron（2.03版本原始碼分析）給我的參考。

如果你喜歡這篇文章，請給我一個推薦，如果覺得有問題，請在評論裡抽打我！

jQuery1.11原始碼分析(1)-----Sizzle原始碼概覽[原創]

jQuery1.11原始碼分析(1)-----Sizzle原始碼概覽[原創]

Netty Pipeline原始碼分析(1)

vue原始碼分析1-new Vue做了哪些操作

redis原始碼分析1------dict的實現

Netty原始碼分析:1.4伺服器啟動流程

Netty原始碼分析:1.3初始化NioServerSocketChannel

Netty原始碼分析:1.2初始化NioEventLoop

Netty原始碼分析:1.1初始化NioEventLoopGroup

《2.uboot和系統移植-第5部分-2.5.uboot原始碼分析1-啟動第一階段》

MyBatis原始碼分析-1-基礎支援層-反射模組-Reflector/ReflectorFactory

rxjs 原始碼分析1-(fromEvent)

谷歌瀏覽器的原始碼分析 1

Shiro原始碼分析(1)

3.21以太貓原始碼分析1

以太坊原始碼分析(1)go-ethereum的設計思路及模組組織形式

[9]【ffmpeg原始碼分析 1】av_register_all()和avcodec_register_all()

SpringMVC原始碼分析1：SpringMVC概述

Leveldb資料Compaction原始碼分析(1)

Egg 學習筆記-原始碼分析1

coreutils4.5.1 uniq.c原始碼分析1

jQuery1.11原始碼分析(1)-----Sizzle原始碼概覽[原創]

相關推薦