ES6學習筆記(十五)Generator函數的異步應用
1.傳統方法
ES6 誕生以前,異步編程的方法,大概有下面四種。
- 回調函數
- 事件監聽
- 發布/訂閱
- Promise 對象
Generator 函數將 JavaScript 異步編程帶入了一個全新的階段。
2.基本概念
異步
所謂"異步",簡單說就是一個任務不是連續完成的,可以理解成該任務被人為分成兩段,先執行第一段,然後轉而執行其他任務,等做好了準備,再回過頭執行第二段。
比如,有一個任務是讀取文件進行處理,任務的第一段是向操作系統發出請求,要求讀取文件。然後,程序執行其他任務,等到操作系統返回文件,再接著執行任務的第二段(處理文件)。這種不連續的執行,就叫做異步。
相應地,連續的執行就叫做同步。由於是連續執行,不能插入其他任務,所以操作系統從硬盤讀取文件的這段時間,程序只能幹等著。
回調函數
JavaScript 語言對異步編程的實現,就是回調函數。所謂回調函數,就是把任務的第二段單獨寫在一個函數裏面,等到重新執行這個任務的時候,就直接調用這個函數。回調函數的英語名字callback
,直譯過來就是"重新調用"。
最典型的回調,讀取文件進行處理,是這樣寫的。
fs.readFile(‘/etc/passwd‘, ‘utf-8‘, function (err, data) { if (err) throw err; console.log(data); });
上面代碼中,readFile
函數的第三個參數,就是回調函數,也就是任務的第二段。等到操作系統返回了/etc/passwd
一個有趣的問題是,為什麽 Node 約定,回調函數的第一個參數,必須是錯誤對象err
(如果沒有錯誤,該參數就是null
)?
原因是執行分成兩段,第一段執行完以後,任務所在的上下文環境就已經結束了。在這以後拋出的錯誤,原來的上下文環境已經無法捕捉,只能當作參數,傳入第二段。
Promise
回調函數本身並沒有問題,它的問題出現在多個回調函數嵌套。假定讀取A
文件之後,再讀取B
文件,代碼如下。
fs.readFile(fileA, ‘utf-8‘, function (err, data) { fs.readFile(fileB, ‘utf-8‘, function(err, data) { // ... }); });
不難想象,如果依次讀取兩個以上的文件,就會出現多重嵌套。代碼不是縱向發展,而是橫向發展,很快就會亂成一團,無法管理。因為多個異步操作形成了強耦合,只要有一個操作需要修改,它的上層回調函數和下層回調函數,可能都要跟著修改。這種情況就稱為"回調函數地獄"(callback hell)。
Promise 對象就是為了解決這個問題而提出的。它不是新的語法功能,而是一種新的寫法,允許將回調函數的嵌套,改成鏈式調用。采用 Promise,連續讀取多個文件,寫法如下。
1 var readFile = require(‘fs-readfile-promise‘); 2 3 readFile(fileA) 4 .then(function (data) { 5 console.log(data.toString()); 6 }) 7 .then(function () { 8 return readFile(fileB); 9 }) 10 .then(function (data) { 11 console.log(data.toString()); 12 }) 13 .catch(function (err) { 14 console.log(err); 15 });
上面代碼中,我使用了fs-readfile-promise
模塊,它的作用就是返回一個 Promise 版本的readFile
函數。Promise 提供then
方法加載回調函數,catch
方法捕捉執行過程中拋出的錯誤。
可以看到,Promise 的寫法只是回調函數的改進,使用then
方法以後,異步任務的兩段執行看得更清楚了,除此以外,並無新意。
Promise 的最大問題是代碼冗余,原來的任務被 Promise 包裝了一下,不管什麽操作,一眼看去都是一堆then
,原來的語義變得很不清楚。
那麽,有沒有更好的寫法呢?那就是最新的async/await語法,比Generator更加簡單,號稱異步的終極解決方案。
3.Generator 函數
協程
傳統的編程語言,早有異步編程的解決方案(其實是多任務的解決方案)。其中有一種叫做"協程"(coroutine),意思是多個線程互相協作,完成異步任務。
協程有點像函數,又有點像線程。它的運行流程大致如下。
- 第一步,協程
A
開始執行。 - 第二步,協程
A
執行到一半,進入暫停,執行權轉移到協程B
。 - 第三步,(一段時間後)協程
B
交還執行權。 - 第四步,協程
A
恢復執行。
上面流程的協程A
,就是異步任務,因為它分成兩段(或多段)執行。
舉例來說,讀取文件的協程寫法如下。
function* asyncJob() { // ...其他代碼 var f = yield readFile(fileA); // ...其他代碼 }
上面代碼的函數asyncJob
是一個協程,它的奧妙就在其中的yield
命令。它表示執行到此處,執行權將交給其他協程。也就是說,yield
命令是異步兩個階段的分界線。
協程遇到yield
命令就暫停,等到執行權返回,再從暫停的地方繼續往後執行。它的最大優點,就是代碼的寫法非常像同步操作,如果去除yield
命令,簡直一模一樣。
協程的 Generator 函數實現
Generator 函數是協程在 ES6 的實現,最大特點就是可以交出函數的執行權(即暫停執行)。
整個 Generator 函數就是一個封裝的異步任務,或者說是異步任務的容器。異步操作需要暫停的地方,都用yield
語句註明。Generator 函數的執行方法如下。
function* gen(x) { var y = yield x + 2; return y; } var g = gen(1); g.next() // { value: 3, done: false } g.next() // { value: undefined, done: true }
上面代碼中,調用 Generator 函數,會返回一個內部指針(即遍歷器)g
。這是 Generator 函數不同於普通函數的另一個地方,即執行它不會返回結果,返回的是指針對象。
調用指針g
的next
方法,會移動內部指針(即執行異步任務的第一段),指向第一個遇到的yield
語句,上例是執行到x + 2
為止。
換言之,next
方法的作用是分階段執行Generator
函數。每次調用next
方法,會返回一個對象,表示當前階段的信息(value
屬性和done
屬性)。value
屬性是yield
語句後面表達式的值,表示當前階段的值;done
屬性是一個布爾值,表示 Generator 函數是否執行完畢,即是否還有下一個階段。
Generator 函數的數據交換和錯誤處理
Generator 函數可以暫停執行和恢復執行,這是它能封裝異步任務的根本原因。除此之外,它還有兩個特性,使它可以作為異步編程的完整解決方案:函數體內外的數據交換和錯誤處理機制。
next
返回值的 value 屬性,是 Generator 函數向外輸出數據;next
方法還可以接受參數,向 Generator 函數體內輸入數據。
function* gen(x){ var y = yield x + 2; return y; } var g = gen(1); g.next() // { value: 3, done: false } g.next(2) // { value: 2, done: true }
Generator 函數內部還可以部署錯誤處理代碼,捕獲函數體外拋出的錯誤。
1 function* gen(x){ 2 try { 3 var y = yield x + 2; 4 } catch (e){ 5 console.log(e); 6 } 7 return y; 8 } 9 10 var g = gen(1); 11 g.next(); 12 g.throw(‘出錯了‘); 13 // 出錯了
上面代碼的最後一行,Generator 函數體外,使用指針對象的throw
方法拋出的錯誤,可以被函數體內的try...catch
代碼塊捕獲。這意味著,出錯的代碼與處理錯誤的代碼,實現了時間和空間上的分離,這對於異步編程無疑是很重要的。
異步任務的封裝
var fetch = require(‘node-fetch‘); function* gen(){ var url = ‘https://api.github.com/users/github‘; var result = yield fetch(url); console.log(result.bio); }
上面代碼中,Generator 函數封裝了一個異步操作,該操作先讀取一個遠程接口,然後從 JSON 格式的數據解析信息。就像前面說過的,這段代碼非常像同步操作,除了加上了yield
命令。
執行這段代碼的方法如下。
var g = gen(); var result = g.next(); result.value.then(function(data){ return data.json(); }).then(function(data){ g.next(data); });
上面代碼中,首先執行 Generator 函數,獲取遍歷器對象,然後使用next
方法(第二行),執行異步任務的第一階段。由於Fetch
模塊返回的是一個 Promise 對象,因此要用then
方法調用下一個next
方法。
可以看到,雖然 Generator 函數將異步操作表示得很簡潔,但是流程管理卻不方便(即何時執行第一階段、何時執行第二階段)。
4.Thunk 函數
Thunk 函數是自動執行 Generator 函數的一種方法。也就是說不用每次調next()了?
參數的求值策略
Thunk 函數早在上個世紀 60 年代就誕生了。
那時,編程語言剛剛起步,計算機學家還在研究,編譯器怎麽寫比較好。一個爭論的焦點是"求值策略",即函數的參數到底應該何時求值。
var x = 1; function f(m) { return m * 2; } f(x + 5)
上面代碼先定義函數f
,然後向它傳入表達式x + 5
。請問,這個表達式應該何時求值?
一種意見是"傳值調用"(call by value),即在進入函數體之前,就計算x + 5
的值(等於 6),再將這個值傳入函數f
。C 語言就采用這種策略。
f(x + 5) // 傳值調用時,等同於 f(6)
另一種意見是“傳名調用”(call by name),即直接將表達式x + 5
傳入函數體,只在用到它的時候求值。Haskell 語言采用這種策略。
f(x + 5) // 傳名調用時,等同於 (x + 5) * 2
傳值調用和傳名調用,哪一種比較好?
回答是各有利弊。傳值調用比較簡單,但是對參數求值的時候,實際上還沒用到這個參數,有可能造成性能損失。假如根本用不到這個參數,豈不是白求值了。
function f(a, b){ return b; } f(3 * x * x - 2 * x - 1, x);
上面代碼中,函數f
的第一個參數是一個復雜的表達式,但是函數體內根本沒用到。對這個參數求值,實際上是不必要的。因此,有一些計算機學家傾向於"傳名調用",即只在執行時求值。
JavaScript是傳值調用。
Thunk 函數的含義
編譯器的“傳名調用”實現,往往是將參數放到一個臨時函數之中,再將這個臨時函數傳入函數體。這個臨時函數就叫做 Thunk 函數。
1 function f(m) { 2 return m * 2; 3 } 4 5 f(x + 5); 6 7 // 等同於 8 9 var thunk = function () { 10 return x + 5; 11 }; 12 13 function f(thunk) { 14 return thunk() * 2; 15 }
上面代碼中,函數 f 的參數x + 5
被一個函數替換了。凡是用到原參數的地方,對Thunk
函數求值即可。
這就是 Thunk 函數的定義,它是“傳名調用”的一種實現策略,用來替換某個表達式。
JavaScript 語言的 Thunk 函數
JavaScript 語言是傳值調用,它的 Thunk 函數含義有所不同。在 JavaScript 語言中,Thunk 函數替換的不是表達式,而是多參數函數,將其替換成一個只接受回調函數作為參數的單參數函數。
1 // 正常版本的readFile(多參數版本) 2 fs.readFile(fileName, callback); 3 4 // Thunk版本的readFile(單參數版本) 5 var Thunk = function (fileName) { 6 return function (callback) { 7 return fs.readFile(fileName, callback); 8 }; 9 }; 10 11 var readFileThunk = Thunk(fileName); 12 readFileThunk(callback);
上面代碼中,fs
模塊的readFile
方法是一個多參數函數,兩個參數分別為文件名和回調函數。經過轉換器處理,它變成了一個單參數函數,只接受回調函數作為參數。這個單參數版本,就叫做 Thunk 函數。
任何函數,只要參數有回調函數,就能寫成 Thunk 函數的形式。下面是一個簡單的 Thunk 函數轉換器。
1 // ES5版本 2 var Thunk = function(fn){ 3 return function (){ 4 var args = Array.prototype.slice.call(arguments); 5 return function (callback){ 6 args.push(callback); 7 return fn.apply(this, args); 8 } 9 }; 10 }; 11 12 // ES6版本 13 const Thunk = function(fn) { 14 return function (...args) { 15 return function (callback) { 16 return fn.call(this, ...args, callback); 17 } 18 }; 19 };
使用上面的轉換器,生成fs.readFile
的 Thunk 函數。
var readFileThunk = Thunk(fs.readFile); readFileThunk(fileA)(callback);
下面是另一個完整的例子。
function f(a, cb) { cb(a); } const ft = Thunk(f); ft(1)(console.log) // 1
ES6學習筆記(十五)Generator函數的異步應用