函數語言程式設計的Java編碼實踐：利用惰性寫出高效能且抽象的程式碼

阿新 • • 發佈：2021-11-08

簡介：本文會以惰性載入為例一步步介紹函數語言程式設計中各種概念，所以讀者不需要任何函數語言程式設計的基礎，只需要對 Java 8 有些許瞭解即可。

作者 | 懸衡

來源 | 阿里技術公眾號

本文會以惰性載入為例一步步介紹函數語言程式設計中各種概念，所以讀者不需要任何函數語言程式設計的基礎，只需要對 Java 8 有些許瞭解即可。

一抽象一定會導致程式碼效能降低？

程式設計師的夢想就是能寫出 “高內聚，低耦合”的程式碼，但從經驗上來看，越抽象的程式碼往往意味著越低的效能。機器可以直接執行的彙編效能最強，C 語言其次，Java 因為較高的抽象層次導致效能更低。業務系統也受到同樣的規律制約，底層的數增刪改查介面效能最高，上層業務介面，因為增加了各種業務校驗，以及訊息傳送，導致效能較低。

對效能的顧慮，也制約程式設計師對於模組更加合理的抽象。

一起來看一個常見的系統抽象，“使用者” 是系統中常見的一個實體，為了統一系統中的 “使用者” 抽象，我們定義了一個通用領域模型 User，除了使用者的 id 外，還含有部門資訊，使用者的主管等等，這些都是常常在系統中聚合在一起使用的屬性:

public class User {
    // 使用者 id
    private Long uid;
    // 使用者的部門，為了保持示例簡單，這裡就用普通的字串
    // 需要遠端呼叫 通訊錄系統 獲得
    private String department;
    // 使用者的主管，為了保持示例簡單，這裡就用一個 id 表示
    // 需要遠端呼叫 通訊錄系統 獲得
    private Long supervisor;
    // 使用者所持有的許可權
    // 需要遠端呼叫 許可權系統 獲得
    private Set< String> permission;
}

這看起來非常棒，“使用者“常用的屬性全部集中到了一個實體裡，只要將這個 User 作為方法的引數，這個方法基本就不再需要查詢其他使用者資訊了。但是一旦實施起來就會發現問題，部門和主管資訊需要遠端呼叫通訊錄系統獲得，許可權需要遠端呼叫許可權系統獲得，每次構造 User 都必須付出這兩次遠端呼叫的代價，即使有的資訊沒有用到。比如下面的方法就展示了這種情況（判斷一個使用者是否是另一個使用者的主管）：

public boolean isSupervisor(User u1, User u2) {
    return Objects.equals(u1.getSupervisor(), u2.getUid());
}

為了能在上面這個方法引數中使用通用 User 實體，必須付出額外的代價：遠端呼叫獲得完全用不到的許可權資訊，如果許可權系統出現了問題，還會影響無關介面的穩定性。

想到這裡我們可能就想要放棄通用實體的方案了，讓裸露的 uid 瀰漫在系統中，在系統各處散落使用者資訊查詢程式碼。

其實稍作改進就可以繼續使用上面的抽象，只需要將 department, supervisor 和 permission 全部變成惰性載入的欄位，在需要的時候才進行外部呼叫獲得，這樣做有非常多的好處：

業務建模只需要考慮貼合業務，而不需要考慮底層的效能問題，真正實現業務層和物理層的解耦
業務邏輯與外部呼叫分離，無論外部介面如何變化，我們總是有一層適配層保證核心邏輯的穩定
業務邏輯看起來就是純粹的實體操作，易於編寫單元測試，保障核心邏輯的正確性

但是在實踐的過程中常會遇到一些問題，本文就結合 Java 以及函數語言程式設計的一些技巧，一起來實現一個惰性載入工具類。

二嚴格與惰性：Java 8 的 Supplier 的本質

Java 8 引入了全新的函式式介面 Supplier，從老 Java 程式設計師的角度理解，它不過就是一個可以獲取任意值的介面而已，Lambda 不過是這種介面實現類的語法糖。這是站在語言角度而不是計算角度的理解。當你瞭解了嚴格（strict）與惰性（lazy）的區別之後，可能會有更加接近計算本質的看法。

因為 Java 和 C 都是嚴格的程式語言，所以我們習慣了變數在定義的地方就完成了計算。事實上，還有另外一個程式語言流派，它們是在變數使用的時候才進行計算的，比如函數語言程式設計語言 Haskell。

所以 Supplier 的本質是在 Java 語言中引入了惰性計算的機制，為了在 Java 中實現等價的惰性計算，可以這麼寫：

Supplier< Integer> a = () -> 10 + 1;
int b = a.get() + 1;

三 Supplier 的進一步優化：Lazy

Supplier 還存在一個問題，就是每次通過 get 獲取值時都會重新進行計算，真正的惰性計算應該在第一次 get 後把值快取下來。只要對 Supplier 稍作包裝即可：

/**
* 為了方便與標準的 Java 函式式介面互動，Lazy 也實現了 Supplier
*/
public class Lazy< T> implements Supplier< T> {

    private final Supplier< ? extends T> supplier;
    
    // 利用 value 屬性快取 supplier 計算後的值
    private T value;

    private Lazy(Supplier< ? extends T> supplier) {
        this.supplier = supplier;
    }

    public static < T> Lazy< T> of(Supplier< ? extends T> supplier) {
        return new Lazy< >(supplier);
    }

    public T get() {
        if (value == null) {
            T newValue = supplier.get();

            if (newValue == null) {
                throw new IllegalStateException("Lazy value can not be null!");
            }

            value = newValue;
        }

        return value;
    }
}

通過 Lazy 來寫之前的惰性計算程式碼：

Lazy< Integer> a = Lazy.of(() -> 10 + 1);
int b = a.get() + 1;
// get 不會再重新計算, 直接用快取的值
int c = a.get();

通過這個惰性載入工具類來優化我們之前的通用使用者實體：

public class User {
    // 使用者 id
    private Long uid;
    // 使用者的部門，為了保持示例簡單，這裡就用普通的字串
    // 需要遠端呼叫 通訊錄系統 獲得
    private Lazy< String> department;
    // 使用者的主管，為了保持示例簡單，這裡就用一個 id 表示
    // 需要遠端呼叫 通訊錄系統 獲得
    private Lazy< Long> supervisor;
    // 使用者所含有的許可權
    // 需要遠端呼叫 許可權系統 獲得
    private Lazy< Set< String>> permission;
    
    public Long getUid() {
        return uid;
    }
    
    public void setUid(Long uid) {
        this.uid = uid;
    }
    
    public String getDepartment() {
        return department.get();
    }
    
    /**
    * 因為 department 是一個惰性載入的屬性，所以 set 方法必須傳入計算函式，而不是具體值
    */
    public void setDepartment(Lazy< String> department) {
        this.department = department;
    }
    // ... 後面類似的省略
}

一個簡單的構造 User 實體的例子如下：

Long uid = 1L;
User user = new User();
user.setUid(uid);
// departmentService 是一個rpc呼叫
user.setDepartment(Lazy.of(() -> departmentService.getDepartment(uid)));
// ....

這看起來還不錯，但當你繼續深入使用時會發現一些問題：使用者的兩個屬性部門和主管是有相關性，需要通過 rpc 介面獲得使用者部門，然後通過另一個 rpc 介面根據部門獲得主管。程式碼如下：

String department = departmentService.getDepartment(uid);
Long supervisor = SupervisorService.getSupervisor(department);

但是現在 department 不再是一個計算好的值了，而是一個惰性計算的 Lazy 物件，上面的程式碼又應該怎麼寫呢？"函子" 就是用來解決這個問題的

四 Lazy 實現函子（Functor）

快速理解：類似 Java 中的 stream api 或者 Optional 中的 map 方法。函子可以理解為一個介面，而 map 可以理解為介面中的方法。

1 函子的計算物件

Java 中的 Collection< T>，Optional< T>，以及我們剛剛實現 Lazy< T>，都有一個共同特點，就是他們都有且僅有一個泛型引數，我們在這篇文章中暫且稱其為盒子，記做 Box< T>，因為他們都好像一個萬能的容器，可以任意型別打包進去。

2 函子的定義

函子運算可以將一個 T 對映到 S 的 function 應用到 Box< T> 上，讓其成為 Box< S>，一個將 Box 中的數字轉換為字串的例子如下：

在盒子中裝的是型別，而不是 1 和 "1" 的原因是，盒子中不一定是單個值，比如集合，甚至是更加複雜的多值對映關係。

需要注意的是，並不是隨便定義一個簽名滿足 Box< S> map(Function< T,S> function) 就能讓 Box< T> 成為函子的，下面就是一個反例：

// 反例，不能成為函子，因為這個方法沒有在盒子中如實反映 function 的對映關係
public Box< S> map(Function< T,S> function) {
    return new Box< >(null);
}

所以函子是比 map 方法更加嚴格的定義，他還要求 map 滿足如下的定律，稱為函子定律（定律的本質就是保障 map 方法能如實反映引數 function 定義的對映關係）：

單位元律：Box< T> 在應用了恆等函式後，值不會改變，即 box.equals(box.map(Function.identity()))始終成立（這裡的 equals 只是想表達的一個數學上相等的含義）
複合律：假設有兩個函式 f1 和 f2，map(x -> f2(f1(x))) 和 map(f1).map(f2) 始終等價

很顯然 Lazy 是滿足上面兩個定律的。

3 Lazy 函子

雖然介紹了這麼多理論，實現卻非常簡單：

    public < S> Lazy< S> map(Function< ? super T, ? extends S> function) {
        return Lazy.of(() -> function.apply(get()));
    }

可以很容易地證明它是滿足函子定律的。

通過 map 我們很容易解決之前遇到的難題，map 中傳入的函式可以在假設部門資訊已經獲取到的情況下進行運算：

Lazy< String> departmentLazy = Lazy.of(() -> departmentService.getDepartment(uid));
Lazy< Long> supervisorLazy = departmentLazy.map(
    department -> SupervisorService.getSupervisor(department)
);

4 遇到了更加棘手的情況

我們現在不僅可以構造惰性的值，還可以用一個惰性值計算另一個惰性值，看上去很完美。但是當你進一步深入使用的時候，又發現了更加棘手的問題。

我現在需要部門和主管兩個引數來呼叫許可權系統來獲得許可權，而部門和主管這兩個值都是惰性的值。先用巢狀 map 來試一下：

Lazy< Lazy< Set< String>>> permissions = departmentLazy.map(department ->
         supervisorLazy.map(supervisor -> getPermissions(department, supervisor))
);

返回值的型別好像有點奇怪，我們期待得到的是 Lazy< Set< String>>，這裡得到的卻多了一層變成 Lazy< Lazy< Set< String>>>。而且隨著你巢狀 map 層數增加，Lazy 的泛型層次也會同樣增加，三引數的例子如下：

Lazy< Long> param1Lazy = Lazy.of(() -> 2L);
Lazy< Long> param2Lazy = Lazy.of(() -> 2L);
Lazy< Long> param3Lazy = Lazy.of(() -> 2L);
Lazy< Lazy< Lazy< Long>>> result = param1Lazy.map(param1 ->
        param2Lazy.map(param2 ->
                param3Lazy.map(param3 -> param1 + param2 + param3)
        )
);

這個就需要下面的單子運算來解決了。

五 Lazy 實現單子（Monad）

快速理解：和 Java stream api 以及 Optional 中的 flatmap 功能類似

1 單子的定義

單子和函子的重大區別在於接收的函式，函子的函式一般返回的是原生的值，而單子的函式返回卻是一個盒裝的值。下圖中的 function 如果用 map 而不是 flatmap 的話，就會導致結果變成一個俄羅斯套娃--兩層盒子。

單子當然也有單子定律，但是比函子定律要複雜些，這裡就不做闡釋了，他的作用和函子定律也是類似，確保 flatmap 能夠如實反映 function 的對映關係。

2 Lazy 單子

實現同樣很簡單：

    public < S> Lazy< S> flatMap(Function< ? super T, Lazy< ? extends S>> function) {
        return Lazy.of(() -> function.apply(get()).get());
    }

利用 flatmap 解決之前遇到的問題：

Lazy< Set< String>> permissions = departmentLazy.flatMap(department ->
         supervisorLazy.map(supervisor -> getPermissions(department, supervisor))
);

三引數的情況：

Lazy< Long> param1Lazy = Lazy.of(() -> 2L);
Lazy< Long> param2Lazy = Lazy.of(() -> 2L);
Lazy< Long> param3Lazy = Lazy.of(() -> 2L);
Lazy< Long> result = param1Lazy.flatMap(param1 ->
        param2Lazy.flatMap(param2 ->
                param3Lazy.map(param3 -> param1 + param2 + param3)
        )
);

其中的規律就是，最後一次取值用 map，其他都用 flatmap。

3 題外話：函式式語言中的單子語法糖

看了上面的例子你一定會覺得惰性計算好麻煩，每次為了取裡面的惰性值都要經歷多次的 flatmap 與 map。這其實是 Java 沒有原生支援函數語言程式設計而做的妥協之舉，Haskell 中就支援用 do 記法簡化 Monad 的運算，上面三引數的例子如果用 Haskell 則寫做：

do
    param1 < - param1Lazy
    param2 < - param2Lazy
    param3 < - param3Lazy
    -- 註釋: do 記法中 return 的含義和 Java 完全不一樣
    -- 它表示將值打包進盒子裡,
    -- 等價的 Java 寫法是 Lazy.of(() -> param1 + param2 + param3)
    return param1 + param2 + param3

Java 中雖然沒有語法糖，但是上帝關了一扇門，就會開啟一扇窗。在 Java 中可以清晰地看出每一步在做什麼，理解其中的原理，如果你讀過了本文之前的內容，肯定能明白這個 do 記法就是不停地在做 flatmap 。

六 Lazy 的最終程式碼

目前為止，我們寫的 Lazy 程式碼如下：

public class Lazy< T> implements Supplier< T> {

    private final Supplier< ? extends T> supplier;

    private T value;

    private Lazy(Supplier< ? extends T> supplier) {
        this.supplier = supplier;
    }

    public static < T> Lazy< T> of(Supplier< ? extends T> supplier) {
        return new Lazy< >(supplier);
    }

    public T get() {
        if (value == null) {
            T newValue = supplier.get();

            if (newValue == null) {
                throw new IllegalStateException("Lazy value can not be null!");
            }

            value = newValue;
        }

        return value;
    }

    public < S> Lazy< S> map(Function< ? super T, ? extends S> function) {
        return Lazy.of(() -> function.apply(get()));
    }

    public < S> Lazy< S> flatMap(Function< ? super T, Lazy< ? extends S>> function) {
        return Lazy.of(() -> function.apply(get()).get());
    }
}

七構造一個能夠自動優化效能的實體

利用 Lazy 我們寫一個構造通用 User 實體的工廠：

@Component
public class UserFactory {
    
    // 部門服務, rpc 介面
    @Resource
    private DepartmentService departmentService;
    
    // 主管服務, rpc 介面
    @Resource
    private SupervisorService supervisorService;
    
    // 許可權服務, rpc 介面
    @Resource
    private PermissionService permissionService;
    
    public User buildUser(long uid) {
        Lazy< String> departmentLazy = Lazy.of(() -> departmentService.getDepartment(uid));
        // 通過部門獲得主管
        // department -> supervisor
        Lazy< Long> supervisorLazy = departmentLazy.map(
            department -> SupervisorService.getSupervisor(department)
        );
        // 通過部門和主管獲得許可權
        // department, supervisor -> permission
        Lazy< Set< String>> permissionsLazy = departmentLazy.flatMap(department ->
            supervisorLazy.map(
                supervisor -> permissionService.getPermissions(department, supervisor)
            )
        );
        
        User user = new User();
        user.setUid(uid);
        user.setDepartment(departmentLazy);
        user.setSupervisor(supervisorLazy);
        user.setPermissions(permissionsLazy);
    }
}

工廠類就是在構造一顆求值樹，通過工廠類可以清晰地看出 User 各個屬性間的求值依賴關係，同時 User 物件能夠在執行時自動地優化效能，一旦某個節點被求值，路徑上的所有屬性的值都會被快取。

八異常處理

雖然我們通過惰性讓 user.getDepartment() 彷彿是一次純記憶體操作，但是他實際上還是一次遠端呼叫，所以可能出現各種出乎意料的異常，比如超時等等。

異常處理肯定不能交給業務邏輯，這樣會影響業務邏輯的純粹性，讓我們前功盡棄。比較理想的方式是交給惰性值的載入邏輯 Supplier。在 Supllier 的計算邏輯中就充分考慮各種異常情況，重試或者丟擲異常。雖然丟擲異常可能不是那麼“函式式”，但是比較貼近 Java 的程式設計習慣，而且在關鍵的值獲取不到時就應該通過異常阻斷業務邏輯的執行。

九總結

利用本文方法構造的實體，可以將業務建模上需要的屬性全部放置進去，業務建模只需要考慮貼合業務，而不需要考慮底層的效能問題，真正實現業務層和物理層的解耦。

同時 UserFactory 本質上就是一個外部介面的適配層，一旦外部介面發生變化，只需要修改適配層即可，能夠保護核心業務程式碼的穩定。

業務核心程式碼因為外部呼叫大大減少，程式碼更加接近純粹的運算，因而易於書寫單元測試，通過單元測試能夠保證核心程式碼的穩定且不會出錯。

十題外話：Java 中缺失的柯里化與應用函子（Applicative）

仔細想想，剛剛做了這麼多，目的就是一個，讓簽名為 C f(A,B) 的函式可以無需修改地應用到盒裝型別 Box< A>和 Box< B> 上，並且產生一個 Box< C>，在函式式語言中有更加方便的方法，那就是應用函子。

應用函子概念上非常簡單，就是將盒裝的函式應用到盒裝的值上，最後得到一個盒裝的值，在 Lazy 中可以這麼實現：

    // 注意，這裡的 function 是裝在 lazy 裡面的
    public < S> Lazy< S> apply(Lazy< Function< ? super T, ? extends S>> function) {
        return Lazy.of(() -> function.get().apply(get()));
    }

不過在 Java 中實現這個並沒有什麼用，因為 Java 不支援柯里化。

柯里化允許我們將函式的幾個引數固定下來變成一個新的函式，假如函式簽名為 f(a,b)，支援柯里化的語言允許直接 f(a) 進行呼叫，此時返回值是一個只接收 b 的函式。

在支援柯里化的情況下，只需要連續的幾次應用函子，就可以將普通的函式應用在盒裝型別上了，舉個 Haskell 的例子如下（< *> 是 Haskell 中應用函子的語法糖, f 是個簽名為 c f(a, b) 的函式，語法不完全正確，只是表達個意思）：

-- 註釋: 結果為 box c
box f < *> box a < *> box b

參考資料

在 Java 函式式類庫 VAVR 中提供了類似的 Lazy 實現，不過如果只是為了用這個一個類的話，引入整個庫還是有些重，可以利用本文的思路直接自己實現
函數語言程式設計進階：應用函子前端角度的函數語言程式設計文章，本文一定程度上參考了裡面盒子的類比方法：掘金
《Haskell函數語言程式設計基礎》
《Java函數語言程式設計》

原文連結
本文為阿里雲原創內容，未經允許不得轉載。

函數語言程式設計的Java編碼實踐：利用惰性寫出高效能且抽象的程式碼

一抽象一定會導致程式碼效能降低？

二嚴格與惰性：Java 8 的 Supplier 的本質

三 Supplier 的進一步優化：Lazy

四 Lazy 實現函子（Functor）

五 Lazy 實現單子（Monad）

六 Lazy 的最終程式碼

七構造一個能夠自動優化效能的實體

八異常處理

九總結

十題外話：Java 中缺失的柯里化與應用函子（Applicative）

函數語言程式設計的Java編碼實踐：利用惰性寫出高效能且抽象的程式碼

Java基礎：函數語言程式設計的函式的本質

Python入門學習筆記9：Python高階語法與用法-列舉、函數語言程式設計<閉包>

詳解JAVA 函數語言程式設計

Python入門學習筆記10：函數語言程式設計:匿名函式、高階函式、裝飾器

Day3：函式與函數語言程式設計

Java函數語言程式設計

java函數語言程式設計－vavr

Java 8 函數語言程式設計

函數語言程式設計：如何高效簡潔地對資料查詢與變換

函數語言程式設計：從命令式重構到函式式

《On Java 8》讀書筆記013_函數語言程式設計

Js ES6函數語言程式設計：函子

（資料科學學習手札101）funcy：Python中的函數語言程式設計百寶箱

java-函數語言程式設計

一文帶你深入瞭解java和函數語言程式設計

JAVA函數語言程式設計之函式式介面

java函數語言程式設計及JDK常用函式式介面

typescript函數語言程式設計的一次實踐

Java中的函數語言程式設計（二）函式式介面Functional Interface

函數語言程式設計的Java編碼實踐：利用惰性寫出高效能且抽象的程式碼

一 抽象一定會導致程式碼效能降低？

二 嚴格與惰性：Java 8 的 Supplier 的本質

三 Supplier 的進一步優化：Lazy

四 Lazy 實現函子（Functor）

五 Lazy 實現單子 （Monad）

六 Lazy 的最終程式碼

七 構造一個能夠自動優化效能的實體

八 異常處理

九 總結

十 題外話：Java 中缺失的柯里化與應用函子（Applicative）

相關推薦

一抽象一定會導致程式碼效能降低？

二嚴格與惰性：Java 8 的 Supplier 的本質

五 Lazy 實現單子（Monad）

七構造一個能夠自動優化效能的實體

八異常處理

九總結

十題外話：Java 中缺失的柯里化與應用函子（Applicative）