基於學習的證據合成方法研究

阿新 • • 發佈：2020-04-21

1. 傳統證據合成理論中存在的問題

在這篇文章中，筆者希望和大家一起討論關於傳統證據合成理論中面臨的兩個問題於挑戰，即【相關性問題】、【衝突性問題】。這兩個問題在現實世界中廣泛存在，圍繞這兩個問題的大量研究工作，推動了D-S證據理論的大踏步發展。

0x1：證據合成中的衝突性問題 -- 從Zadeh悖論說起

Dempster合成規則對各資訊源提供的證據是平等對待的，認為各資訊源提供證據的重要性與可靠性無優劣之分。但是實際應用中，不同的證據源提供證據的重要性與可靠性是存在差異的，這時如果還是直接應用傳統D-S合成規則就會遇到問題。

例如在上一篇文章的例子中，

兩名目擊證人（Peter and Mary），它們的證詞存在明顯的衝突，幾乎可以說是各執一詞了。但是根據D-S合成規則進行證據融合的結果卻明顯違反我們的理性認知。可信度全部分配給了Paul命題。

顯然，傳統D-S合成理論沒有很好地處理多源證據中的衝突性問題。

在這篇文章中，筆者和大家一起探討關於相關證據和證據重要性或可靠性不同時的證據合成問題。

0x2：證據合成中的相關性問題 -- 從特徵工程中相關性特徵的危害說起

我們在之前的文章中討論過相關性特徵導致過擬合的問題。由於傳統概率模型的對單原子特徵累乘的特性，特徵向量中如果存在很多相關性特徵，會導致某一方面的一組特徵獲得太大的累計權重，這種特徵權重聚集又進一步導致了過擬合現象的發生。

Relevant Link:

《證據推理理論、方法及其在決策評估中的應用》朱衛東、吳勇

0x3：相關性和衝突性是壞事嗎？

極端情況下：

證據之間完全衝突，彼此之間完全沒有交集
證據之間完全相關，彼此之間完全重合，本質上可以降維為單個證據

需要明白的是，相關性和衝突性這兩個詞，字面上看是貶義詞，實際上它們是我們現實世界中廣泛存在而又不可完全避免的現象。

用於支援事物的背後的證據，既不會呈現彼此完全衝突的狀態，也不會彼此完全重合（完全相關），而是像上圖那樣，同時存在相關性和衝突性。

而衝突性和相關性是兩個彼此相反的度量，衝突性越強，相關性就越弱；反之。

2. 相關證據合成方法

當兩個證據中某些焦元的基本可信數由同一證據源（或依據相同特徵、屬性）產生時，稱這樣的焦元為相關焦元，稱這兩個證據互為相關證據。

在相關證據的證據合成中，若不考慮證據的相關性，而用Dempster合成方法進行相關證據的合成，那麼將會產生其合成結果的超估計。

總體來說，相關證據合成方法的思想主要有兩種：

一種是在相關證據合成時將基本可信數乘以一個調整係數，力圖將相關證據轉化為相當的獨立證據，再按Dempster規則進行合成。
另一種是將兩個相關證據在已知相關源證據的條件下分解兩個相關證據為三個獨立的源證據，然後再將相互獨立的源證據按Dempster規則進行合成。

0x1：相關證據分解成獨立證據的合成方法

D-S證據理論只適用於證據彼此獨立的情況，而實際業務場景中，往往需要處理不獨立的證據。

上圖中，E_a、E_x、E_b 是三個獨立的證據，它們合成為 E₁、E₂ 這兩個相關證據。

E₁ 由 E_a 和 E_x 合成
E₂ 由 E_b 和 E_x 合成

反之，可以將 E₁、E₂ 這兩個相關證據看成三個獨立證據的合成。

證據 E₁、E₂、E_a、E_x、E_b 對應的基本可信數函式分別為 m₁、m₂、m_a、m_x、m_b，則有：

若直接用D-S理論合成 E₁ 與 E₂，則有：

從上式可以看到，合成中，獨立的源證據 E_x 被多用了一次。合成證據的 m函式理論上來說應為：

假設識別框架 Θ={C，D}，m_a、m_x、m_b、m₁、m₂，則 m^'、m 的差異的計算入下表所示：

如果已知獨立的相關源證據 E_x 的基本可分配數 m_x，則有由上面 m 和 m’ 的兩式相減，反向求出獨立源證據 E_a、E_b 的基本可分配數 m_a、m_b，然後，用Dempster合成方法對獨立源證據 E_a、E_b、E_x 合成求出 E₁、E₂ 合成證據的基本可信數函式 m。

相關證據分解成獨立證據的合成方法，從理論上說合理可行。但是，用該方法處理的相關證據要具備一些前提條件：

它只適用於相關焦元集合C的構成元素與相關證據 E1、E2 的核 A、B 的構成元素相等的情況，該條件是相關證據的特殊情況
它要求已知獨立的相關源證據 E_x 及其 m_x，這是應用該方法解決問題的關鍵
用Dempster合成公式反向求出獨立源證據 E_a、E_b 的的基本可分配數 m_a、m_b，計算工作量大，且計算結果不唯一

上述三個條件限制了該合成方法在一般相關證據合成中的應用。

0x2：調整相關證據基本可信數函式的合成方法

在相關證據的證據合成中，為了減少用Dempster合成方法進行相關證據的合成而產生其合成結果的超估計，產生了對相關證據的基本可信數進行衰減，以減少其合成結果的超估計，使相關證據合成的結果更接近獨立證據源的合成結果。

1、規範證據相關概念定義

1）證據強度 S(E)

證據 E 的焦元為 A(A₁，A₂，....，A_k)，焦元的個數為 n(A)，焦元 A_i 的基數是 |A_i|，焦元 Ai 的基本可信數為 m(A_i)，證據強度定義為 S(E)：

2）證據相關強度 S(E₁，E₂)

證據 E₁、E₂ 的相關焦元為 C(C₁，C₂，....，C_k)，焦元的個數為 n(C)，焦元 C_i 的基數是 |C_i|，證據相關強度為 S(E₁，E₂)：

3）E₁對 E₂證據的規範證據相關度 r(E₁，E₂)

3）E₂對 E1證據的規範證據相關度 r(E₂，E₁)

規範證據相關度與證據相關度成正比，證據相關度越大，相關證據的基本可信數對相關證據合成時的影響就越大。為了消除其影響，應對相關證據的基本可信數進行更大的修正，為此，用 1-r(E_i，E_j) 作為修正係數。

2、相關證據的修正合成方法

首先，對相關證據的基本可信數 m₁(A_i)、m₂(B_j) 按照下式進行修正：

完成上面的修正之後，就可以基於修正後的基本可信數按照Dempster合成規則進行合成。

3、基於相關證據的修正合成方法的缺點

以上相關證據合成方法存在以下兩個不足之處：

首先，定義的修正係數具有較強的假設性，它假設相關證據合成時，（1-規範證據相關度）與相關證據對合成證據焦元的基本可信數的超估計，遵循等比例關係。這樣，用修正後的證據可看成獨立證據。
其次，修正計算未考慮相關證據中相關焦元與非相關焦元的區別，而用修正係數對相關證據的所有焦元進行修正。

0x3：基於可變引數優化的相關證據合成方法

1、相關證據的相關焦元分佈情況分析

設相關證據 E₁、E₂ 對應的基本可信度分配分別為 m₁、m₂，對應的焦元分別為 A(A₁，A₂，...，A_n)、B(B₁，B₂，....，B_n)，相關焦元為 C(C₁，C₂，.....，C_k)，E₁、E₂ 的焦元的交集為 G，則相關證據的焦元的集合情況可用下圖表示：

相關焦元集合 C 與 A、B、G 的關係

對上圖分析可知，一般情況下，相關焦元的集合 C 滿足：

C 集合可分解成 C₁、C₂、C₃ 三個部分，。

特殊的，當焦元都是單點元素時，

，並且 C₁ 與 C₃ 為空集

一般情況下，相關證據的焦元可分為相關焦元與非相關焦元兩個部分。

2、基於可變引數優化的相關證據合成方法

基於消除上述相關證據合成方法存在的弱點，並考慮相關證據的相關焦元分佈的一般情況，有學者提出了【基於可變引數優化的相關證據合成方法】。

設 Bel₁，Bel₂ 是同一識別框架 Θ 上的兩個相關證據 E₁、E₂ 的信度函式，m₁、m₂ 是對應的基本可信度分配，對應的焦元分別為 A₁，A₂，....，A_k 和 B₁，B₂，....，B_k，相關焦元集合為 C(C₁，C₂，....，C_j)，如果：

存在，且

且基本可信度分配為 m，則有：

其中，

，

上述相關證據合成方法主要從以下幾個方面進行了改造：

首先，在相關證據的合成中，產生合成證據焦元的基本可信數的超估計的原因是，相關焦元的基本可信數被重複運用於證據的合成，所以合理的做法是，只對相關焦元的基本可信數進行衰減。
其次，修正係數 a_A，a_B 是可變引數。由於相關證據合成在實際應用中都是面向具體問題的，修正係數 a_A，a_B 的確定可根據相關證據合成所解決的具體問題來確定。例如：
- 基於專家領域經驗，設定一組適合具體問題場景的引數
- 基於資料驅動的方式，通過有標註資料進行有監督訓練，通過引數優化的方法來確定引數

需要注意的是，在上式中，當 a_A = 0，a_B = 0 時，此時修正的合成公式退化為 m₁(A_i)，m₂(B_j)，即退化為Dempster合成公式。

3. 衝突證據的合成方法

Dempster合成規則的應用存在一些缺陷和侷限性，如對於衝突非常高的證據合成可能會出現背離常理的結論，例如文章開頭舉的”Zadeh悖論例子“。為了解決Dempster在應用過程中的侷限，有學者進行了深入的研究，提出了一系列的修正方法。

0x1：Dubois-Prade合成規則

Dubois-Prade規則認為當兩個證據源不存在衝突時，證據源都是可靠的，如果存在衝突時，只有其中一個是可靠的。

因此對某個觀測值而言，當一個證據判定其處於集合 X 中，另一個證據判定其處於 Y 之中時，

如果 X ∩ Y ≠ ∅，則合成結果處於 X ∩ Y 中
如果 X ∩ Y ＝ ∅，則這兩個命題是矛盾的，其中只能有一個判定為真。由於不能確定哪個判定是可靠的，因此合成結果放於集合 X ∪ Y 中。

Dubois和Prade針對兩個證據源中有一個是可靠的，另外一個是錯誤的，而不確定哪條證據是錯誤的這種客觀存在的情況，提出了析取規則，具體如下：

0x2：Smets組合規則

Smets認為人們往往事先難以確定一個完備的識別框架，且識別框架的不完備是造成證據衝突的根源。

在他的TBM理論中，引入”開放世界假設“，把對空集的基本概率賦值 m(∅) ≥ 0 定義為對”真命題在當前已知的識別框架之外“信任度，同時證據組合中取消對組合結果的歸一化，而把兩個證據組合產生的衝突歸於 m(∅)。具體合成公式如下：

由上式可見，所有的衝突被分配給了空集，這主要是由於Smets人為導致融合結果不合理的原因是，在未知環境下，識別框架可能是不完備的，因而必然導致存在一些無法判斷其真偽的未知命題，證據衝突正是由這些未知命題造成的，所以需要將衝突分配給空集。

換句話說，Smets認為，在識別框架不完善的情況下，空集可能就是潛在的新命題。

Smets組合理論的缺點在於，對決策問題而言，決策者主要關注的是識別框架中的元素，實際應用過程中，m(∅)是沒有多少作用的。

0x3：Yager合成規則

Yager認為證據如果存在了衝突，那麼證據組合的結果可能不是完全可靠的，所以需要將衝突證據完全分配給識別框架Θ上，具體合成公式如下：

從上式中可以看到，Yager的公式取消了Dempster合成規則中的正則化過程，其基本思想是：衝突源於人們對判別物件的無知，既然人們並不瞭解衝突的具體情況，不如將所有的衝突都分配給識別框架。

筆者認為，Yager合成規則的基本思想非常貼近現實業務場景的問題本質，我們在現實業務場景中，對一個事物進行決策判斷的時候，常常會面臨所謂的”灰色地帶問題“，例如：

某個程序行為既像惡意的，也像管理員自己執行的合法行為
某個python樣本整體上看是合法的，但是有某幾行程式碼似乎有一些包含不正常目的的跡象，不太能確定

Yager公式處理這種問題的解決思路，就類似於中國的老話，”似是而非，無極而太極“，”打圓場“，每種可能性都說道，每種又都不絕對，是一種折中的判斷。

Yager合成規則的缺陷也很明顯：

其一，該方法在證據數量超過2個時，合成結果不理想
其二，該方法的魯棒性較差
其三，常常出現合成後不確定程度不減反增的現象

0x4：比例衝突重新分配規則

Smarandache和Dezert針對證據合成過程中存在的衝突問題，認為衝突資訊的產生來自於識別框架中單焦元之間的衝突。

並集產生的不確定資訊不參與產生衝突，並且單焦元產生衝突的作用大小與其本身的基本可信數成正比。

Smarandache和Dezert提出了一系列按一定比例將衝突進行分配的【比例衝突重新分配規則（the proportional conflict redistribution rules，PCR）】。

無論衝突的大小如何，PCR5衝突合併的效果總是不劣於Dempster合成規則和其他規則，合成公式具體如下：

0x5：DSmT合成規則

Smarandache和Dezert提出的DSmT理論，放寬了對識別框架中焦元的約束限制，認為經典的證據理論假定的命題之間事實上是有交集的，框架命題之間的界限有時是模糊不清的，在原有識別框架的冪集基礎上提出了具有更多命題的超冪集 D^Θ。

DSmT去除了傳統證據理論的一些主要限制，即：

識別框架的元素（證據）是互斥和窮舉的
中間性原理（任何處於識別框架冪集中的元素的補集也屬於該冪集）
合成規則中歸一化組合規則

經典的DSmT融合規則的具體合成如下：

0x6：ER（Evidence Reasoning）合成規則

Yang等提出的證據推理方法得到比較廣泛的應用，是D-S證據理論應用於決策評估領域的代表性成果。該方法兼具了修正證據源與改進D-S合成規則的思想。

證據推理合成規則應用權重修正證據源，主要沿用了D-S規則的合成思想，但在合成過程中對未分配證據進一步細分。

為便於理解，在此將證據推理規則按照傳統D-S的形式表述，設在給定識別框架Θ下，有 m₁ 和 m₂ 兩條待合成的證據，其權重分別為 ω₁ 和 ω₂。

首先，用相對權重預處理基本可信度分配，將分配給識別框架的基本可信度分解成和兩部分，表示由權重引起的未分配，表示對事物的無知引起的未分配，其中 i=1或2。下面對證據進行處理：

處理後的證據利用Dempster合成規則進行合成之後，利用下面兩式去除權重引起的未分配信度的影響：

，

證據推理規則能夠較好地處理衝突證據合成的問題，且滿足交換律、結合律及非等冪性等性質。但是，該方法也有一定缺陷：

其一，收斂速度慢
其二，證據權重需要藉助其他方法或依靠決策者主觀判定確定

0x7：基於證據聯盟的證據合成方法

在證據合成之前進行衝突分析，根據待合成證據的具體情況，靈活地選擇證據合成策略。

如果證據間不存在強衝突的證據，可直接應用具有良好收斂性的經典D-S合成規則
如果證據間存在強烈衝突，則根據衝突情況將證據劃分為若干個虛擬聯盟，先應用D-S合成規則合成虛擬聯盟內部的證據，再應用證據推理規則合成各個虛擬聯盟

上述方法在保持D-S合成規則收斂性的同時，解決了衝突證據合成的問題。另外，衝突分析有助於瞭解證據間的關係，有利於識別和處理異常證據。

1、證據間衝突的測度

如前文所述，經典D-S證據理論以

反映兩證據間的衝突程度，

若 k=1，則表明證據完全衝突，不能用Dempster-Shafer合成法則合成
若 k<1，則表明兩個證據間雖然有差異，但存在一定的一致之處，可以用Dempster-Shafer合成法則合成

事實上，k在很多情況下不能充分反映證據間的衝突程度。

例如，識別框架 Θ={θ₁，θ₂}，有兩條證據 m₁ 和 m₂ 分別為：

很顯然，從可信度分配來看，m₁ 和 m₂ 存在較大沖突，但是此時 k_1,2 = 0，顯然和實際情況不符。

此外，k 不滿足距離公式的很多基本性質，故很多情況下難以應用 k 對證據進行比較分析。為了更精細地測度證據之間的衝突程度，Jousselme等學者提出了新的距離公式函式，用於測度證據之間的衝突程度。

定義一：

設 Θ 為一個包含 N 個不同的命題的完備的辨識框架，E 表示由 Θ 的所有子集生成的空間，每一個基本可信度分配表示為一個在空間 E 中的座標系為 m(A_i) 的向量，滿足：

定義二：

設 Θ 為一個包含 N 個兩兩不同的命題的完備的識別框架，m₁ 和 m₂ 分別表示識別框架 Θ 上的兩個基本可信度分配，m₁ 和 m₂ 的距離可以表示為：

其中，表示一個 2^N✖️2^N 的矩陣，該矩陣中的元素：

Jousselme距離的具體計算方法為：

其中，，為兩個向量的內積。

顯然，Jousselme距離公式滿足距離的基本性質：

0 ≤ d_1,2 ≤ 1
當且僅當 d_1,2 = 0時，m₁ = m₂
d_1,2 = d_2,1
d_1,2 ≤ d_1,3 + d_3,2

設共計有 n 條待合成的證據，則可利用上式計算出任意兩條證據 m_i 和 m_j 之間的距離，並生成距離矩陣（matrix of distance，MOD）：

顯然，D_MOD為一個對角元素為0的對稱矩陣。通過計算 D_MOD 有助於人們準確地找到造成衝突的證據源，但仍然無法定量的測度證據系統（evidence system）的整體衝突程度。

證據系統的整體衝突程度不僅能夠較好地評價證據系統可靠性和穩定性，而且能夠合理地體現出依據證據系統做出決策的結果的穩定性與可信性。

證據系統的整體衝突程度應為系統內部所有證據之間衝突程度的綜合結果。

定義三：

設在由 n 個證據組成的證據系統之中，證據系統的整體衝突程度CD，為系統內任意兩條證據的距離的平均值。

其中，

：表示由 n 個證據兩兩組合可產生的組合數量
d_a,b 表示證據系統中的任意兩個不同的證據 m_a 與 m_b 間的距離

2、虛擬聯盟的構建

在社會生活中，人們常常與觀點同自己相似的人聯合起來，對抗與自己的意見相左的人。虛擬聯盟的構建就是根據人們在決策評估中經常出現的這種思維習慣或行為方式，對待合成證據進行劃分。

構建虛擬聯盟可以將支援不同命題的證據之間的力量對比情況清晰地呈現出來，找到主要衝突源，從而有利於細緻分析證據的衝突情況。

虛擬聯盟具體構建方法（down to top連結擴充套件）如下：

步驟一，設待合成的 n 條證據中任一證據 m_j 在初始狀態下獨立構成一個虛擬聯盟 G_j = {m_j}，通過計算證據間的Jousselme距離，建立距離矩陣 D_MOD = [d_ij]_nxn。
步驟二，根據應用環境設定衝突閾值 M_threshold，即事先設定同一虛擬聯盟內的兩條證據不允許超越的最大距離，
- 若 max{dij} ≤ M_threshold，即證據間不存在強衝突，則無需劃分，可認為所有證據可以結成一個大的虛擬聯盟
- 若 max{dij} ≥ M_threshold，則需進一步將證據劃分為若干個虛擬聯盟
步驟三，從距離矩陣 D_MOD 的非對角元素中找出 d_e,f = min{d_ij}，則決策者 DM_e 和 DM_f 結成虛擬聯盟，記為 G_r = {m_e，m_f}，並以 G_r 替換 m_e 和 m_f。
步驟四，用公式 d_rj = max(d_ej，d_fj) 計算虛擬聯盟 G_r 與其他證據之間的距離，更新距離矩陣。
步驟五，重複步驟三、步驟四，直至各虛擬聯盟間的距離均超過事先設定的衝突閾值 M_threshold為止，即達到收斂狀態

3、虛擬聯盟的權重

不同虛擬聯盟中的證據數量與質量通常存在一定的差別，我們通過虛擬聯盟的權重反映這種差異性。

虛擬聯盟權重的大小取決於虛擬聯盟內部證據受到其他證據的支援程度（或者說相關度）。如果一個證據被其他證據所支援，則該證據比較可信，若虛擬聯盟內的證據可信性都比較高，其權重也較大。

設任意兩條證據 m_i 和 m_j 之間的相似性測度 s_ij 為：

與距離矩陣 D_MOD 類似，基於任何兩個證據間的相似性，可以生成相似矩陣（matrix of similarity，MOS）：

可以看出，如果兩個證據間的衝突程度越小，對應的證據 m_i 和 m_j 的相似程度 s_ij 越大。

據此可以給出證據受到整個證據系統的支援程度的定義。

定義一：

設在由 n 個證據組成的證據系統之中，任意兩條證據之間的相似程度為 s_ij，那麼證據系統對證據 m_i 的支援程度為：

顯然，上式實質上就是計算相似矩陣中的每一行之和，再減去其中證據 i 與自身的相似度1.

Sup_i 是相似程度的函式，體現了證據i 被其他 n-1 條證據支援的程度。

這個計量公式的基本思想在於：如果一個證據體與其他證據體比較相似，則認為它們相互支援的程度也比較高，該證據的可信性得到了其他證據的支援與證明。如果一個證據與其他證據體相似程度比較低，則認為該證據不被其他證據支援。

定義二：

設在由 n 個證據組成的證據系統之中，證據 m_i 得到的支援程度為 Sup(m_i)，則證據 i 的可信度（Crd）為：

顯然，Crd(m_i)滿足：

Crd(m_i)可視為證據 m_i 的權重。上式本質上就是將證據支援度壓縮到了概率空間中。

定義三：

設 n 個證據經過沖突分析被劃分為 m 個虛擬聯盟 G₁，G₂，....，G_k，.....，G_m，其中任意虛擬聯盟 G_k 由 g 條證據組成（g≥1），即：

則虛擬聯盟 G_k 的權重 W_k 為：

顯然，權重 W_k 滿足：

可見，虛擬聯盟的權重是聯盟內部的證據可信性的整體反映，因而權重 W_k 可以合理地體現出虛擬聯盟 G_k 相對於整體證據系統中的重要程度。

4、基於虛擬聯盟的證據合成新規則

通過沖突分析考察待合成證據的具體情況，靈活地選擇證據合成策略。如果證據間不存在強衝突的證據，則直接應用D-S合成規則；如果存在強衝突，則證據合成過程如下圖所示：

基於衝突分析的證據合成流程圖

首先，將證據劃分為若干個虛擬聯盟，計算各證據的可信度Crd；
然後，應用D-S合成規則融合虛擬聯盟內部的證據，獲得虛擬聯盟的基本可信度分配 m_Gk
最後，利用衝突分析中獲得的權重資訊，應用證據推理合成規則獲取最終結果

4. 基於優化學習的綜合係數修正證據合成方法

僅僅通過證據權重或證據相關對證據進行修正，有時可能會顯得比較片面。

這個章節，我們來討論一種基於資料驅動的，自適應學習的證據修正方法，利用優化的思想對證據進行綜合的修正。

0x1：基於神經網路與Dempster合成規則的證據合成方法

人工神經網路是模擬生理學上人腦神經網路的結果和功能，用具有若干特性的感知機理論抽象、簡化和模擬而構成的一種資訊處理系統。它由大量神經元通過豐富和完善的連線而構成的自適應非線性動態系統。

自適應網路的整體引數是組成網路的各個結點引數集的並集。證據合成中將對每個證據的綜合修正係數作為結點引數，用自適應網路來表示證據合成系統。該合成系統可用前向自適應網路來表示：

基於神經網路與Dempster合成規則的證據合成方法分為兩個步驟來合成。

首先，面向具體問題確定學習樣本，應用神經網路尋找最優的考慮證據相關性、重要性、可靠性與證據衝突的綜合修正係數。
其次，用Dempster合成方法進行證據合成。

1、基於神經網路確定證據修正係數

設有一識別框架 Θ={θ₁，θ₂，.....，θ_h}，則該識別框架有 H=2^h 個元素，Bel₁，Bel₂，....，Bel_n 是同一識別框架 Θ 上的 n 個證據的信度函式，m₁，m₂，.....，m_n 是對應的基本可信度分配，如果存在，設其基本可信度分配為 m。

設第 i 個證據對第 j 個元素的基本可信數為 m_i(A_j)，m_i(A_j)對應的綜合修正係數為 a_i(A_j)，i=1,2,....,n；j=1,2,....,2^k-1，則對第 i 個證據的基本可信數的修正公式為：

該修正公式可以看成神經網路自適應結點的結點函式。

a_i(A_j)的取值用神經網路基於學習樣本進行優化計算得到，其取值範圍是[0，1]。

設有 P 組學習樣本，每組樣本對應於 n 個證據合成的一組輸入與合成結果輸出的正確值。將第 p 組訓練資料的誤差指標定義為誤差的平方和，優化的目標是使 E 最小：

綜合修正係數對誤差指標的影響

2、用Dempster合成方法進行證據合成

對基本可信數進行修正後，用Dempster合成規則進行合成，就可得出 n 個證據的合成結果 m。

0x2：基於神經網路與Dempster合成規則的證據合成方法的三個性質

假設對 n 個證據的合成，存在 P 組學習樣本，該樣本可看成 n 個證據合成的 P 組理想目標值，則對這組理想目標值來說，n個證據合成的目標函式為：

則基於神經網路與Dempster合成規則的證據合成方法存在以下三個性質：

1、性質一，基於神經網路與Dempster合成規則的證據合成方法其合成結果等於或優於經典Dempster合成方法

對基於神經網路與Dempster合成規則的證據合成方法來說，綜合修正係數矩陣 a_i,j 的各項都取值為 1 時，即：

這時 m_i' 等於 m_i，即此時的合成結果與Dempster合成方法的合成結果相同。

設此時的合成誤差為 E_d，由於神經網路在優化綜合修正係數時的目標函式為求 E 的最小值，因此有：

即基於神經網路與Dempster合成規則的證據合成方法合成結果與學習樣本的誤差小於或等於Dempster合成方法。

性質二，基於神經網路與Dempster合成規則的證據合成方法具有對證據按資訊的質量進行加權選擇與排除的能力

換句話說，綜合修正係數 a_i,j 的取值越大，則該係數對應的第 i 個證據第 j 個元素的基本可信數對證據合成結果的影響就越大。

當第 i 個證據沒有資訊價值時，該證據對應的修正係數取值為 ai = (0，0，....，0)，則該證據對證據合成結果的影響將被排除。由於Dempster合成規則具有結合律與交換律，所以該結論可推廣到多個證據的合成情況。

性質三，基於神經網路與Dempster合成規則的證據合成方法的合成結果等於或優於n個證據中效能最好的單個證據的基本可信數

假設：n個證據中，第 i 個證據的基本可信數為 m_i,p,k，第 p 次的理想目標值為 d_p,k，第 L 個證據的效能最好，即第 L 個證據與其他證據相比，它的基本可信數與樣本的理想目標值的誤差為最小，即：

對基於神經網路與Dempster合成規則的證據合成方法來說，將綜合修正係數矩陣 a_i,j 與第 L 個證據相對應行的值取為1，其餘的係數都取為0，即：

這時，由：

可知，m_L' = m_L，其餘的基本可信數為 m_i' = (0，0，....，1)。用：

合成，即可得 m = m_L，即 m_p,k = m_L,p,k。

基於神經網路與Dempster合成規則的證據合成方法的合成結果與第L個證據的基本可信數相等。

所以，經過神經網路優化的 a_i,j^*產生的m_p,k^*的合成結果E，優於或等於特定引數d_i,j^'產生的m_L,p,k的合成結果E_L，即滿足：

即：

基於神經網路與Dempster合成規則的證據合成方法的合成結果優於或等於（合成結果與學習樣本的誤差小於或等於） n個證據中效能最好的單個證據的基本可信數。

5. 基於衝突性證據合成理論在各個領域的應用

基於 D-S 證據的多語段融合語音情感識別

基於物聯網節點加權的D-S證據理論資料融合演算法