Dempster-Shafer Evidence Theory for Multimodality Classification

Author: Sijin Yu

*本文的举例、图片完全参考了 github 用户 Roy 的博客 [1]. 本文在其基础上增加了数学的形式化表达, 详细了其例, 重画了图片.

1. Discernment Frame (识别框架)

识别框架 (Discernment Frame) 指所有可能的基本事件的集合. 例如:

(1)Θ={θ1,θ2,,θn}

就是一个由 n 个两两互斥的基本事件构成的 discernment frame.

举例参考:

参考 [1] 中的举例, 考虑一个灯, 可能发出 R, G, B 三种颜色的光. 因此这里 n=3, 这三种基本事件为 θ1=R 表示发红色光, θ2=G 表示发绿色的光, θ3=B 表示发绿色的光. 则 discernment frame 为 Θ={θ1,θ2,θ3}={R,G,B}.

 

2. Mass Function (质量函数)

给定 discernment frame Θ, 质量函数 (Mass Function) 是定义在幂集 2Θ 上的函数 M, 定义为:

(2)M:2Θ[0,1]

Mass function M 满足两个性质,

举例参考:

Mass 的意义是各种假设的可能性. 在上面的举例中, 假设一个观察者观测后, 对每个假设分配了 mass 值, 如下:

假设含义Mass
不发光0
{R}发红光0.35
{G}发绿光0.15
{B}发蓝光0.25
{R,G}发红光或绿光0.05
{G,B}发绿光或蓝光0.04
{B,R}发蓝光或红光0.06
{R,G,B}发某一种光0.1

画成 Venn Diagram 如下:

RGB

 

3. Belief Function (信度函数)

集合 AΘ信度 (Belief) 定义为: A 所有子集的 mass 之和. 即:

(5)Bel(A)=BAM(B)

举例参考:

在上面的例子中, 各种组合的 belief 为:

  • Bel(R)=M(R)=0.35

  • Bel(G)=M(G)=0.15

  • Bel(B)=M(B)=0.25

  • Bel(RG)=M(RG)+M(R)+M(G)=0.55

  • Bel(GB)=M(GB)+M(G)+M(B)=0.44

  • Bel(BR)=M(BR)+M(B)+M(R)=0.66

  • Bel(RGB)=M(RGB)+M(RG)+M(GB)+M(BR)+M(R)+M(G)+M(B)=1

注意, 这里的数学符号不太严谨, 因为函数 Bel(),M() 的输入都是集合. 这里的 Bel(R) 实际上应该为 Bel({R}), M(RGB) 实际上应该为 M({R,G,B}), 其余同理. 这里采用这样的写法是为了简洁.

 

4. Plausibility Function (似然函数)

集合 AΘ似然 (Plausibility) 定义为: 与 A 相交的所有集合的 mass 之和. 即:

(6)Pls(A)=BAM(B)

举例参考:

在上面的例子中, 各种组合的 plausibility 为:

  • Pls(R)=M(R)+M(RG)+M(BR)+M(RGB)=0.56

  • Pls(G)=M(G)+M(RG)+M(GB)+M(RGB)=0.34

  • Pls(B)=M(B)+M(GB)+M(BR)+M(RGB)=0.45

  • Pls(RG)=M(R)+M(G)+M(GB)+M(BR)+M(RG)+M(RGB)=0.75

  • Pls(GB)=M(G)+M(B)+M(GB)+M(BR)+M(RG)+M(RGB)=0.65

  • Pls(BR)=M(B)+M(R)+M(GB)+M(BR)+M(RG)+M(RGB)=0.85

  • Pls(RGB)=M(R)+M(G)+M(B)+M(GB)+M(BR)+M(RG)+M(RGB)=1

注意, 这里的数学符号不太严谨, 因为函数 Pls(),M() 的输入都是集合. 这里的 Pls(R) 实际上应该为 Pls({R}), M(RGB) 实际上应该为 M({R,G,B}), 其余同理. 这里采用这样的写法是为了简洁.

 

5. Probability Measure (概率测度)

给定 discernment frame Θ, 概率测度 (Probability Measure) 是一个定义在集合 Θ 上的函数 P, 定义为:

(7)P:Θ[0,1]

Probability measure 满足以下性质:

这里需要区分概率测度 P 和前面定义的质量函数 M 的区别.

P 的定义域是 Θ, 即我们所理解的“概率”含义. M 的定义域是 2Θ, 它衡量了观测者对各种可能性判断的确定性 (这一解释在下文会再次说明).

 

6. 概率测度的界

任意一个子集 AΘ 的概率测度定义为 A 中元素之并的概率测度, 即

(11)P(A):=P(θAθ)=θAP(θ)

其中, 第二个等式由 probability measure 的可加性给出.

P(A) 总是以 belief 为下界, 以 plausibility 为上界, 即:

(12)Bel(A)P(A)Pls(A)

7. Subjective Logic (主观逻辑)

使用主观逻辑 (Subjective Logic), 可以通过先验概率, 计算后验概率. 具体的, 若定义了 discernment frame Θ, 在其上定义了 mass function M, θΘ, 给定先验概率分布 q(θ), 则后验概率 p(θ) 可以如此得出:

(13)p(θ)=M({θ})+θAΘM(A)q(θ|A)

举例参考:

在上面的 RGB 灯例子中, 若给出先验概率分布如下:

q(R)q(G)q(B)
0.50.30.2

在上面 mass 分配的情况下, 可得修正的后验分布为:

p(R)p(G)p(B)
0.4740.2230.303

在上面的例子可见, mass 的数学意义是衡量不确定性, M(A) 即为分配给子集 A证据 (Evidence).

 

8. Dempster-Shafer Evidence Combination (DS 证据合成)

假设有两个观察者, 它们观测的 mass function 分别为 M1M2.

M1M2冲突度 (Conflict Degree) γ 定义如下:

(14)γ=AB=,A,BΘM1(A)M2(B)

冲突度衡量了 M1M2 的不一致性.

  • γ[0,1] 总是成立.

  • γ=0, 表示两个证据源完全一致.

  • γ=1, 表示两个证据源完全冲突.

两个证据源的 mass function M1M2正交和 (Orthogonal Sum) 为融合后的 mass function M. 具体的定义如下:

(15)M(A)=M1M2(A):=11γBC=AM1(B)M2(C)

9. 用于多模态分类任务上的可能性

令 discernment frame Θ 的各元素定义为分类的各类别.

对于第 i 个模态, 其 Encoder Ei 处理这一模态的输入数据 xi, 得到了对分类结果的先验分布 qi(θ), θΘ. 同时, 使用一个模型去估计这个 Encoder 对分类结果的证据 mass function Mi(θ), θΘ.

令可学习参数 ηi[0,1] 用于衡量模态 i 的可靠程度. 使用下面的方法更新 mass function Mi:

(16)MiηiMi+(1ηi)M?

这里, M? 表示茫然的质量函数 (Vacuous Mass Function), 其定义为 M?(Θ)=1.

使用 ηi 对所有模态的先验分布做融合:

(17)q(θ)=1ηiiηiqi(θ)

使用 DS Evidence Combination 对所有 mass function 做融合:

(18)M=iMi

最后, 使用 Subjective Logic 可以得到后验分布 p(θ) 为分类结果.

这种融合, 对多模态中存在某一模态可靠度不高, 但难以确定哪一模态可靠度不高, 需要模型自己学习每一模态的可靠度的情况, 有很大的促进意义. 此外, 这里的“多模态”也可以推广为“多分类器”、“多尺度”.

 

Reference List

[1] https://cf020031308.github.io/wiki/dempster-shafer-theory-and-subjective-logic/

[2] Shafer, G.: A mathematical theory of evidence, vol. 42. Princeton University Press (1976)