Welcome to visit Journal of Shaanxi Normal University(Natural Science Edition)!

Matrix-based dynamic updating of multi-granulation rough fuzzy sets

  • ZHANG Zeting 1 ,
  • LI Leijun , 1, 2, * ,
  • MI Jusheng 1, 2 ,
  • LI Meizheng 3
Expand
  • 1 School of Mathematical Sciences, Hebei Normal University, Shijiazhuang 050024, Hebei, China
  • 2 Hebei Key Laboratory of Computational Mathematics and Applications, Shijiazhuang 050024, Hebei, China
  • 3 School of Computer and Cyberspace Security, Hebei Normal University, Shijiazhuang 050024, Hebei, China

Received date: 2024-11-25

  Online published: 2025-12-17

Abstract

The grain structure in information system often develops dynamically with the passage of time, and dynamic acquisition of potentially useful knowledge is of great significance to decision-making. Incremental learning is an effective way to combine current information with previous knowledge to study such problems. Although incremental learning has been successful in many aspects, less research has been conducted in multi-granularity fuzzy environments. In order to solve this problem, a matrix operator is used to represent the upper and lower approximations of optimistic and pessimistic multi-granularity rough fuzzy sets.Then, when the attributes increase or decrease, the update mechanism based on the matrix is introduced, and the corresponding dynamic update algorithm is designed. Finally, the time complexity of the algorithm is analyzed, and the validity of the proposed dynamic update algorithm is verified in the UCI data set.

Cite this article

ZHANG Zeting , LI Leijun , MI Jusheng , LI Meizheng . Matrix-based dynamic updating of multi-granulation rough fuzzy sets[J]. Journal of Shaanxi Normal University(Natural Science Edition), 2025 , 53(6) : 87 -97 . DOI: 10.15983/j.cnki.jsnu.2025022

美国控制论专家Zadeh[1]提出模糊集理论是对生活中模糊现象的刻画过程。Pawlak[2]提出的粗糙集模型是通过定义两个近似算子对经典集合进行刻画的过程,因此如何将两种处理不确定性问题的理论结合起来也成为近年来研究的另一个热题,Dubois和Prade[3]在1990年提出了粗糙模糊集和粗糙模糊集模型,为两种理论的结合打开了一扇崭新的大门。
此外,粒计算也是近年来发展起来的一门新学科,粒计算的研究在国际学术上受到了众多研究者的关注,越来越多的研究成果登上了学术舞台,Qian等[4]在2010年提出来多粒度粗糙集模型,把粒计算中的多粒度引入粗糙集中,建立了乐观和悲观的多粒度粗糙集模型。在实际生活应用中还存在着某些粒度一定属于刻画的概念和某些粒度可能属于被刻画的概念这两种情况,因此我们将这两种情况引入粗糙集和模糊集理论中,建立多粒度粗糙模糊集模型[5]
在实际生活中,数据通常是动态变化的。比如在智能推荐系统中,用户的偏好和行为会随着时间不断变化。用户可能会购买新的产品、浏览不同的网页或改变他们的购物习惯。这些变化会导致用户数据不断更新,从而影响推荐模型的准确性。传统的静态方法是在整个更新的数据上重新训练整个模型,这使得它在即时推荐等方面过于耗时。其中,增量学习是一种机器学习方法,它允许模型在接收到新数据时不断更新和改进自身,而无需从头开始重新训练。这种方法特别适用于处理随时间逐渐累积的数据,被广泛应用于动态环境下的粗糙集模型。在粗糙集的应用中,近似集计算是重要且必要的。近年来,运用增量学习方法来计算和更新多粒度粗糙集及其拓展模型的上下近似集,引起了众多研究者的广泛关注。这些研究通常根据数据集中的改变情景分为以下几类,即对象集的变化[6-7]、属性增减[8-10]、属性值改变[11]、决策属性改变[12]
其中,矩阵是一种高效的,简单的便于知识表示和推理的工具,被广泛应用于粗糙集的近似集更新中,Zhang等[13]提出了一种基于并行矩阵的不完备信息系统逼近计算方法。Liu[14]探索了一种基于矩阵的粗糙集上下逼近运算方法。Chen等[15]提出一种决策理论粗糙集中对象和属性同时变化时的知识更新方法。Xu等[16]提出了一种基于矩阵的多粒度粗糙集快速粒度约简算法。
本文通过分析既有研究成果,发现这些矩阵方法不能直接用于多粒度粗糙模糊集模型的近似计算。因此,为了解决这一问题,提出了一种新的矩阵运算来表示多粒度粗糙模糊集的上下近似。并进一步开发了基于矩阵的增量机制。

1 预备知识

本节介绍多粒度粗糙模糊集和模糊决策信息系统的一些知识。
定义1[17] 一个模糊决策信息系统S=(U,AD,V,f)可被形式化定义为一个四元组,其中U={xi|i=1,2,…,n}是非空有限对象的集合,称为论域;A是条件属性的非空有限集合,D是模糊决策属性的非空有限集合,AD=∅;VA是条件属性的值域,VD是决策属性的值域,VD=[0,1],f是一个从U×(AD)到V的函数,使得f:U×AVA,f:U×DVD
定义2[18]S=(U,AD,V,f)是一个模糊决策信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度。 R a k是关于属性ak的等价关系, d ^的上下近似是关于等价关系 R a k的一对模糊集,它们的隶属函数定义如下:
R a k d ^(x)=inf{ d ^(y)|y∈[x ] r a k},
R a k ¯ d ^(x)=sup{ d ^(y)|y∈[x ] R a k}。
式中,[x ] R a k={yU|x R a ky}代表x R a k等价类。
定义3[4]S=(U,AD,V,f)是一个信息系统,a1,a2,…,amA,∀XU,X的乐观多粒度粗糙集下、上近似分别定义为
k = 1 m a k O(X)={x∈U|[x ] a 1⊆X∨[x ] a 2⊆X∨…∨[x ] a m⊆X},
k = 1 m a k O ¯(X)=~ k = 1 m a k O _(~X)。
定义4[4] 设信息系统S=(U,AD,V,f),∀a1,a2,…,amA,∀k∈{1,2,…,m},∀XU,X的悲观多粒度粗糙集的下、上近似分别定义为
k = 1 m a k P _(X)={x∈U|[x ] a 1⊆X∧[x ] a 2⊆X∧…∧[x ] a m⊆X},
k = 1 m a k P ¯(X)=~ k = 1 m a k P _(~X)。
定义5[5] 设模糊决策信息系统S=(U,AD,V,f),∀a1,a2,…,amA, R a 1, R a 2,…, R a mm个等价关系。 d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀k∈{1,2,…,m}, d ^的乐观多粒度下、上近似集为 k = 1 m R a k O _ d ^ k = 1 m R a k O ¯ d ^,∀xU,x属于下、上近似集的隶属度定义如下:
k = 1 m R a k O _ d ^(x)= k = 1 m{∧ d ^(y)|y∈[x ] R a k},
k = 1 m R a k O ¯ d ^(x)= k = 1 m{∨ d ^(y)|y∈[x ] R a k}。
定义6[5] 设模糊决策信息系统S=(U,AD,V,f),∀a1,a2,…,amA, R a 1, R a 2,…, R a mm个等价关系。 d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度, d ^的悲观多粒度下、上近似集为 k = 1 m R a k O _ d ^ k = 1 m R a k O ¯ d ^,∀xU,x属于下、上近似集的隶属度定义如下:
k = 1 m R a k P _ d ^(x)= k = 1 m{∧ d ^(y)|y∈[x ] R a k},
k = 1 m R a k P ¯ d ^(x)= k = 1 m{∨ d ^(y)|y∈[x ] R a k}。
例1 表1[19]是一个医疗诊断信息系统,U={xi|i={1,2,…,10}}表示患者,其中病情属性集C={头痛,肌肉痛,喉咙痛,体温升高}模糊决策属性集D={流感,无流感}, V C 1={不,轻,重} {0,1,2}, V C 2= V C 3= V C 4{没有,有} {0,1},∀a1,a2,…,a4A, R a 1, R a 2,…, R a 4是4个等价关系。 d ^代表流感,计算隶属度
U/ R a 1={{x1,x3,x4},{x2,x5,x7,x9,x10},{x6,x8}},
U/ R a 2={{x1,x3,x4,x6,x8},{x2,x5,x7,x9,x10}},
U/ R a 3={{x1,x2,x3,x4,x5,x7},{x6,x8,x9,x10}},
U/ R a 4={{x1,x2,x3,x4,x5,x7},{x6,x8,x9,x10}};
表1 模糊决策信息系统

Tab.1 Fuzzy decision information system

U a1 a2 a3 a4 模糊决策属性
流感 无流感
x1 2 1 0 1 0.8 0.3
x2 1 0 0 1 0.3 0.5
x3 2 1 0 1 1 0.1
x4 2 1 0 1 0.7 0.2
x5 1 0 0 1 0.1 0.8
x6 0 1 1 0 0.3 0.7
x7 1 0 0 1 0.2 0.1
x8 0 1 1 0 0 0.9
x9 1 0 1 0 0.4 0.6
x10 1 0 1 0 0.2 0.7
R a 1 d ^(x1)= R a 1 d ^(x3)= R a 1 d ^(x4)=0.8∧1∧0.7=0.7,
R a 1 d ^(x2)= R a 1 d ^(x5)= R a 1 d ^(x7)= R a 1 d ^(x9)= R a 1 d ^(x10)=0.3∧0.1∧0.2∧0.4∧0.2=0.1,
R a 2 d ^(x1)= R a 2 d ^(x3)= R a 2 d ^(x4)= R a 2 d ^(x6)= R a 2 d ^(x8)=0.8∧1∧0.7∧0.3∧0=0,
R a 2 d ^(x2)= R a 2 d ^(x5)= R a 2 d ^(x7)= R a 2 d ^(x9)= R a 2 d ^(x10)=0.3∧0.1∧0.2∧0.4∧0.2=0.1,
R a 3 d ^(x1)= R a 3 d ^(x2)= R a 3 d ^(x3)= R a 3 d ^(x4)= R a 3 d ^(x5)= R a 3 d ^(x7)=0.8∧0.3∧1∧0.7∧0.1∧0.2=0.1,
R a 3 d ^(x6)= R a 3 d ^(x8)= R a 3 d ^(x9)= R a 3 d ^(x10)=0.3∧0∧0.4∧0.2=0,
R a 4 d ^(x1)= R a 3 d ^(x2)= R a 4 d ^(x3)= R a 4 d ^(x4)= R a 4 d ^(x5)= R a 4 d ^(x7)=0.8∧0.3∧1∧0.7∧0.1∧0.2=0.1,
R a 4 d ^(x6)= R a 4 d ^(x8)= R a 4 d ^(x9)= R a 4 d ^(x10)=0.3∧0∧0.4∧0.2=0;
k = 1 4 R a k O _ d ^(x1)=0.7∨0∨0.1∨0.1=0.7,
k = 1 4 R a k O _ d ^(x2)=0.1∨0.1∨0.1∨0.1=0.1,
k = 1 4 R a k O _ d ^(x3)=0.7∨0∨0.1∨0.1=0.7,
k = 1 4 R a k O _ d ^(x4)=0.7∨0∨0.1∨0.1=0.7,
k = 1 4 R a k O _ d ^(x5)=0.1∨0.1∨0.1∨0.1=0.1,
k = 1 4 R a k O _ d ^(x6)=0∨0∨0∨0=0,
k = 1 4 R a k O _ d ^(x7)=0.1∨0.1∨0.1∨0.1=0.1,
k = 1 4 R a k O _ d ^(x8)=0∨0∨0∨0=0,
k = 1 4 R a k O _ d ^(x9)=0.1∨0.1∨0∨0=0.1,
k = 1 4 R a k O _ d ^(x10)=0.1∨0.1∨0∨0=0.1;
k = 1 4 R a k O _ d ^(x)={ 0.7 x 1+ 0.1 x 2+ 0.7 x 3+ 0.7 x 4+
0.1 x 5+ 0 x 6+ 0.1 x 7+ 0 x 8+ 0.1 x 9+ 0.1 x 10}。
同理可以得到
k = 1 4 R a k O ¯ d ^(x)={ 1 x 1+ 0.4 x 2+ 1 x 3+ 1 x 4+ 0.4 x 5+ 0.3 x 6+ 0.4 x 7+ 0.3 x 8+ 0.4 x 9+ 0.4 x 10},
k = 1 4 R a k P _ d ^(x)={ 0 x 1+ 0.1 x 2+ 0 x 3+ 0 x 4+ 0.1 x 5+ 0 x 6+ 0.1 x 7+ 0 x 8+ 0 x 9+ 0 x 10},
k = 1 4 R a k O _ d ^(x)={ 0.7 x 1+ 0.1 x 2+ 0.7 x 3+ 0.7 x 4+ 0.1 x 5+ 0 x 6+ 0.1 x 7+ 0 x 8+ 0.1 x 9+ 0.1 x 10}。

2 多粒度粗糙模糊集近似集的矩阵表示

定义7[20] 信息系统S=(U,AD,V,f)是一个模糊决策信息系统,∀k∈{1,2,…,m},∀akA,且U={x1,x2,…,xn}, R a k表示属性akU上的等价关系。 M a k=( m i j a k)n×n表示属性ak的等价关系矩阵,则
m i j a k 1 , ( x i , x j ) R a k ; 0 , ( x i , x j ) R a k
定义8[19] S=(U,AD,V,f)是一个模糊决策信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度。∀a1,a2,…,amA, R a 1, R a 2,…, R a mm个等价关系。而且 M a k=( m i j a k)n×n,∀k∈{1,2,…,m}, M a kmax d ^是一个列向量,该向量的第i(i=1,2,…,n)个元素定义如下:
( M a kmax d ^)(i)=max{ m i 1 a k· d ^(x1), m i 1 a k· d ^(x2),…, m i 1 a k· d ^(xn)}。
定理1 S=(U,AD,V,f)是一个模糊决策信息系统, M a 1, M a 2,…, M a m是等价关系矩阵, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度, M a kmax d ^是一个列向量。∀a1,a2,…,amA, R a 1, R a 2,…, R a mm个等价关系,∀k={1,2,…,m}, d ^的乐观和悲观多粒度上下近似计算如下:
k = 1 m R a k O _ d ^= k = 1 m(L- M a kmax d ^ c),
k = 1 m R a k O ¯ d ^= k = 1 m( M a kmax d ^),
k = 1 m R a k P _ d ^= k = 1 m(L- M a kmax d ^ c),
k = 1 m R a k P ¯ d ^= k = 1 m( M a kmax d ^)。
式中:L是所有元素都是1的列向量; d ^ c d ^的补集。
证明 根据定义8,∀xiU,任意的等价关系 R a k,有式(12)成立,如果 m i j a k=1成立,则有xj∈[xi ] R a k,即 m i j a k· d ^(xj)= d ^(xj),否则 m i j a k· d ^(xj)=0。根据定义2和定义5有 k = 1 m R a k O ¯ d ^(xi)={ k = 1 m( M a kmax d ^)}(i)成立,根据定义2和定义6有 k = 1 m R a k P ¯ d ^(xi)={ k = 1 m( M a kmax d ^)}(i)成立,根据 R a k d ^=~ R a k d ^ c和定义5,有等式 k = 1 m R a k O _ d ^(xi)={ k = 1 m(L- M a kmax d ^ c)}(i)成立,同理有 k = 1 m R a k P _ d ^(xi)={ k = 1 m(L- M a kmax d ^ c)}(i)成立。
例2 根据表1给出的模糊信息系统, d ^取流感,U表示患者,设 H a k=(L- M a kmax d ^ c), h a k= M a kmax d ^, d ^=(0.8 0.3 1 0.7 0.1 0.3 0.2 0 0.4 0.2)T,求 d ^的乐观和悲观多粒度上下近似。 h a 1= M a 1max d ^= 1 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 1 0 1 1 1 0 1 1 0 0 0 0 0 0 1 0 1 1 0 0 0 0 0 0 0 1 0 0 1 0 1 0 1 1 0 0 0 0 0 1 0 1 0 0 0 1 0 0 1 0 1 0 1 1 0 0 0 0 0 1 0 1 0 0 0 1 0 0 1 0 1 0 1 1 0 1 0 0 1 0 1 0 1 1max 0.8 0.3 1 0.7 0.1 0.3 0.2 0 0.4 0.2= 1 0.4 1 1 0.4 0.3 0.4 0.3 0.4 0.4
同理可得
h a 2=(1 0.4 1 1 0.4 1 0.4 1 0.4 0.4)T,
h a 3=(1 1 1 1 1 0.4 1 0.4 0.4 0.4)T,
h a 4=(1 1 1 1 1 0.4 1 0.4 0.4 0.4)T,
H a 1=(0.7 0.1 0.7 0.7 0.1 0 0.1 0 0.1 0.1)T,
H a 2=(0 0.1 0 0 0.1 0 0.1 0 0.1 0.1)T,
H a 3=(0.1 0.1 0.1 0.1 0.1 0 0.1 0 0 0)T,
H a 4=(0.1 0.1 0.1 0.1 0.1 0 0.1 0 0 0)T
根据定理1,有
k = 1 4 R a k O _ d ^=(0.7 0.1 0.7 0.7 0.1 0 0.1 0 0.1 0.1)T,
k = 1 4 R a k O ¯ d ^=(1 0.4 1 1 0.4 0.3 0.4 0.3 0.4 0.4)T,
k = 1 4 R a k P _ d ^=(0 0.1 0 0 0.1 0 0.1 0 0 0)T,
k = 1 4 R a k P ¯ d ^=(0 0.1 0 0 0.1 0 0.1 0 0 0)T

3 增加属性时基于矩阵的上下近似更新

在多粒度粗糙模糊集中,研究由属性增加而引起的粒结构的变化具有重要意义,在增加属性时,提出了基于矩阵动态更新 d ^的乐观和悲观多粒度上下近似的定理,并进行了证明。
定理2 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈{1,2,…,m}, R a 1, R a 2,…, R a mm个等价关系。设 k = 1 m R a k O _ d ^=[ w 1 O , w 2 O ,…, w n O ]T d ^的乐观多粒度下近似的矩阵表示,增加属性am+1后, k = 1 m + 1 R a k O _ d ^=[ w Δ 1 O , w Δ 2 O ,…, w Δ n O ]T为更新之后的矩阵,设增加的 H a m + 1=L- M a m + 1max d ^ c=[ H a m + 1 1 , H a m + 1 2 ,…, H a m + 1 n ]T,∀i∈{1,2,…,n},则如下结果成立:
w Δ i O = H a m + 1 i , H a m + 1 i w i O ; w i O ,
证明 H a k=L- M a kmax d ^ c=[ H a k 1 , H a k 2 ,…, H a k n ]T,∀k∈{1,2,…,m}。根据定理1,∀i∈{1,2,…,n},有 w i O = k = 1 m H a k i 成立。当 H a m + 1 i w i O 时, w Δ i O = k = 1 m + 1 H a k i = w i O H a m + 1 i = H a m + 1 i 。同理可以看出,当 H a m + 1 i < w i O 时, w Δ i O = k = 1 m + 1 H a k i = w i O H a m + 1 i = w i O ,则定理可证。
定理3 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈{1,2,…,m}, R a 1, R a 2,…, R a mm个等价关系。设 k = 1 m R a k O ¯ d ^=[ w 1 O , w 2 O ,…, w n O ]T d ^的乐观多粒度上近似的矩阵表示,增加属性am+1后, k = 1 m + 1 R a k O ¯ d ^=[ w Δ 1 O , w Δ 2 O ,…, w Δ n O ]T为更新之后的矩阵表示,计算得到 h a m + 1= M a m + 1max d ^=[ h a m + 1 1 , h a m + 2 2 ,…, h a m + 1 n ]T,∀i={1,2,…,n),则如下结果成立:
w Δ i O = h a m + 1 i , h a m + 1 i w i O , w i O ,
证明 假设 h a k= M a kmax d ^ c=[ h a k 1 , h a k 2 ,…, h a k n ]T成立,∀k∈{1,2,…,n},根据定理1`,∀i∈{1,2,…,n},有 w i O = k = 1 m h a k i 成立。当 h a m + 1 i w i O 时, w Δ i O = k = 1 m + 1 h a k i = w i O h a m + 1 i = h a m + 1 i ,同理当 h a m + 1 i w i O , w Δ i O = k = 1 m + 1 h a k i = w i O h a m + 1 i = w i O ,则定理可证。
定理4 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈{1,2,…,m}, R a 1, R a 2,…, R a mm个等价关系。设 k = 1 m R a k P _ d ^=[ w 1 P , w 2 P ,…, w n P ]T d ^的悲观多粒度下近似的矩阵表示,增加属性am+1后,更新之后得到矩阵 k = 1 m + 1 R a k P _ d ^=[ w Δ 1 P , w Δ 2 P ,…, w Δ n P ]T,设增加的 H a m + 1=L- M a m + 1max d ^ c=[ H a m + 1 1 , H a m + 1 2 ,…, H a m + 1 n ]T,∀i∈{1,2,…,n},则如下结果成立:
w Δ i P = H a m + 1 i , H a m + 1 i w i P ; w i P ,
证明 H a k=L- M a kmax d ^ c=[ H a k 1 , H a k 2 ,…, H a k n ]T,∀k∈(1,2,…,m),根据定理1,∀i∈{1,2,…,n},有 w i P = k = 1 m H a k i 成立。当 H a m + 1 i w i P 时, w Δ i P = k = 1 m + 1 H a k i = w i P H a m + 1 i = H a m + 1 i ,当 H a m + 1 i > w i P 时, w Δ i P = k = 1 m + 1 H a k i = w i p H a m + 1 i = w i P ,则定理可证。
定理5 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈{1,2,…,m}, R a 1, R a 2,…, R a mm个等价关系。设 k = 1 m R a k P ¯ d ^=[ w 1 P , w 2 P ,…, w n P ]T d ^的悲观多粒度上近似的矩阵表示,增加属性am+1后, k = 1 m + 1 R a k P ¯ d ^=[ w Δ 1 P , w Δ 2 P ,…, w Δ n P ]T为更新之后的矩阵,设增加的 h a m + 1= M a m + 1max d ^=[ h a m + 1 1 , h a m + 1 2 ,…, h a m + 1 n ]T,∀i∈{1,2,…,n},则如下结果成立:
w Δ i P = h a m + 1 i , h a m + 1 i w i P , w i P ,
证明 假设 h a k= M a kmax d ^ c=[ h a k 1 , h a k 2 ,…, h a k n ]T成立,∀k∈{1,2,…,m},根据定理1,∀i{1,2,…,n},有 w i P = k = 1 m h a k i 成立。当 h a m + 1 i w i P 时, w Δ i P = k = 1 m + 1 h a k i = w i P h a m + 1 i = h a m + 1 i ,同理当 h a m + 1 i w i P 时, w Δ i P = k = 1 m + 1 h a k i = w i P h a m + 1 i = w i P ,则定理可证。

4 减少属性时基于矩阵的上下近似更新

本节提出了在减少属性时动态更新上下近似的基于矩阵的一些定理,并加以证明。
定理6 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈{1,2,…,m}, R a 1, R a 2,…, R a mm个等价关系。设 k = 1 m R a k O _ d ^=[ w 1 o , w 2 o ,…, w n o ]T d ^的乐观多粒度下近似的矩阵表示,减少属性am后, k = 1 m R a k O _ d ^=[ w 1 O , w 2 O ,…, w n O ]T为更新之后的矩阵,设减少的 H a m=L- M a m m a x d ^ c=[ H a m 1 , H a m 2 ,…, H a m n ]T,∀i={1,2,…,n},∀j∈{1,2,…,m-1},则如下结果成立:
w Δ i O = w i O , H a m i < w i O , m a x H a j i ,
式中, H a j i =1-( M a jmax d ^ c)(i)。
证明 H a k=L- M a kmax d ^ c=[ H a k 1 , H a k 2 ,…, H a k n ]T,∀k∈(1,2,…,m},根据定理1,∀i∈{1,2,…,n},有 w i O = k = 1 m H a k i 成立。当 H a m i < w i O 时, w i O = k = 1 m - 1 H a k i = w i O ,同理当 H a m + 1 i w i O ,有 w i O = k = 1 m - 1 H a k i =max H a j i ,j∈{1,2,…,m-1}成立,则定理可证。
定理7 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈(1,2,……,m), R a 1, R a 2,…, R a mm个等价关系。 k = 1 m R a k O ¯ d ^=[ w 1 O , w 2 O ,…, w n O ]T d ^的乐观多粒度上近似的矩阵表示,减少属性am k = 1 m - 1 R a k O ¯ d ^=[ w 1 O , w 2 O ,…, w n O ]T为更新之后的矩阵,设减少的 h a m= M a mmax d ^=[ h a m 1 , h a m 2 ,…, h a m n ]T,∀i∈{1,2,…,n},∀j∈{1,2,…,m-1},则如下结果成立:
w i O = w i O , h a m i > w i O , m i n h a j i ,
式中, h a j i =( M a jmax d ^ c)(i)。
证明 假设 h a k= M a kmax d ^ c=[ h a k 1 , h a k 2 ,…, h a k n ]T成立,∀k∈{1,2,…,m},根据定理1,∀i∈{1,2,…,n},有 w i O = k = 1 m h a k i 成立。当 h a m i > w i O 时, w i O = k = 1 m - 1 h a k i = w i O ,同理可以看出当 h a m i w i O 时,有 w i O = k = 1 m - 1 h a k i =min h a j i 成立,则定理可证。
定理8 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈{1,2,…,m}, R a 1, R a 2,…, R a mm个等价关系。设 k = 1 m R a k P _ d ^=[ w 1 P , w 2 P ,…, w n P ]T d ^的悲观多粒度下近似的矩阵表示,减少属性am后, k = 1 m - 1 R a k P _ d ^=[ w 1 P , w 2 P ,…, w n P ]T为更新之后的矩阵,设减少的 H a m=L- M a mmax d ^ c=[ H a m 1 , H a m 2 ,…, H a m n ]T,∀i∈{1,2,…,n},∀j∈{1,2,…,m-1},则如下结果成立:
w i P = w i P , H a m i > w i P , m i n H a j i ,
式中, H a j i =1-( M a jmax d ^ c)(i)。
证明 H a k=L- M a kmax d ^ c=[ H a k 1 , H a k 2 ,…, H a k n ]T,∀k∈{1,2,…,m},根据定理1,∀i∈{1,2,…,n},有 w i P = k = 1 m H a k i 成立。当 H a m + 1 i > w i P 时, w i P = k = 1 m - 1 H a k i = w i P ,同理可以看出当 H a m + 1 i w i P 时, w i P = k = 1 m - 1 H a k i =min H a j i ,则定理可证。
定理9 S=(U,AD,V,f)是一个信息系统, d ^D的一个模糊子集, d ^(x)表示x关于 d ^的隶属度,∀a1,a2,…,amA,∀k∈{1,2,…,m}, R a 1, R a 2,…, R a mm个等价关系。设 k = 1 m R a k P ¯ d ^=[ w 1 P , w 2 P ,…, w n P ]T d ^的悲以多粒度上近似的矩阵表示,减少属性am后, k = 1 m R a k P ¯ d ^=[ w 1 P , w 2 P ,…, w n P ]T为更新之后的矩阵,设增加的 h a m= M a mmax d ^=[ h a m 1 , h a m 2 ,…, h a m n ]T,∀i∈{1,2,…,n},∀j∈{1,2,…,m-1},则如下结果成立:
w i P = w i P , h a m i < w i P , m a x h a j i ,
式中, h a j i =( M a jmax d ^ c)(i)。
证明 假设 h a k= M a kmax d ^ c=[ h a k 1 , h a k 2 ,…, h a k n ]T成立,∀k∈{1,2,…,m},根据定理1,∀i∈{1,2,…,n},有 w i P = k = 1 m h a k i 成立。当 h a m i < w i P 时, w i P = k = 1 m - 1 h a k i = w i P ,同理可以看出当 h a m i w i P 时, w Δ i P = k = 1 m - 1 h a k i =max h a m - 1 i ,则定理可证。

5 时间复杂度的计算

本节在上述理论分析的基础上,提出了一种基于矩阵的动态算法,用于增加或减少属性时基于矩阵计算 d ^的乐观和悲观多粒度上下近似,并比较了静态算法和动态算法的时间复杂度。
算法1是一种基于矩阵的静态算法,用于计算 d ^的乐观和悲观多粒度上下近似。步骤1~11是根据定义7计算等价关系矩阵,其时间复杂度为O(m|U|2)。步骤12~15是根据定义8计算,其时间复杂度为O(m|U|2)。步骤16是根据定理1计算 d ^的乐观悲观多粒度上下近似,其时间复杂度为O(m|U|)。因此,算法1的总时间复杂度为O(m|U|2)。
算法1 计算上下近似的静态算法
输入:模糊信息系统S=(U,AD,V,f);属性值a1,a2,…,am;隶属度 d ^(x)。
输出: k = 1 m R a k O _ d ^, k = 1 m R a k O ¯ d ^, k = 1 m R a k P _ d ^, k = 1 m R a k P ¯ d ^
1:for k=1 to m do
2: for i=1 to n do
3: for j=1 to n do
4: if ak(xi)=ak(xj) then
5: m i j a k=1;
6: w Δ i O = w i O ;
7: m i j a k=0;
8: end
9: end
10: end
11:end
12:for k=1 to m do
13: 计算 M a kmax d ^ c;
14: 计算L- M a kmax d ^ c;
15:end
16:计算 k = 1 m R a k O _ d ^, k = 1 m R a k O ¯ d ^, k = 1 m R a k P _ d ^, k = 1 m R a k P ¯ d ^
17:end
算法2是一种基于矩阵的动态算法,用于在增加属性时计算 d ^的乐观和悲观多粒度上下近似。步骤1是根据定义7计算属性am+1的等价关系矩阵,又根据定义8计算 h a m H a m,其时间复杂度为O(|U|2)。步骤2~8是根据定理2更新表示 d ^的乐观多粒度上近似,其时间复杂度为O(|U|)。步骤9~15是根据定理2更新表示 d ^的乐观多粒度下近似,其时间复杂度为O(|U|)。步骤16~22是根据定理2更新表示 d ^的悲观多粒度下近似,其时间复杂度为O(|U|)。步骤23~29是根据定理2更新表示 d ^的悲观多粒度上近似,其时间复杂度为O(|U|)。总时间复杂度为O(|U|2)。可以看出,优于基于矩阵的静态算法(算法1)。
算法2 增加属性时更新上下近似的动态算法
输入:模糊信息系统S=(U,AD,V,f);属性值a1,a2,…,am;隶属度 d ^(x);增加的属性am+1;更新之前的上下近似 k = 1 m R a k O _ d ^, k = 1 m R a k O ¯ d ^, k = 1 m R a k P _ d ^, k = 1 m R a k P ¯ d ^
输出: k = 1 m + 1 R a k O _ d ^, k = 1 m + 1 R a k O ¯ d ^, k = 1 m + 1 R a k P _ d ^, k = 1 m + 1 R a k P ¯ d ^
1:计算 M a m + 1 and h a m + 1 and H a m + 1;
2:for i=1 to n do
3: if H a m + 1 i w i O then
4: w Δ i O = H a m + 1 i
5: else
6: w Δ i O = w i O
7: end
8:end
9:for i=1 to n do
10: if h a m + 1 i w i O then
11: w Δ i O = h a m + 1 i
12: else
13: w Δ i O = w i O
14: end
15:end
16:for i=1 to n do
17: if H a m + 1 i w i P then
18: w Δ i P = H a m + 1 i
19: else
20: w Δ i P = w i P
21: end
22:end
23:for i=1 to n do
24: if h a m + 1 i w i P then
25: w Δ i P = h a m + 1 i
26: else
27: w Δ i P = w i P
28: end
29:end
算法3是一种基于矩阵的动态算法,用于在减少属性时计算 d ^的乐观和悲观多粒度上下近似。步骤1是根据定义7计算属性am的等价关系矩阵,又根据定义8计算 h a m H a m,其时间复杂度为O(|U|2)。步骤2~8是根据定理2更新表示 d ^的乐观多粒度上近似,当if else语句中的条件判断导致每次都执行else分支时,算法的时间复杂度达到最坏情况,在最坏情况下,时间复杂度为O((m-1)|U|2)。同理,步骤9~15是根据定理2更新表示的乐观多粒度下近似,在最坏情况下,其时间复杂度为O((m-1)|U|2)。步骤16~22是根据定理2更新表示 d ^的悲观多粒度下近似,在最坏情况下,其时间复杂度为O((m-1)|U|2)。步骤23~29是根据定理2更新表示 d ^的悲观多粒度上近似,在最坏情况下,则其时间复杂度为O((m-1)|U|2)。所以,总的时间复杂度是O((m-1)|U|2,但是实际运行时间会与if else语句中的条件判断有关。
算法3 减少属性时更新上下近似的动态算法
输入:模糊信息系统S=(U,AD,V,f);属性值a1,a2,…,am;隶属度 d ^(x);减少的属性am;更新之前的上下近似 k = 1 m R a k O _ d ^, k = 1 m R a k O ¯ d ^, k = 1 m R a k P _ d ^, k = 1 m R a k P ¯ d ^
输出: k = 1 m - 1 R a k O _ d ^, k = 1 m - 1 R a k O ¯ d ^, k = 1 m - 1 R a k P _ d ^, k = 1 m - 1 R a k P ¯ d ^
1:计算 M a m and h a m and H a m;
2:for i=1 to n do
3: if H a m i < w i O then
4: w i O = w i O
5: else
6: w i O =max H a j i
7: end
8:end
9:for i=1 to n do
10: if h a m i > w i O then
11: w i O = w i O
12: else
13: w i O =min h a j i
14: end
15:end
16:for i=1 to n do
17: if H a m i > w i P then
18: w i P = w i P
19: else
20: w i P =min H a j i
21: end
22:end
23:for i=1 to n do
24: if h a m i < w i P then
25: w i P = w i P
26: else
27: w i P =max h a j i
28: end
29:end

6 实验时间的对比

本节进行了几个实验来验证在增加或减少属性时更新近似算法的有效性,对动态更新算法和静态算法的运行时间进行了比较,同时和从集合角度的动态更新算法进行了比较,表2中实验评估的数据集源自UCI机器学习数据集存储库。实验中我们将每个数据集分成10个相等的部分,第1部分作为第1个数据集,第1部分和第2部分的组合作为第2个数据集,以此类推,这10部分的组合作为第10个数据集,所有实验算法在Windows 11,Intel(R) Core(TM) i7-10700K CPU@3.80 GHz,3.70 GHz 32 GB内存的个人电脑上进行测试,算法在MATLAB 2021中编码。
表2 实验使用的UCI数据集

Tab.2 UCI data set for experimental use

数据集 个数 属性数 类别数
Balance Scale 625 4 3
Breast Cancer Wisconsin 683 9 2
Contraceptive Method Choice 1 473 9 2
Phishing Websites 2 456 30 3

6.1 增加属性时实验时间的对比

当增加属性时,我们比较了表3所示数据集上基于矩阵的静态算法和动态更新算法的运行时间。我们将表3中的初始属性作为数据集中的原始条件,各个数据集从表3中添加相应的属性。实验结果如图1所示,横坐标代表论域的大小,纵坐标代表计算时间,图中的●折线显示了随着数据集规模增加,增加属性的矩阵动态算法运行时间随论域增加的变化情况;■折线显示了随着数据集规模增加,静态算法运行时间随论域增加的变化情况;▲折线显示了随着数据集规模增加,从集合角度的非矩阵更新算法运行时间随论域增加的变化情况。从图1中的实验结果可以看出,静态算法和增量算法的运行时间随着数据集的增加而增加;基于矩阵的增量算法的计算时间始终低于静态算法和非矩阵更新算法,当数据集的规模增加时,这种差距会变得更大。
表3 增加属性时使用的UCI数据集

Tab.3 The UCI data set used when adding attributes

数据集 初始的属性 增加的属性
Balance Scale {a1,a2,a3} {a4}
Breast Cancer Wisconsin {a1,a2,…,a7} {a8,a9}
Contraceptive Method Choice {a1,a2,…,a7} {a8,a9}
Phishing Websites {a1,a2,…,a27} {a28,a29,a30}
图1 增加属性时算法时间对比

Fig.1 Algorithm time comparison when adding attributes

6.2 减少属性时实验时间的对比

当减少属性时,比较表4所示数据集上基于矩阵的静态算法和动态更新算法的运行时间。如同表4表述的,我们将表4中的初始属性作为数据集中原始的条件,各个数据集从表4中减少相应的属性。
表4 减少属性时使用的UCI数据集

Tab.4 The UCI data set used when reducing attributes

数据集 初始的属性 减少的属性
Balance Scale {a1,a2,…,a4} {a4}
Breast Cancer Wisconsin {a1,a2,…,a9} {a8,a9}
Contraceptive Method Choice {a1,a2,…,a9} {a8,a9}
Phishing Websites {a1,a2,…,a30} {a28,a29,a30}
实验结果如图2所示,横坐标代表论域的大小,纵坐标代表计算时间,图中的●折线显示了随着数据集规模增加,减少属性的矩阵动态算法运行时间随论域增加的变化情况;■折线显示了随着数据集规模增加,静态算法运行时间随论域增加的变化情况;▲折线显示了随着数据集规模增加,从集合角度的非矩阵更新算法运行时间随论域增加的变化情况。从图2中的实验结果可以看出,静态算法和动态算法的运行时间随着数据集的增加而增加;基于矩阵的增量算法的计算时间始终低于静态算法和非矩阵更新算法,当数据集的规模增加时,这种差距会变得更大。
图2 减少属性时算法时间对比

Fig.2 Algorithm time comparison when reducing attributes

7 结语

本文提出了一种在模糊信息系统中增加或减少属性时基于矩阵更新多粒度粗糙模糊集近似集的动态算法,首先用矩阵的形式给出了多粒度粗糙模糊集上下近似集的表示方法,并给出了相应的动态算法,比较静态算法和动态算法的时间复杂度,并在UCI数据集中进行了实验,表明动态算法计算效率优于静态算法。
未来的工作将探究在多粒度模糊的前提下,当对象增加或者减少时近似集的动态更新方法,当本文中的等价关系与属性改变时基于矩阵给出相应的近似集的动态更新方法,并实际应用于具体的数据集中。
[1]
ZADEH L A. Fuzzy sets[J]. Information and Control, 1965, 8(3):338-353.

DOI

[2]
PAWLAK Z. Rough sets[J]. International Journal of Computer & Information Sciences, 1982, 11(5):341-356.

[3]
DUBOIS D, PRADE H. Rough fuzzy sets and fuzzy rough sets[J]. International Journal of General Systems, 1990, 17(2/3):191-209.

DOI

[4]
QIAN Y H, LIANG J Y, YAO Y Y, et al. MGRS:a multi-granulation rough set[J]. Information Sciences, 2010, 180(6):949-970.

DOI

[5]
孙文鑫, 刘玉锋. 一般多粒度粗糙模糊集模型[J]. 重庆大学学报(自然科学版), 2015, 32(4):104-109.

SUN W X, LIU Y F. General multi-granularity fuzzy rough set model[J]. Journal of Chongqing Normal University (Natural Science Edition), 2015, 32(4):104-109.

[6]
CHEN H M, LI T R, RUAN D, et al. A rough-set-based incremental approach for updating approximations under dynamic maintenance environments[J]. IEEE Transactions on Knowledge and Data Engineering, 2013, 25(2):274-284.

DOI

[7]
PAN Y Z, XU W H, RAN Q W. An incremental approach to feature selection using the weighted dominance-based neighborhood rough sets[J]. International Journal of Machine Learning and Cybernetics, 2023, 14(4):1217-1233.

DOI

[8]
YANG X B, QI Y, YU H L, et al. Updating multigranulation rough approximations with increasing of granular structures[J]. Knowledge-Based Systems, 2014, 64:59-69.

DOI

[9]
YU P Q, WANG H K, LI J J, et al. Matrix-based approaches for updating approximations in neighborhood multigranulation rough sets while neighborhood classes decreasing or increasing[J]. Journal of Intelligent & Fuzzy Systems, 2019, 37(2):2847-2867.

[10]
XIAN Z L, CHEN J K, YU P Q. Relative relation matrix-based approaches for updating approximations in multigranulation rough sets[J]. Filomat, 2020, 34(7):2253-2272.

DOI

[11]
CHEN H M, LI T R, LUO C, et al. A rough set-based method for updating decision rules on attribute values’ coarsening and refining[J]. IEEE Transactions on Knowledge and Data Engineering, 2014, 26(12):2886-2899.

DOI

[12]
CHENG Y. Dynamic maintenance of approximations under fuzzy rough sets[J]. International Journal of Machine Learning and Cybernetics, 2018, 9(12):2011-2026.

DOI

[13]
ZHANG J B, WONG J S, PAN Y, et al. A parallel matrix-based method for computing approximations in incomplete information systems[J]. IEEE Transactions on Knowledge and Data Engineering, 2015, 27(2):326-339.

DOI

[14]
LIU G L. The axiomatization of the rough set upper approximation operations[J]. Fundamenta Informaticae, 2006, 69(3):331-342.

DOI

[15]
CHEN H M, LI T R, LUO C, et al. A decision-theoretic rough set approach for dynamic data mining[J]. IEEE Transactions on Fuzzy Systems, 2015, 23(6):1958-1970.

DOI

[16]
XU Y, WANG M, HU S Z. Matrix-based fast granularity reduction algorithm of multi-granulation rough set[J]. Artificial Intelligence Review, 2023, 56(5):4113-4135.

DOI

[17]
胡寿松, 何亚群. 粗糙决策理论与应用[M]. 北京: 北京航空航天大学出版社, 2006: 221-235.

HU S S, HE Y Q. Rough decision theory and its application[M]. Beijing: Beijing University of Aeronautics & Astronautics Press, 2006:221-235.

[18]
张文修, 梁怡, 吴伟志. 信息系统与知识发现[M]. 北京: 科学出版社, 2003.

ZHANG W X, LIANG Y, WU W Z. Information system and knowledge discovery[M]. Beijing: Science Press, 2003.

[19]
HUANG Y Y, LI T R, LUO C, et al. Matrix-based dynamic updating rough fuzzy approximations for data mining[J]. Knowledge-Based Systems, 2017, 119(2):273-283.

DOI

[20]
HU C X, LIU S X, LIU G X. Matrix-based approaches for dynamic updating approximations in multigranulation rough sets[J]. Knowledge-Based Systems, 2017, 122(2):51-63.

DOI

Outlines

/