通过分割生态图像中蝴蝶获得蝴蝶掩码是基于生态图像的蝴蝶物种自动化识别的基础,因此研究蝴蝶生态图像分割有重要意义。然而,现有蝴蝶生态图像存在数据集样本量小、蝴蝶拟态、翅膀遮挡等问题,使现有深度网络难以训练出具有良好泛化能力的分割模型。为此,通过改进SAM(segment anything model)模型,提出一种鲁棒的蝴蝶生态图像分割新模型SABM(segment any butterfly model)。SABM模型通过引入双路卷积模块、蝴蝶词元(butterfly token)及一个3层MLP(multi-layer perceptron)使模型具有更好的特征学习能力。707张蝴蝶生态图像数据集的2折交叉验证实验表明,SABM模型对蝴蝶生态图像的分割能力超越了SAM及其现有的改进SOTA模型。7 645张全新蝴蝶生态图像数据集的分割实验测试发现,SABM模型具有非常好的泛化性能,对7 645张全新蝴蝶生态图像的蝴蝶实现了非常好的分割。该分割结果为未来的蝴蝶生态图像分割研究提供了10倍于现有数据的大数据集,为野外环境下的蝴蝶物种自动识别提供了更好的可用数据,也为测试聚类算法性能提供了富有挑战性的数据集。另外,还在医学图像数据测试了SABM模型的鲁棒性。
针对移动机器人路径规划对路径长度最短以及平滑度的性能要求,提出一种改进A-star算法融合提升动态窗口法(dynamic window approach,DWA)求解机器人动态路径规划问题的方法。设计了A-star算法新的启发函数,并对其进行动态权重分配,增加新的评估函数,实现了全局规划路径最短,减少了规划路径的拐点和冗余节点。针对DWA算法,设计了静态障碍物和动态障碍物距离函数,增添路径偏差距离函数,并以全局路径进行指导,使DWA算法规划的路径贴合全局路径,能够及时躲避未知障碍物和动态障碍物,为全局最优路径。仿真结果表明:复杂环境下,改进的A-star算法相比传统算法在路径长度上缩短34.4%,拐点减少53.5%。
虽然SASRec(self-attention sequential recommendation)模型在稀疏性数据集和稠密型数据集上的结果都优于各种序列推荐模型,但是在序列推荐中也会受到表征退化的困扰,即高频出现的物品常常会集中在表征空间的一小块区域,从而降低推荐性能。为了解决该问题,引入了一个对比学习损失函数,在embedding空间里添加高斯噪声做数据增强,并使用原始物品序列和数据增强后的物品序列来构建正样本对,促使相似实例在映射空间里的距离越近越好,不同实例在映射空间里的分布呈现均匀性,尽可能让实例映射成embedding之后还能保留自己的个性化信息。对两个基准数据集的综合实验研究表明,该对比学习模型方法可以平滑地调整学习表示的流行度偏差。该对比学习基于图推荐模型SGL(self-supervised graph learning for recommendation),该模型在表示学习中存在负采样偏差,提出的模型可以有效地提高推荐性能。
岩画作为一种特殊的历史文化遗产,其数量大、分布广,图像分类面临复杂元素交叉干扰的挑战,难以实现高效准确的分类识别,而深度学习等技术的发展为岩画的保护研究提供了新的契机。基于此,提出一种双分支注意力融合网络(DBAFN),融合ResNet50的局部特征提取能力与ViT(vision Transformer)的全局语义建模能力,以贺兰山岩画为例,通过门控注意力机制动态加权特征,提升岩画分类精度。在包含1 200幅贺兰山岩画图像(人面像、动物、狩猎场景)的数据集上,DBAFN实现85.62%的分类准确率,较单一ResNet50(81.46%)和单一ViT(80.02%)提升显著,其中狩猎岩画F1值提高至82.35%。实验表明,该网络能有效解决岩画误分类问题,为文化遗产语义解析与跨学科研究提供新路径,助推人工智能在文化遗产数字化保护领域的应用。
提出了一种基于三维高光谱与Transformer的网络,用于中国中原风格与西域风格壁画的风格特征分类。通过采集壁画的高光谱图像,并构建相应的数据集,在此基础上,采用迁移学习的方法对所提出的网络进行训练。实验结果表明,与其他传统方法相比,文中方法的准确率相较于最优算法提升了0.92%,精确率提升了0.12%,召回率提升了1.4%,F1分数提升了0.75%。此外,通过与基于彩色图像的深度学习分类方法的对比,相较于结果最优的方法,准确率提升了4.5%,精确率提升了1.9%,召回率提升了5.4%,F1分数提升了3.7%。研究验证了高光谱信息在提升分类准确性方面的独特优势。
随着信息技术的飞速发展与广泛应用,数据量呈现爆炸式增长,数据类型与不确定性也日益增加,传统的精确数学模型无法进行准确描述,而直觉模糊信息系统可以有效地对模糊等不确定性进行表征,进而实现复杂数据的知识发现。并且,数据形式的变化使得传统的基于等价或相似关系的粒化机制有很大的局限性,等价关系过于严格而相似关系会导致粒度单调性不成立。因此,基于优势关系建立了一种直觉模糊信息系统的粒化方法,进一步为度量系统不确定性定义了直觉模糊信息系统的信息熵和粗糙熵。在此基础上,为了降低数据的维度,去除冗余的属性,提高数据的处理效率与分类准确性,从而更好地发现数据之间的关系和规律,基于粗糙熵构建了属性的相对重要度和绝对重要度的度量方式,进而设计了一种直觉模糊信息系统启发式属性约简算法。最后,结合UCI 数据集对算法的有效性进行了验证分析,与传统算法相比,可以有效提高获取约简的效率。
基于能力的知识空间理论是一种用于描述个体在特定学科领域能力水平的理论框架。能力模型是该理论框架下构建知识结构的重要模型之一。能力模型中,认为解决问题的方法可能不止一种,且个体得完全掌握解决该问题方法的一种才能解决该问题。然而,个体掌握解决问题的某种方法的部分技能也可能解决该问题。由此可见,能力模型的条件过于严苛,在实际应用中急需拓展能力模型。因此,基于能力包含度提出了三种构建知识结构的变精度能力模型;研究了它们所构建的知识结构的一些性质,同时发现这三种变精度能力模型与原有α-变精度能力模型构建知识结构族的效果相同。此外,定义了技能函数的最大能力包含度矩阵,利用矩阵方法获取变精度能力模型构建的知识结构,并设计了相应算法;还考虑保持知识结构不变的技能子集约简与路径选择问题。最后,选取6个数据集进行实验,验证了所提矩阵方法的有效性与优越性。
