针对当前自动睡眠分期方法存在的难点问题,提出了一种结合U2-Net和CBAM融合注意力对EEG-ECG双模态信号进行自动睡眠分期的方法。首先,采用MIT-BIH公开数据集中的EEG-ECG信号进行预处理;然后,利用添加了多尺度特征提取模块的U2-Net网络并行提取EEG和ECG中的波形特征;其次,利用CBAM融合注意力对全部特征进行权重分配;最后,使用Softmax激活函数对睡眠时期进行六分类。结果表明:基于U2-Net和CBAM融合注意力模型进行睡眠分期时,使用ECG单模态信号的六分类总体准确率为80.2%,F1分数为75.3%;使用EEG单模态信号的六分类总体准确率为85.8%,F1分数为81.7%;使用EEG-ECG双模态信号的六分类总体准确率为90.4%,F1分数为85.6%。提出的双模态睡眠分期模型是可行有效的,并且为自动睡眠分期提供了一种新的思路。
影像基因组学认为神经影像与基因之间存在着一定程度的相关性,利用遗传变异与影像数据进行疾病分析愈发受研究人员重视。在实践中,临床医生拥有的数据规模往往较小,但仍然希望使用深度学习来解决现实问题。考虑到不断扩大的数据规模与昂贵的标注成本,构建能够利用多模态数据的无监督学习方法十分必要。为了满足上述需求,提出了一种基于影像与基因多模态表格数据对比学习的表征学习方法(multimodal tabular data with contrastive learning,MTCL),该模型利用了静息态功能磁共振成像(rs-fMRI)和单核苷酸多态性(single nucleotide polymorphisms,SNP)数据,无需数据的任何标签信息。为了增强可解释性,模型先通过特征提取模块将rs-fMRI和SNP数据转换为表格类型结构,再通过多模态表格数据对比学习模块对多模态数据进行融合,并获得融合后的数据表征。在重度抑郁症(major depression disorder,MDD)数据上,文中提出的方法能够有效提升MDD诊断性能。此外,MTCL方法结合了模型归因方法挖掘与MDD相关的影像和遗传生物标记物,提高了模型的可解释性,有助于研究人员对疾病发病机制的理解。
多功能活性肽是一种源于蛋白质的化合物,能够作用于多个靶标并传递多种生理效应,对多种疾病具有显著的治疗效果。现有多功能活性肽预测模型在特征表示阶段未能充分考虑到氨基酸之间存在的关联性,使得模型的特征表示能力降低;现有方法采用将多标签分类问题转换为多个二分类预测问题的策略,导致模型在预测阶段无法考虑活性肽多个功能之间的依赖性,使得模型对多功能活性肽的预测准确度下降。针对以上问题,提出一种基于标签依赖性的多功能活性肽预测模型TCLD,通过Transformer编码器提取活性肽序列中氨基酸之间的关联性,利用ZLPR损失函数来捕获多个功能之间对应的标签依赖性,用于提高多功能活性肽预测模型的性能。实验结果表明,TCLD的预测性能优于现有的多功能活性肽预测方法,有助于研究人员快速筛选出具有潜在治疗价值的多功能活性肽候选物,从而加速新型药物的研发进程。
为了提高白内障手术器械分割精度,构建了一种增强边缘特征的双注意力网络EE-DANet。EE-DANet采用双分支结构:边缘分支负责提取边缘特征,使用增强空间注意力ASA,应对传统图像分割边缘信息丢失问题;主干分支采用U型结构,在特征提取阶段使用多尺度特征融合模块解决手术器械图像种类多,尺度变换大的问题;在解码器部分使用条形坐标注意力SCA对图像进行全局建模,捕获手术器械的方向和位置信息,应对手术器械镜面反射问题。所提模型在Dataset_instrument数据集上的IoU与Dice分别达到了75.5 %与83.9 %。所提模型有效提升了白内障手术器械分割性能,对未来白内障手术的智能化发展有积极意义。
在药物发现的早期阶段,深度生成模型正逐渐成为分子设计的关键工具。简化分子线输入系统(simplified moleaclar input line entry system,SMILES)作为标准的化学表示法,被广泛用于模型训练与生成。然而,由于分子环系统线性表示的非唯一性和非方向性,现有的单向编码器在捕捉样本全局语义结构和生成有效分子环时存在局限性。因此,提出一种名为Chemical RWKV BERT(ChemRB)的方法,旨在从海量的未标记数据中深度挖掘双向信息。为实现这一目标,创新性地设计了2个预训练任务:环级特征预测与全局跨度闭合预测。这些预训练任务不仅为模型提供了丰富多元的上下文信息,更进一步提升了其对复杂分子结构特性的深入理解。实验结果显示:ChemRB模型不仅在性能上取得了显著提升,而且在新分子/样本的评估指标上也达到了最优的基准性能。结果充分验证了ChemRB在精准捕获分子固有结构信息方面的有效性,为其在相关领域的应用提供了坚实的实证基础。最后,通过在EGFR抑制剂上的测试和应用,进一步验证了ChemRB模型的实用性和广泛应用前景。
多数基于Transformer的目标跟踪模型提取的目标局部空间特征信息有限且时间特征利用不足,显著影响了目标跟踪模型在处理目标遮挡、形变或尺度变化等复杂场景下的性能。为此,提出一种时空特征强化与感知的视觉目标跟踪方法(visual object tracking method with spatial-temporal feature enhancement and perception,STFEP)。一方面,该方法使用Transformer进行搜索区域与时间上下文特征的提取与融合,以得到全局特征信息,通过设计的局部卷积神经网络,提取目标的局部特征信息,并与目标的全局特征信息相关联,进一步强化目标的特征表示。另一方面,提出了时空特征感知机制,对不同时刻的特征信息进行可靠性和必要性分析,构建动态模板以感知更丰富的时空信息,使模型适应目标及场景的复杂变化。在TrackingNet、GOT-10k、LaSOT、UAV123多个数据集上的实验结果表明,研究所提方法能够准确鲁棒的对目标进行跟踪,并在GOT-10k数据集上取得了最优的结果,AO、SR0.5以及SR0.75分别达到了73.7%、83.8%、70.6%。
混合型属性数据是最为常见的一种数据集类型,针对该类型数据的聚类算法是聚类分析的研究热点之一。由于谱聚类算法具有适合于任意形状数据的聚类问题且能收敛于全局最优解的优势,因而从相似性度量的角度出发,基于杰卡德(Jaccard)距离、马氏(Mahalanobis)距离的思想,设计一种适用于混合型属性数据的相似性度量,并利用其实现谱聚类的混合型属性数据扩展,构建一种改进的谱聚类算法(IJM-SC)。将构建的算法应用于UCI机器学习数据库中心脏病数据集等3个混合型属性数据集进行聚类,验证算法对混合型属性数据聚类的优越性,通过与现有一些算法比较效果指标,结果表明提出算法能够更好地实现对混合型属性数据的聚类。
多模态情感分析,作为一个极具挑战性的研究领域,融合了文本、音频与视频3种模态以分析人的情感倾向。现有的研究认为文本模态在情感预测中占据主导地位,然而,这也引发了一个潜在问题:机器学习模型在训练过程中往往倾向于构建输入输出间的相关关系,过度依赖文本可能导致模型错误地建模文本与情感标签之间虚假的相关关系,削弱模型的泛化能力。为应对这一挑战,创新性地提出一种基于反事实文本去偏的多模态情感分析框架(CFTB),该算法首先运用因果图,深入剖析3种模态与情感标签之间的因果关系。随后,精心构建了一个辅助文本模型,旨在精准量化文本模态对情感预测的直接影响,并通过注意力机制精准捕捉那些可能引发虚假关联的文本特征。在推理阶段,CFTB算法展现出独特的优势:它能够智能地从多模态信息的全效应中剥离出由虚假文本关联导致的负面影响,同时保留并强化文本模态中真正有助于情感预测的正面影响。在MOSEI和MOSI两个数据集上的实验表明,该框架可以有效地集成到现有方法中,具有良好的泛化性能。
在移动机器人路径规划时,采用传统的或经典的蚁群算法往往出现移动方向较少、视野范围较少,非最优路径和路径不平滑等问题。针对上述蚁群算法的固有缺陷,提出了并行双向24邻域16方向的蚁群算法。首先,24邻域16方向路径搜索方式能够扩大路径搜索视野范围,将24邻域16方向路径搜索方式与双向交替搜索策略相结合,能够更好地到达终点,增强了全局搜索能力;其次,启发函数包含起点、当前点、待选节点和终点信息以及自适应因子,同时引入改进转移概率公式,增强路径搜索的引导性;然后,引入路径交叉策略,避免陷入局部最优;最后,采用路径节点转移策略平滑路径,得到的路径拐点少且路径最短。在不同复杂度的栅格地图中,将所提的改进蚁群算法分别与传统蚁群算法和其他改进的蚁群算法进行仿真对比实验,仿真结果证明了所提算法是可行的和有效的。
针对传统花朵授粉算法在求解一些复杂优化问题时存在着开采能力不足的缺点,提出了一种适应性引导的花朵授粉算法(AGFPA)。所提算法设计了环优策略和向优策略相结合的适应性引导机制,适应性地控制最优个体对种群演化的引导作用,既增强算法的开采能力,又尽可能维持种群的多样性。适应性引导机制中的环优策略在最优个体的周围执行导向开采,使得种群集中搜索最优个体的邻域;而向优策略利用最优个体的引导进行定向搜索,使得搜索有向地覆盖较广的未知区域。此外,设计了适应性参数控制策略,根据不同演化阶段的需求,调整全局授粉转换概率和最优引导的步长因子,从而维持开采能力和勘探能力的平衡。为检验所提算法的性能,在群智能研究领域中常用的18个基准测试函数上进行了策略有效性分析,并将AGFPA分别与几种改进的FPA和PSO算法进行比较;同时,应用AGFPA估计发酵动力学参数。实验结果表明,在求解大多数单峰、多峰和复杂函数时,AGFPA均具有较为优秀的寻优能力;在发酵动力学参数估计应用中,AGFPA也具有一定的优势。