欢迎访问陕西师范大学学报(自然科学版)官方网站!

本期目录

2020年, 第48卷, 第2期 刊出日期:2020-03-10
  

  • 全选
    |
    人工智能专题
  • 谢娟英,郑清泉,吉新媛
    陕西师范大学学报(自然科学版). 2020, 48(2): 1-8.
    PDF全文 ( ) 可视化 收藏
    特征选择是高维小样本癌症基因数据分析的首要和关键步骤, 但是现有特征选择算法存在特征子集依赖于训练样本且随训练样本不同而变化的问题。为了解决特征选择过程的特征子集不稳定问题, 提出一种基于核极限学习机的集成特征选择方法, 利用5-折交叉验证划分原始数据, 对各训练集继续采用5-折交叉验证进行划分并进行特征选择, 以所得5个特征子集之并集作为该训练集的特征子集, 构造核极限学习机评价该特征子集的分类性能, 以原始数据集5-折交叉验证所得特征子集的平均Jaccard系数评价特征选择算法所选特征子集的稳定性。5个基因数据集的实验测试以及与经典特征选择算法SVM-RFE、LLE Score、ARCO、DRJMIM、Random Forest和mRMR的实验比较表明, 本文算法不仅能选择到稳定的特征子集, 且所选特征子集具有很好的泛化能力。
  • 孟晓超,姜高霞,王文剑
    陕西师范大学学报(自然科学版). 2020, 48(2): 9-16.
    PDF全文 ( ) 可视化 收藏
    在监督分类学习中,标签噪声对模型有重要的影响;而现有的标签噪声过滤方法一般都是基于模型的预测结果对噪声样本进行检测并去除,当噪声样本较多时,去除噪声样本的同时将会影响原来样本的完整性,使样本信息缺失。针对这一问题,提出一种基于主动学习的标签噪声清洗方法(active label noise cleaning based on classification with gaussian process,GP_ALNC),该方法将高斯过程模型和主动学习相结合,从已有标签样本集中筛选出不确定性最高的样本交给人工专家进行检验,通过这种迭代方法清洗掉大部分噪声数据的同时保持了原有数据的完整性;并针对二分类任务中的标签噪声问题,在MNIST数据集和UCI数据集上,与已有方法ALNR(active label noise removal)以及ICCN_SMO(iterative correction of class noise based on SMO)进行了实验对比,并取得了不错的表现。
  • 苏寒松,陈震宇,龙鑫,刘高华
    陕西师范大学学报(自然科学版). 2020, 48(2): 17-24.
    PDF全文 ( ) 可视化 收藏
    针对传统运动历史图像难以区分相似运动的缺陷,提出了一种基于改进运动历史图像和支持向量机的行为识别方法。首先提取视频帧的前景运动目标并标记出其外接矩形框,计算矩形区域内各像素的光流矢量;然后设定运动历史图像中前景像素点的灰度值为该像素点的光流长度叠加一定权重的历史灰度,而背景像素点的灰度值则按一定比例进行衰减;最后从运动历史图像中提取Hu矩为特征向量,输入支持向量机进行分类,从而完成人体行为识别。在KTH数据集的实验结果表明,所提算法能够满足实时性要求,识别率可达99%。
  • 徐秀娟, 白玉林, 徐璐, 许真珍, 赵小薇
    陕西师范大学学报(自然科学版). 2020, 48(2): 25-31.
    PDF全文 ( ) 可视化 收藏
    针对恶劣天气情况,提出基于随机森林交通流量预测模型,基于2016年纽约市出租车数据以及天气情况,对原始GPS数据进行层层筛选,筛选出符合恶劣天气条件定义的数据,以随机森林回归方法为基础研究恶劣天气下交通流量的预测模型,并通过调整模型的超参数改善了模型的性能;同时将随机森林模型与BP神经网络模型和决策树模型做了性能对比,随机森林预测模型最终取得的实验结果较好。
  • 李鸿杨,潘静,何宇清,庞彦伟
    陕西师范大学学报(自然科学版). 2020, 48(2): 32-37.
    PDF全文 ( ) 可视化 收藏
    针对深度卷积神经网络中存在的过拟合问题,本文提出了一种确定性连接丢弃的正则化方法。核心思想是根据不同卷积滤波器权重对结果的贡献度不同,确定性丢弃卷积层层间连接,通过降低卷积滤波器权重的空间维度,使得卷积神经网络各层之间的连接更稀疏。通过将算法应用于图像分类任务来验证算法的性能,在MNIST、CIFAR-10和CIFAR-100数据集上,错误率分别为0.32%、5.33%、26.88%,相比于原始实验错误率分别降低0.15%、1.09%、1.36%。实验表明,本算法能够有效处理深度卷积神经网络的过拟合问题,并能提升网络的鲁棒性和泛化能力。
  • 梁春燕,曹伟
    陕西师范大学学报(自然科学版). 2020, 48(2): 38-42.
    PDF全文 ( ) 可视化 收藏
    语种识别中现有的总变化因子分析仅能反映语音数据的整体结构,不能挖掘其局部内在结构信息, 并且未考虑训练语音数据的语种类别。针对此问题,提出了基于邻域保持嵌入算法的语种识别,通过构建邻接图以获得语音数据的局部邻域结构,同时通过有监督训练有效利用语音数据的语种标注信息。在2011年美国国家标准与技术研究院语种识别评测的30 s和10 s测试集上进行了对比实验。实验结果表明,邻域保持嵌入算法能够有效弥补总变化因子分析的不足,可明显提高系统的识别性能。
  • 李丛丛,刘惊雷
    陕西师范大学学报(自然科学版). 2020, 48(2): 43-51.
    PDF全文 ( ) 可视化 收藏
    根据图模型的结构特征和参数特征等要素设计生成随机的模型,根据顶点数与度的大小生成随机结构的CP-nets,其原理是通过改进Prüfer编码得到DAG编码,又建立DAG编码与图结构的一对一映射实现图模型的随机生成。通过设计的占优查询算法与典型的占优查询相结合验证了占优查询算法的时间消耗严重依赖于图拓扑结构的随机性和参数数量的随机性。
  • 郭永宁,孙树亮
    陕西师范大学学报(自然科学版). 2020, 48(2): 52-57.
    PDF全文 ( ) 可视化 收藏
    针对具有较强相关性、冗余性和大数据量的图像,提出了基于真随机数和伪随机数相结合的图像加密算法。首先计算行、列置乱的迭代初始值,应用二维Logistic 映射产生混沌序列;为了增强系统的安全性,采用扩展的异或操作,对图像进行行、列置乱;最后对图像进行扩散操作并获得加密图像。实验结果表明,提出的算法具有较高的安全性并能够抵御多种攻击。
  • 汤正,刘佶鑫,孙宁,韩光,李晓飞
    陕西师范大学学报(自然科学版). 2020, 48(2): 58-68.
    PDF全文 ( ) 可视化 收藏
    图像隐私保护主要应用于云计算领域,而针对图像或视频的识别任务一般需要其视觉可见,因而往往忽略了隐私保护问题。为了解决这类问题,受到基于压缩感知(compressed sensing,CS)的稀疏表示分类识别算法对于遮挡或污染图像具有较强鲁棒性的启发,提出了一种单层CS采样的扩展模型,使得经过多层CS采样编码后的图像虽然质量退化、内容逐渐变得不可辨别,但依然能够用于图像识别,达到视觉隐私保护的目的。为了能够对多层CS采样编码图像进行图像内容隐私保护度的有效评价,基于人类视觉系统(human visual system,HVS),利用多层CS图像对比度和图像视觉结构退化的特点,通过度量图像对比度和提取图像局部二进制模式(local binary pattern, LBP)特征,提出了面向多层CS图像的内容隐私保护度评价模型(MCS-CPPE)。通过在构造的三大数据集上进行与人眼视觉相关性的实验,验证了所提出的模型有较好的预测性能和效果。
  • 夏海峰,袁晓彤
    陕西师范大学学报(自然科学版). 2020, 48(2): 69-75.
    PDF全文 ( ) 可视化 收藏
    模型压缩和对抗鲁棒性在深度学习模型落地到实际应用场景中扮演着重要的角色,本文将二者结合到同一视角下,探讨在模型压缩同时又可以使精简后的模型具有鲁棒性的问题。在对抗训练的框架下,对模型压缩和模型鲁棒性之间一些性质上的关联进行了研究,并且通过实验证明了模型压缩和对抗鲁棒性可以同时得到。
  • 张孙贤,于欢,刘子昂,王志晓
    陕西师范大学学报(自然科学版). 2020, 48(2): 76-83.
    PDF全文 ( ) 可视化 收藏
    针对传统中心性指标方法忽略节点所在的环结构对网络分解的影响以及基于去环策略方法在去除环结构过程中删除大量非关键节点的问题,提出了基于邻居节点融合的社交网络分解方法。该方法利用邻居节点的融合策略降低了环结构对网络分解的影响,有效减少了非关键节点的删除,同时利用节点放回机制进一步压缩了非关键节点的删除数量。实验结果表明,本文方法能够更加准确地选取网络分解中的关键节点,删除较少的关键节点就能使网络充分分解,并且在不同结构的网络中表现稳定,适应性强。
  • 张舒,李慧,施珺,王成强
    陕西师范大学学报(自然科学版). 2020, 48(2): 84-91.
    PDF全文 ( ) 可视化 收藏
    为了提高推荐系统为用户推荐新产品的准确率,挖掘出每位顾客的隐藏喜好以及每个产品的性能十分关键。基于用户反馈技术经常被用于发现产品的潜在特性和用户维度,本文提出了一种将用户评分中的潜在因子和评论中的潜在主题相结合的推荐模型。该模型通过对评论文本进行分析从而实现更精确的评分预测,特别适用于对新产品和新用户的评分预测。通过在公开数据集上的验证实验,证明了该模型较传统推荐系统在性能上有显著提升。
  • 概率统计及其应用专题
  • 毛沥悦,陈夏
    陕西师范大学学报(自然科学版). 2020, 48(2): 92-98.
    PDF全文 ( ) 可视化 收藏
    研究了当非参数部分带有测量误差时, 部分线性模型的变量选择与参数估计问题。在自适应Lasso惩罚函数下, 证明了所构造的惩罚经验似然估计具有Oracle性质。同时, 考虑了参数的假设检验问题。最后利用数值模拟说明了所提方法的优良性质。
  • 杜霄霄,闫莉
    陕西师范大学学报(自然科学版). 2020, 48(2): 99-102.
    PDF全文 ( ) 可视化 收藏
    利用NQD随机变量序列的矩不等式和极大值不等式,讨论了NQD随机变量序列部分和的大偏差原理以及加权和的收敛性。
  • 刘慧,蒋辉
    陕西师范大学学报(自然科学版). 2020, 48(2): 103-109.
    PDF全文 ( ) 可视化 收藏
    在离散观测下,考虑平稳Ornstein-Uhlenbeck过程漂移项中未知参数估计量的渐近性质。利用多重Wiener-It积分的偏差性质与渐近分析的技巧,得到了估计量的Cramér-型中偏差。同时,对于一类假设检验问题,构造了适当的检验统计量以及拒绝域。利用本文结果,可以证明第二类错误以指数速度衰减到零, 最后数值模拟验证了理论的正确性。
  • 石美丽,夏志明
    陕西师范大学学报(自然科学版). 2020, 48(2): 110-116.
    PDF全文 ( ) 可视化 收藏
    研究张量线性回归模型中的参数估计与假设检验问题,先基于最小二乘法获得参数的点估计量,证明其相合性,并结合系数张量的CP(CANDECOMP/PARAFAC)分解结构给出该估计的近似算法——交替最小二乘法;其次建立了参数线性假设检验的拟似然比检验统计量,并证明其大样本性质。Monte Carlo模拟结果表明:交替最小二乘估计表现良好,且拟似然比检验统计量的经验分布与理论分布无显著差异,将该方法运用于文本数据分析中的英文字母计数问题,获得比较准确的预测结果。
  • 张海,王圣涵,郭骁
    陕西师范大学学报(自然科学版). 2020, 48(2): 117-124.
    PDF全文 ( ) 可视化 收藏
    基于复杂网络分析方法,开展雾霾污染结构特征学习。收集了中国363个城市2015—2018年每小时的PM2.5实时观测数据,分析了4年中各城市PM2.5变化,利用复杂网络图建模,研究了城市之间形成的雾霾污染网络的中心点和社区结构的变化。研究发现:经过雾霾治理,全国范围内雾霾有明显改善,北京及东北地区雾霾污染治理效果优于西北地区;雾霾污染网络具有中心点,中心点大多为污染严重的地区,主要分布于中西部地区,开展雾霾治理需要重点关注污染网络的中心点城市及其所在区域;雾霾污染网络存在社区结构,社区结构与地理位置高度一致,不同社区结构之间雾霾污染的成因及特征有一定的差异,开展雾霾治理不仅要考虑不同社区的差异,而且同一个社区内部要相互配合,协作治理,才能取得更好的雾霾治理效果。