Welcome to visit Journal of Shaanxi Normal University(Natural Science Edition)!

A review of multi-view based imaging techniques and image enhancement method

  • LI Anhu , * ,
  • JIN Jialiang ,
  • LIU Yelin ,
  • MA Junlin
Expand
  • School of Mechanical Engineering, Tongji University, Shanghai 201804, China

Received date: 2024-08-27

  Online published: 2025-07-21

Abstract

Multi-view imaging technology obtains rich scene information by capturing images from different angles, which can provide key visual data for fields such as autonomous driving, intelligent manufacturing and robot navigation. This paper first summarizes the components of common multi-view imaging systems, their working principles and implementation methods, and provides an in-depth analysis of the significant advantages of different multi-view imaging systems and their limitations from the key dimensions of dynamic imaging adaptability, imaging accuracy, cost-effectiveness, and comprehensive system performance. Then for the visual image enhancement technology, the application and effect in improving the quality of multi-view imaging are discussed by combining traditional image processing methods and deep learning techniques. Finally, the current status and future trends of the development of multi-view imaging technology are considered, and forward-looking predictions are made in the development directions of hardware innovation, algorithm optimisation and multi-modal data fusion.

Cite this article

LI Anhu , JIN Jialiang , LIU Yelin , MA Junlin . A review of multi-view based imaging techniques and image enhancement method[J]. Journal of Shaanxi Normal University(Natural Science Edition), 2025 , 53(4) : 1 -23 . DOI: 10.15983/j.cnki.jsnu.2025300

自多视图几何理论提出以来,多视角成像与图像增强技术已广泛应用于智能制造[1]、机器人导航[2]、自动驾驶[3]和安全监控[4]等领域。在极端环境任务中,如水下搜救、深腔作业、军事对抗等,对成像增强技术的准确性、可靠性和灵活性提出了更高要求[5]。在无人驾驶与自主导航任务中,复杂未知的环境进一步提升了对视觉系统环境感知能力的需求,要求系统能够实现精准的环境预测和高效的避障操作,以支持复杂任务的执行和自主导航的安全性[6]。此外,在高精度工业检测、医疗影像分析等领域,多视角成像技术同样面临着在多变条件下获取可靠信息的挑战[7],因此,复杂环境下精准感知与检测对智能视觉成像系统提出了很高的技术要求。
传统的单视角成像技术在面对遮挡、光照变化以及动态场景等复杂因素时,往往难以提供全面、可靠的信息[8]。而多视角成像技术通过从多个角度获取图像数据,提供了丰富的三维空间和纹理信息,显著增强了系统在复杂环境中的适应能力,成为解决这些问题的重要途径[9]。该技术可以分为传统多视角成像和虚拟多视角成像2类,前者依赖于多相机系统或运动载体,适用于广泛的应用场景;后者则通过光学元件的设计,构造出多个虚拟相机阵列,实现单相机的多视角成像,具有成像精度高、成本低等优点。随着图像应用需求的复杂化,基于多视角的图像增强技术包括传统的多视角图像增强方法与基于深度学习的图像增强方法,这些方法利用多视角成像系统捕获的图像数据,不仅能够显著提升图像的质量,增强细节的可见度,还能在多种环境条件下提供更为可靠的视觉支持。
然而多视角成像与图像增强技术在实际应用中仍面临诸多挑战。例如传统的成像设备通常由复杂且笨重的光学系统和低效的数据处理模块组成,限制了其在高性能和小型化方面的应用潜力[10]。同时,数据处理与融合的复杂性、算法的实时性要求,以及对系统成本的严格控制等都是当前技术发展中的瓶颈[11]。因此,对多视角成像与图像增强的硬件和算法进行优化,提升其在复杂环境下的应用效果,已成为当前研究的热点。本文综述了基于多视角的成像与图像增强方法的最新进展,分析了不同成像系统的性能特点与图像增强技术的具体方法,并展望这些技术未来的发展方向。通过全面的分析和讨论,旨在为研究人员和工程师提供有价值的参考,以推动多视角成像技术在智能制造、精密测量、机器人探索等领域的广泛应用与深入发展。

1 传统多视角成像技术

依据成像原理的不同,传统的多视角成像系统可以分为2类:一类是基于多个固定或协同工作的相机构建的多视角成像系统,另一类是利用运动载体进行动态多视角成像的系统。

1.1 基于多相机的多视角成像系统

基于多相机的多视角成像系统采用多个相机从不同角度捕获目标的成像系统,可以在长距离、宽视场、大范围以及光照不佳等条件下实现对场景的良好感知。相比于单目成像系统,多目相机成像可以捕获信息在空域、时域、频谱等维度的丰富特征,以此实现更高质量图像的重建[12]
多相机阵列系统获取的多视角图像,通过图像匹配与拼接,可以实现大视场高清成像。Wilburn等[13]使用100台定制相机设计了相机阵列成像系统,系统中每个子相机平行排列,子相机获取的原始图像数据,通过其内置的计算单元进行压缩处理后,被传输至主控设备,以此降低数据传输的负担。利用图像拼接技术对图像进行精确的配准和融合,最终生成具有千万级像素的广阔视角高清图像,如图1所示。
图1 多相机阵列[13]

a为多相机阵列系统实物图;b为多视角图像融合拼接后的高清图像;c为多视角图像融合拼接后的局部放大图。

注:网络版为彩图。

Fig.1 Multi-camera array[13]

多相机阵列成像系统需要精密的光学与机械设计,同时面临着同步问题与视差校正的挑战。Brady等[14]在传统阵列相机的基础上,提出了多尺度设计的概念,实现了阵列相机多视角成像系统的小型化。为解决多尺度阵列相机标定时间长、布置设计复杂的问题,Yuan等[15]开发了一种非结构化阵列相机系统,该系统采用分层模块化设计,多尺度混合相机组成不同的模块,可以自适应地分配图像资源,从而大幅降低硬件成本,并具有高度的灵活性、鲁棒性和多功能性,能够进行大视场高清图像的拼接,如图2a图2b所示。此外,阵列相机多视角成像系统的三维视场有限,无法捕获大尺度场景的光场信息。为此,Wang等[16]设计了多相机成像系统,将多个视场逐渐变化的相机组合在一起,通过计算多视角图像中三维空间点的深度,根据深度信息可以生成大视场的全景图像,如图2c所示。
图2 非结构化阵列相机

a为非结构化阵列相机系统实物及成像原理;b为拼接后的大视场高清图像;c为大视场全景三维图像。

注:图片修改自文献[15-16],网络版为彩图。

Fig.2 Unstructured array camera

除了大视场高清成像,多相机成像系统与其他技术结合还能够实现特定的成像功能。Wang等[17]开发的混合光场成像系统,将光场相机与传统相机结合,利用流估计与外观估计的方法,实现了光场视频的重新聚焦与视差图生成。由于移动物体的运动信息可能不准确,多视角图像配准可能会产生鬼影。为解决此问题,Lee等[18]设计了一种高低分辨率混合成像系统,可以同时生成低分辨率视频序列和高分辨率静态图像,并结合基于空间分布多尺度表示(spatially-distributed multi-scale represent-ratio,SD-MSR) 的色调映射算法,实现对多视角图像的细节增强,如图3所示。
图3 高低分辨率混合成像系统

注:图片修改自文献[18],网络版为彩图。

Fig.3 Hybrid high and low resolution imaging system

基于多相机的多视角成像系统整合多个相机的视角信息,能够提供传统单目系统难以企及的性能。系统的小型化和高性能化需求正在推动多相机阵列从传统的精密光学和机械设计,向更加灵活和适应性强的方向发展。进一步结合深度学习和人工智能技术,以提升图像配准、视差校正和数据处理的效率和精度,从而实现更为智能化的感知与决策能力。

1.2 基于运动载体的多视角成像系统

基于运动载体的多视角成像系统是利用机械系统驱动成像元件按照预设轨迹和姿态运动,并通过多次曝光捕获不同视角目标图像的相机与机械装置相结合的系统。相比传统的双目或多目成像系统,基于运动载体的多视角成像系统成像范围广、图像采集密集,能够实现图像配准[19]、图像融合[20]、超分辨率重建[21]等图像增强技术,由于受到机械装置的限制,系统存在转动惯量大和振动问题,主要适用于动态场景。常用的多视角成像系统按运动载体的不同可分为无人机、机械臂、云台3种类型。
基于无人机的多视角成像系统是指利用无线遥控装置或机载程序操控的非载人飞行器搭载成像系统的摇杆设备,相比于其他多视角成像系统具有灵活性好、成像范围广、成本低等优势,但容易受到环境的影响,常用于环境监测、地理测绘、军事对抗等领域[22]。系统搭载不同的成像设备,能够完成不同的多视角成像任务。可搭载红外成像系统,可以实现低成本、高空间、高光谱的多视角图像数据采集方案,能够精准分析农业气象条件、作物表型等参数的空间变异性和相互关系[23-24],如图4a所示。通过搭载红外与可见光图像传感器,无人机可在一次飞行中采集同一场景的可见光与红外图像,通过将低分辨率、缺乏纹理信息的红外图像与可见光图像叠加,形成一幅具有纹理的红外图像,利于后续巡检、救灾等任务[25]。配合激光指示器与激光跟踪器等设备,无人机多视角成像系统还可以实现自动对准、目标精确定位和惯性跟踪等功能[26],如图4b所示。
图4 无人机多视角成像系统[24,26]

注:网络版为彩图。

Fig.4 UAV multi-view imaging system[24,26]

基于机械臂的多视角成像系统,又称为随动成像单元眼在手系统,成像单元安装在机器人手臂末端,通过改变成像单元的位姿实现多视角成像,所采集的图像具有较高的空间分辨率,再结合相关技术能够实现图像增强任务,具有位置灵活、稳定性好等优势,适用于室内环境多视角成像[27-28]。手眼标定是基于机械臂的多视角成像系统中的一个关键步骤,其目的是确定成像单元与机械臂末端之间的相对位置和姿态,从而实现精准的多视角成像[29]。Zhan等[30]在线识别了手眼动态参数,所识别的参数被用于机械臂多视角成像系统,获得了良好的定位性能。Pachtrachai等[31]将识别出的手眼同构变换矩阵用于机械臂辅助微创手术的多视角成像与控制系统,提高了成像精度与控制性能。Wang等[32]使用对偶方程确定世界坐标与手眼变换方程,将其应用在单目多视角成像系统中,如图5a所示。Chen等[33]利用手眼矩阵的优化模型,设计了位置误差更低的双目机械臂多视角成像系统,如图5b所示。
图5 基于机械臂的多视角成像系统

注:图片修改自文献[32-33],网络版为彩图。

Fig.5 Multi-view imaging system based on a robotic arm

此外,基于机械臂的多视角成像系统也常被应用于目标光场的采集,通过四维光场理论,将多视图像转换为光场图像,在频域中实现图像的超分辨率重建[34]。Levoy等[35]提出光场渲染理论,将相机安装在可精确运动的龙门架机械臂上,由单个相机完成对目标场景的四维光场采集,如图6a所示。此外,机械臂多视角成像系统通过多个运动相机阵列旋转,可以记录外向环境全景光场[36],如图6b所示。Unger等[37]构建平面型时序相机阵列,通过将相机安装在电动导轨上,实现视角在XY方向的平移运动,来采集光场,如图6c所示。
图6 光场相机多视角成像系统

注:图片修改自文献[35-37],网络版为彩图。

Fig.6 Multi-view imaging system with light field camera

基于云台的多视角成像系统是指将伺服云台与成像元件相结合的成像系统,能够实现短时间360°大范围的图像采集,相较于其他多视角成像系统具有成像速度快等优势,但视场范围相较固定[38]。Murray等[39]最初研制的双目多视角成像云台,采用直流伺服电机和谐波齿轮减速箱,具有较好的回转精度,能够实现对目标的简易跟踪。Nebeluk等[40]提出一种基于云台相机的多视角成像伺服机器人,通过模型预测控制能够保持跟踪目标始终在图像的中间位置。Cao等[41]采用粒子滤波的伺服策略,设计了一种云台多视角成像系统,具有较好的成像性能与跟踪鲁棒性,如图7所示。Guo等[42]研制的一种微型机载云台视觉伺服装置,在运动状态下能够保持相机光轴的稳定,获取清晰的图像并对目标进行检测和跟踪。侯凡等[43]提出一种适用于排水管道的机器人云台成像系统,能够在狭窄的管道环境中实现相机360°转动拍摄目标,具有较好的精度和可靠性。
图7 基于云台的多视角成像系统及其跟踪图像

注:图片修改自文献[41],网络版为彩图。

Fig.7 Multi-view imaging system based on pan-tilt-zoom camera and its tracking image

基于运动载体的多视角成像系统通过机械驱动的方式,显著扩展了成像的灵活性和应用范围,能够在复杂和动态的场景中实现高精度的图像采集和处理。不同载体各具特色,在灵活性、空间分辨率和快速全景采集等方面展现了独特的优势。通过技术整合,能实现图像配准、超分辨率重建等高级图像处理功能,为各领域的智能化和自动化发展提供强有力的技术支撑。

1.3 性能对比分析

表1列出了传统多视角成像系统的成像原理、附加元件类型、动态成像可行性、成像精度、系统成本及主要性能特点。传统的多视角成像系统,系统成本普遍偏高且成像精度低。多相机成像系统的成像原理简单、设计方便,但系统标定复杂;基于运动载体的多视角成像系统灵活性好、成像范围更广,可适用于不同的应用领域。
表1 传统多视角成像系统性能分析对比

Tab.1 Performance analysis comparison of conventional multi-view imaging systems

附加组
件类型
动态成像
可行性
成像
精度
系统
成本
优越性 局限性
多相机 成像原理简单、距离远、视野宽 系统标定复杂、成像处理时间长
无人机 灵活性好、成像范围广 仅适用于高空成像、对天气有要求
机械臂 成像角度灵活、位置调整能力好 运动控制复杂、维护成本高
转台 视角覆盖均匀、适用于全景成像 成像视野固定

2 虚拟多视角成像技术

虚拟多视角成像技术是在相机前布置一定的光学元件,利用光学元件的排列与设计,改变视轴光束的指向,实现单个相机在固定位置情况下,进行多个视角的信息采集,相当于通过多个虚拟相机捕获目标。根据光学元件的不同,虚拟多视角成像系统包括基于镜面反射的虚拟多视角成像系统、基于光栅衍射的虚拟多视角成像系和基于棱镜折射的虚拟多视角成像系统[44]

2.1 基于镜面反射的虚拟多视角成像系统

基于镜面反射的虚拟多视角成像系统,与其他的成像系统相比,成像原理简单,结构形式灵活,它可以仅通过单个相机和一组反射镜就能实现多视角成像,需要根据具体应用需求设置不同的镜面排布方式。根据反射镜的结构特点,镜面反射又可以分为平面反射镜和曲面反射镜2类[45]
相机可以与平面反射镜结合实现多视角成像,在动态场景、参数结算、三维测量、误差矫正等方面具有相对优势。Yin等[46]设计了平面镜虚拟多视角成像系统,可以同时从3个不同的视角捕捉被测物体的变形图像,系统包括1个真实相机和2个由平面镜实现的虚拟相机,并通过校准和相位补偿技术实现非接触、高精度的动态场景多视角成像。文献[47-48]报道了利用平面反射镜,对多相机进行自动校准,实现虚拟成像系统参数的高精度解算,如图8所示。此外,Pan等[49]设计了正交平面镜多视角成像系统,能够同时捕捉和重建反射镜形成的目标前后表面的虚拟表面,根据每个状态下的表面形状,可以测量两个表面和厚度方向的三维变形。Gluckman等[50-51]借助4块平面反射镜搭建虚拟多视角成像系统,设定镜面的限制条件减少矫正误差,将成像的外极几何自由度从7个减少为6个,证明了用平面镜进行多视角成像替代传统多相机成像的可行性。
图8 基于平面镜反射的多相机校准系统

注:图片修改自文献[48],网络版为彩图。

Fig.8 Multi-camera calibration system based on planar mirror reflection

曲面反射镜配合相机能够实时高速全向成像,可以应用于自主导航、虚拟现实和远程监控等多个领域,其主要结构包括:椭圆面、双曲面、抛物面等[52]。椭圆镜面可以减少虚像,系统尺寸更小,新型成像系统由2个大小和椭圆度不同的椭圆镜组成,可以通过镜面扫描动态捕获多视点图像[53]。为克服部分区域被遮挡的问题,结合双曲面反射镜的全景相机可以安装在房间入口或墙壁等角落实现各个区域的多视角成像。此外,利用双曲面镜折射的几何特性,成像系统还可以估算横向移动目标的具体方位[54]。在抛物镜面多视角成像系统中,相机与成像目标分别设置在镜孔的两侧,通过求解点扩散函数位置变化的线性关系,能够重建出特定深度的清晰图像[55]。利用抛物面切平面与单个相机结合,可以实现虚拟相机阵列,引入单向镜来防止相机本身出现在图像上,以稳健、低成本的方式获取动态光场作为多视角图像[56],如图9所示。另外,通过抛物面镜、远心镜头和中性密度滤光镜的组合,可以实时捕捉大范围的场景辐射,以光学方式扩展机器人全景视觉可感知动态范围[57]
图9 抛物面虚拟相机阵列系统

A为抛物面虚拟相机阵列系统实物;B为成像原理;C为获得的多视角视频(10帧)。

注:图片修改自文献[56],网络版为彩图。

Fig.9 Parabolic virtual camera array system

2.2 基于光栅衍射的虚拟多视角成像系统

在基于光栅衍射的虚拟多视角成像系统中,被观察目标的多角度成像光线通过衍射光栅汇聚到相机。结合衍射成像模型,将各阶衍射图像进行匹配,能够重建被测目标的三维信息[58]。与基于棱镜阵列或相机阵列的成像系统相比,衍射光栅多视角成像系统具有无球差、少干扰、低成本等优点。
衍射光栅多视角成像系统结合空间滤波的方法能够对衍射图像阵列进行多深度提取,系统的深度分辨率维持恒定,与探测目标的深度无关[59],如图10A所示。通过单色光源照射测试样品,放置在相机前方的衍射光栅可产生样品表面的两个横向间隔的一阶衍射视图,2幅视图均被相机捕获,可用于测量物体表面的三维位移与应变[60]。光栅衍射成像存在噪声、伪像和模糊等问题,Jang等[61]利用衍射光栅成像系统提供的多组视差图像,通过对每组视差图像进行滤波与重叠,可以减少视差图像受到相干光源产生的斑点噪声,如图10B所示。针对伪像和模糊等问题,将多个个体的信号通过计算重建方法进行整合,可以减少光栅成像中的伪影和模糊[62]
图10 衍射光栅多视角成像系统

注:图片修改自文献[59,61],网络版为彩图。

Fig.10 Multi-view imaging system with diffraction grating

在由双光栅组成的多视角成像系统中,第一个光栅产生物体的多个衍射阶数,形成多个光谱图像。随后,第二个光栅将这些图像合并,形成无色散的图像,实现系统在白光照射下的正常工作[63]。结合多组透镜与可调节液晶衍射光栅的多视角成像系统,能够同时实现2种不同的全息图生成方法,分别实现图像的宽视角和大尺寸[64]。在基于光纤光栅的多视角成像系统中,当可见视野内出现目标时,经过光栅衍射的光斑受到干扰,通过计算相机图像上干扰光斑的位移,可以判断目标的大致形状和位置信息,能够用于移动机器人的动态导航[65]

2.3 基于棱镜折射的虚拟多视角成像系统

在基于棱镜折射的虚拟多视角成像系统中,入射光线透过棱镜发生折射被相机接收,产生与入射法线对称的虚拟成像视角。根据镜子的数目与状态,可以分为二分棱镜、棱镜阵列、微透镜阵列和旋转棱镜。
Lee等[66]首先使用二分棱镜进行多视角成像,提出虚拟点的概念,利用光学原理推导出2台以真实相机为轴的对称虚拟相机,如图11a所示。单个相机与二分棱镜结合能够在单次拍摄中获取同一目标的不同视图,基于几何分析,可以建立棱镜参数与系统FOV之间的关系式[67],如图11b所示。利用无模型图像畸变校正方法可以纠正双棱镜折射造成的图像失真,简化图像对的匹配,使高精度三维形变测量成为可能[68]。使用2个二分棱镜和单个相机能够克服传统双目相机规格与同步机制上的差异,利用同轴照明可以对狭窄区域进行测量[69]。基于双二分棱镜的虚拟双目成像系统分析棱镜折射和目标表面反射光的路径,通过多频外差法和立体匹配、双目标定能够得到被测目标的深度信息并重建点云[70],如图11c所示。
图11 二分棱镜虚拟成像系统

注:图片修改自文献[66-67,70],网络版为彩图。

Fig.11 Virtual imaging system of bisection prism

棱镜阵列可以降低批量生产成本,提高成像系统的轻便性和便携性,兼具通用相机和视频相机优点[71]。使用金字塔棱镜阵列代替单一棱镜,可同步捕获4个视角的图像,通过在每个棱镜之间的平面间隙进行黑化处理来消除不需要的图像[72-73]。为获取多视角图像的同时提高成像效果,在方阵内伪随机布置,将准直光折射到目标区域,能够提高信噪比,成像模式可以根据探测器的大小和位置而变化[74]。Nero等[75]结合棱镜阵列和衍射图像转向技术设计的多视角成像系统,在保证高分辨率的同时,获得与水平维度同步生成更宽的视场。
微透镜阵列由多个透镜组成,能够捕获包括视差和连续视点的三维场景信息,广泛应用于多视角光场信息的采集,具有大视场、低像差及无限大的景深等特点。Stevens等[76]利用微透镜阵列设计了基于整体摄影的多视角三维成像系统。Lumsdaine等[77]通过增加微透镜阵列与光敏传感器之间的距离,并在空间和角度之间进行均衡,设计了便携小型化的聚焦性光场成像系统,同时提出一种光场图像增强算法,提高了成像系统的最终分辨率。Cha等[78]将微透镜阵列应用于高动态范围成像,设计了一种可变孔径多视角成像系统,该系统由可变光圈、微透镜阵列、间隙垫片和CMOS图像传感器组成,能够在单次曝光下捕捉不同光圈的低动态范围图像,并通过重建算法实现超越初始图像的扩展动态范围,以及无运动伪影的高分辨率。此外,微透镜阵列还可以应用于仿生复眼领域,Bae等[79]利用光刻胶热回流技术,制得200 μm级多焦点微透镜阵列,并实现了在单个图像传感器上生成多焦点图像,扩展了复眼相机的景深范围。
旋转棱镜又称Risley棱镜,能够动态调整相机视轴,在指向精度、扫描范围及环境适应性方面具有明显优势。本课题组在基于Risley棱镜的多视角成像技术方面进行了一系列的研究,结合Risley棱镜的成像原理与系统特点,首先提出了基于动态虚拟相机的三维计算成像架构,通过旋转棱镜来调整相机孔径,从不同的视角捕捉物体,简化了立体矩阵和轮廓重建的计算过程[80]。在大视场三维成像方面,将相机与双棱镜同轴安装,通过旋转Risley棱镜,产生虚拟阵列相机,以实现虚拟相机场构建能够从不同角度捕捉多帧图像,产生的点云数据可用于三维重建等领域[81],如图12所示。此外,本课题组提出了基于Risley棱镜的成像反馈快速定位目标跟踪方法[82]、基于Risley棱镜的空间自适应多视角三维成像方法[83]等。通过这些研究与应用的拓展,Risley棱镜在多视角成像技术领域的潜力得到了进一步的挖掘和实现,能够为相关领域的技术进步和创新提供坚实的基础。
图12 旋转棱镜虚拟多视角成像系统

注:图片修改自文献[81],网络版为彩图。

Fig.12 Rotating prism virtual multi-view imaging system

综上,虚拟多视角成像技术通过前置光学元件,实现单个相机在固定位置情况下的多视角信息采集。基于镜面反射的虚拟多视角系统能够实现高精度的动态场景捕捉和三维测量。光栅衍射技术的引入使得虚拟多视角成像系统能够在深度提取和视差图像处理方面展现出更好的性能,尤其是在低成本、无球差和少干扰的成像需求下,表现尤为突出。而基于棱镜折射的系统则进一步提升了系统的视角范围和成像精度。相比传统多相机系统,这些方法有效简化了系统设计,还能显著降低硬件成本,提升系统的灵活性和便携性。

2.4 性能分析对比

表2所示,相比于传统的多视角成像系统,虚拟多视角成像系统成本更低,成像精度高,同时兼顾更广的成像范围,但光学元件的布置设计与系统标定较为复杂。值得注意的是,虚拟多视角成像技术与传统的成像系统结合,可以兼顾两者优点,能够为成像系统的功能集成化提供重要的发展方向。
表2 虚拟多视角成像系统性能分析对比

Tab.2 Performance analysis and comparison of virtual multi-view imaging systems

附加组
件类型
动态成像
可行性
成像
精度
系统
成本
优越性 局限性
平面镜 成像原理简单、结构灵活 成像质量有限
曲面镜 聚焦光线、视野开阔 镜面形状精度要求高
衍射光栅 适用多光谱图像采集 光照要求高、成像时间成本高
二分棱镜 系统轻巧便携 成像质量低、视野受限
棱镜阵列 设计灵活、可以控制多路光束 设计和制造难度增加
微透镜阵列 大视场、低像差、大景深 光线损失、深度感知受限
旋转棱镜 系统集成、扫描范围广、环境适应性强 系统校准困难、成像原理复杂

3 多视角图像增强方法

多视角图像增强方法通过结合多个视角下的图像信息,可以更全面地捕捉场景的光照和结构特征。在低光照环境下,相机捕获的图像往往因曝光不足而呈现出较低的画质,导致图像整体显得昏暗,从而显著降低了视觉体验。这种现象在图像的暗部区域尤为明显,细节丢失严重,对比度降低,色彩还原度差,导致在自动驾驶、监控系统等领域的应用受到严重影响。传统的图像增强技术通过对单张图像进行统一的亮度和对比度调整[84]。然而,这种方法存在的问题是它可能会对图像中已经曝光过度的区域造成进一步的增强,从而导致这些区域的细节进一步丢失,甚至出现高光溢出,影响图像的整体质量。根据增强方法的原理,利用多视角进行图像增强方法可以分为传统多视角图像增强方法和基于人工智能算法的多视角图像增强方法。

3.1 传统多视角图像增强方法

将多视角成像系统获取的图像组进行融合,利用不同视角图像中的互补信息,实现对图像细节、对比度以及分辨率的显著增强,不仅能提高图像的视觉效果,还能提升其信息量,为后续的分析与应用提供更可靠的图像数据支持。
作为多视角图像融合增强的基础,图像配准是将在不同时间点内捕获的多视角图像在空间上进行对齐和匹配的过程,广泛应用于医学诊断、遥感检测等领域[85]。这个过程不会直接增强图像的视觉效果,但能够为后续的多视角图像分析或融合提供准确的空间对应关系,主要可以分为基于灰度信息的方法、基于变换域的方法及基于特征的方法[86]。Wells等[87]最初基于灰度信息的方法,通过调整图像像素的相对位置和方向,使配准图像间的互信息最大化。Li等[88]结合正余弦机制与混沌映射策略,提出了一种从粗到精的灰度信息分层配准方法,具有较好的鲁棒性,如图13所示。这种方法实现简单,可用于各种多视角成像设备,但缺乏利用空间信息,容易陷入局部极值而导致误配。Kuglin等[89]提出了相位相关法,通过变换域结合互补功率计算待配准图像间的平移量,提升了一定的配准精度,但这种方法仅适用于有平移关系的图像,配准速度慢,使用范围有限。Ordonez等[90]基于特征的方法,利用加速鲁棒特征(speeded-up robust features,SURF)算子通过选择图像的特定波段,并调整关键点描述符和匹配阶段,以充分利用图像的光谱信息,提高了配准的有效性。基于特征的方法计算效率高、鲁棒性好,但特征提取的过程相对复杂,针对参数复杂的模型时,配准效果较差[91]
图13 基于正余弦机制与混沌映射图像配准方法

注:图片修改自文献[88]。

Fig.13 Rotating prism virtual multi-view imaging imaging system

多视角图像融合是在配准后的图像基础上,将来自不同视角或传感器的图像信息进行综合处理,以生成一幅更具信息量、更高质量的图像。通过多视角信息的融合,图像能够包括不同图像所包含的时空信息,从而提高图像的质量和信息量,比如提高分辨率、增强对比度、扩展动态范围等,能够满足复杂应用的需求。
通过传统的多视角图像融合技术实现图像增强始于2011年,Rajpoot等[92]引入多视角图像融合的概念,通过对比单视角图像和多视角融合图像的质量和信息量,发现多视角融合图像在解决视野限制和提升图像质量与信息量方面具有显著优势。在此研究基础上,Rubio-Guivernau等[93]提出了应用于多视角图像领域的小波融合算法,将各视角图像的互补矢量信息进行合成,实现融合图像的细节改善和对比度增强,如图14所示。Zhang等[94]针对单视角图像可获取信息的局限性,提出了一种多视角图像非相干叠加融合的算法,完成了识别目标的轮廓连续表示。Zhang等[95]提出一种多视角声呐图像融合方法,将不同噪声、强度、形状的多视角图像通过小波变换和方向滤波器进行融合,增加了冗余信息,实现了多分辨率描述和细节的增强。Richter等[96]设计了一套多视角图像融合成像系统,通过算法对不同偏振序列的图像进行融合,实现了高质量多通道叠加成像。Xue等[97]提出了一种面向群体感知的融合算法,其按照不同视角图像的外观进行融合权重的分配,通过一个优化目标函数进行判别,实现输出融合图像的最优化。
图14 多视角图像小波融合算法

注:图片修改自文献[93],网络版为彩图。

Fig.14 Multi-view image wavelet fusion algorithm

将多视角图像进行融合并结合其他计算方法还能够实现特殊目的的图像增强。如在图像超分辨率增强方面,Fan等[98]利用相机阵列获得的多视角图像,基于综合能量函数优化方法,计算所需高分辨图像的深度图,联合图像融合与去模糊方法,实现了图像组的超分辨率重建,如图15所示。在低照度环境中,Feng等[99]使用拉普拉斯多尺度融合方法将曝光度不同的多视角图像结合起来,进行伽马校正和反转,伽马校正后的图像用于低照度图像中曝光不足区域的光照调整,而反转图像则用于调整曝光过渡区,实现了对弱光影响的有效消除,提高了图像质量。
图15 基于相机阵列的超分辨重建系统

注:图片修改自文献[98],网络版为彩图。

Fig.15 Superresolution reconstruction system based on camera array

相较于视角与目标位置固定的静态场景,物体或相机处于运动状态时,同一视角下的相机坐标系并不一致,利用多视角图像增强技术进行融合时,会存在鬼影等问题。Pece等[100]通过简单的二进制运算,在包围式曝光序列中检测移动像素群,能够在不引入伪影的情况下处理动态场景,但这种方法受像素亮度和纹理影响较大,适用范围有限。Liu等[101]提出了一种基于密集尺度不变特征变换的多视角多曝光图像融合方法,利用尺度不变特征变换(scale invariant feature transform,SIFT)算子从源图像中提取局部细节,并去除动态场景下的鬼影,然而这种方法使得非参考图像的所有像素均被识别为运动像素,而不是只有运动物体的部分区域,未实现融合的最优效果。Xue等[102]引入立体视觉技术,对动态多视角图像进行特征匹配,并结合随机漫步框架对未知亮度的像素点进行融合,实验结果表明,这种方法适用性更强、准确性更高。
综上,传统多视角图像增强方法主要依赖特征算子、小波变换等方法实现多视点图像的配准与融合,通过充分整合和利用不同视角间的互补信息,从而显著增强图像的质量和信息量。尽管在特定应用场景中传统方法已经相当成熟,但面对多样化和复杂成像需求,其仍具有明显的局限性,包括:计算效率低、适应性差以及易陷入局部极值等问题。正是这些不足之处,为深度学习算法在多视角图像增强领域的应用提供了机遇。

3.2 基于深度学习算法的多视角图像增强方法

近年来,随着深度学习技术的快速发展,多视角图像增强方法也得到了显著的进步。这些方法利用深度学习模型的强大特征提取能力,对多个视角的图像进行多维度分析和处理,以增强图像质量。
在多视角图像配准方面,Wu等[103]率先将深度学习技术应用于医学图像配准,构建了一个堆叠的双层卷积网络,寻求多视角图像的分层表示,并取得了很好的配准结果,表明能够利用深度学习使用图像数据的自适应特征来改进图像配准。不同成像模式下的组织外观差异很大,传统的配准方法难以正确的选择相似性度量,Simonovsky等[104]提出了一种基于卷积神经网络的度量方法,只需要几对对齐的多视角图像就能实现主体的可变性配准。然而,上述方法用于配准的卷积神经网络的训练都是在预先定义的配准示例的监督下进行的,获取配准示例存在挑战。针对这一问题,文献[105]提出了用于无监督仿射和可变性图像配准的深度学习框架,避免了对预定义配准示例的需求,提高了网络训练的便利性。Kori等[106]将预训练技术引入到图像配准中,预训练的深度神经网络能够实现对图像关键点的自动估计,具有很强的鲁棒性。除了上述的卷积神经网络,不少学者对生成对抗网络(generative adversarial network,GAN)、Transformer等新模型在多视角图像配准领域的应用展开探索。Xu等[107]提出了一种具有严格约束条件的GAN模型,能够自动学习多视角图像的最佳配准方法。Wang等[108]在可变形多视角图像配准问题中引入了注意力机制,并使用Transformer模型来学习变形场,在解决图像配准任务的稳定性和高效性问题方面显示出了良好的效果。
将深度学习技术应用于多视角图像融合领域,能够提供通用高效的融合网络框架,这种融合不仅提升了图像的视觉质量,还增强了图像在各种场景下的应用潜力。Liu等[109]使用卷积神经网络,克服了传统融合算法不能同时兼顾多视角融合与多模态融合的问题,展示了神经网络在多视角图像融合问题上的潜力。然而在处理大规模和高维图像数据时,融合网络的计算复杂性较高,实用性降低,针对此问题,Luo等[110]利用形态分解,提出了注意力特征集成的多视角图像融合网络,提高了复杂环境中多视角图像融合的效率和有效性,如图16所示。面对多视角图像标签缺乏的问题,Jung等[111]提出了一种用于图像融合的无监督学习框架,可以在不参考实际标签的情况下,通过训练单一的前向网络生成保留源图像细节的融合图像,适用于各种图像融合问题,包括多视角、多曝光图像融合。Xu等[112]提出的无监督端到端图像融合网络,利用特征提取和信息测量,可以自动估计相应源图像的重要性,以解决不同的图像融合任务。上述多视角图像融合的结果可以与经典的图像增强技术相结合,进一步提升图像质量,实现更为高效的图像增强效果。
图16 基于深度学习的多视角图像融合

注:图片修改自文献[110],网络版为彩图。

Fig.16 Multi-view image fusion based on deep learning

深度学习技术的核心优势是其端到端学习的能力,可以针对特定应用场景设计定制化的网络架构和训练策略。利用这种灵活性,可以开发出能够直接从输入图像生成增强效果的端到端多视角图像增强解决方案,不仅能提高处理效率,而且能够根据具体需求优化图像质量,实现更加精细的图像增强效果。在超分辨率重建方面,Xiao等[113]提出了一种名为CutMIB的多视角图像增强网络框架,通过在同一位置切割每个视图中的低分辨率补丁,CutMIB网络将所有低分辨率补丁混合生成混合补丁,再将混合补丁粘贴到高分辨率视图的相应区域。这就实现了让超分辨网络在训练阶段学习到隐含的几何信息,提高了超分辨网络的性能,同时保持其结构不变,在实际应用中还能够有效去噪。在低照度可视增强方面,Wang等[114]利用深度学习技术,提出了一种高效的低照度图像增强网络框架,在单个网络中使用多头执行中间任务,包括去噪、亮度调整、细化和细节增强,实现从小比例到全比例的渐进式低照度可视增强,如图17所示。然而,上述方法的网络模型较大,向前推理速度缓慢,且未充分利用多幅图像间的视角差异与信息交互。Ji等[115]提出了一种新型的多尺度图像交互网络,将图像的特征按不同尺度进行融合,实现了以更低的计算成本、更快的速度完成多视角图像间的信息交换,对弱光环境下的图像进行了改善与增强。
图17 渐进式低照度图像增强网络框架

注:图片修改自文献[114],网络版为彩图。

Fig.17 Framework for progressive low-light image enhancement networks

此外,深度学习技术为动态场景下的多视角图像增强与融合技术提供了更加高效的架构,能够有效克服鬼影等问题。Peng等[116]利用基于深度卷积网络的光流方法将动态场景下的多视角图像序列进行对齐,并设计了名为MergeNet网络用于融合对齐后的图像组。这种结合光流方法与深度学习算法的融合方法在动态场景下去除鬼影的效果优于传统方法。然而,利用光流法进行图像对齐存在鲁棒性有限的问题,Yan等[117]提出了双注意力引导的端到端深度神经网络(DAHDR-Net),该网络由空间注意力和特征通道注意力2个子网络组成,空间注意力模块会自动抑制由错位和饱和度引起的非必要成分,并增强非参考图像中的精细度,而通道注意模块通过考虑通道之间的相互依赖关系,自适应地调整通道特征的大小。这种端到端的注意力网络机制,不仅能生成高质量的无鬼影融合图像,在鲁棒性方面也超越了传统方法。
综上所述,随着多视角图像增强技术不断进步,尤其是深度学习技术的发展,增强算法将能够更加精准地识别和融合多视角图像中的复杂特征。然而,深度学习技术在图像增强应用中仍存在着很多挑战,如对大量标注数据的依赖、计算资源的高消耗、模型的黑箱决策过程以及模型的复杂性。未来的研究将可能集中在如何根据不同应用场景定制化融合策略,提升深度学习模型的实用性和可靠性,以最大化发挥人工智能算法在多视角图像配准、融合与增强领域的优势。

3.3 多视角成像与图像增强技术的应用

多视角成像与图像增强技术广泛应用于自动驾驶、智能制造、机器人导航等领域。例如:在自动驾驶领域,Hazarika等[118]设计了一种多相机成像系统,用于捕获车辆周围目标的图像。该系统通过汇总来自不同视角的图像信息,预测车辆的三维属性,并结合视觉Transformer模型进行图像增强与融合,有效克服了传统方法在处理遮挡区域时深度图估算不准确的问题。这一方法不仅提升了自动驾驶系统对周围环境的感知能力,还增强了其在复杂场景下的适应性。此外,Liu等[119]通过部署多个鱼眼相机,收集车辆周围的环视信息,同时结合红外热成像仪和毫米波雷达等其他成像技术,获取夜间或低照度条件下的前视信息。之后,利用环视图像融合算法和前视图像融合算法,对采集的图像信息进行增强处理,最终结合深度学习智能检测算法,提供精确的检测结果。这些技术的整合,为自动驾驶车辆的视频监控系统提供了更强的环境监控能力,并在极端条件下保证了系统性能的稳定性。
在智能制造领域,多视角成像与图像增强技术多用于生产过程中的产品质量检测。如Chen等[120]设计的BubCam智能协作成像系统用于对工厂生产的油墨袋进行自动检测,能够估算油墨袋中可能影响印刷质量的气泡体积。该系统部署了多个无线相机,通过多视角传感实现更高的精度。为了节省无线相机的功耗,针对配置适应问题,开发了一种基于强化学习的解决方案,根据气泡存在和光反射的变化调整每个无线摄像头的运行模式和帧率。最后,利用深度学习技术,对获取的多视角图像进行了深度融合与图像分割,在实验室测试平台和实际工厂试验中进行了评估,结果表明,BubCam智能协作成像系统与人工检测方法相比,BubCam的准确性提高了1.34倍,延迟时间大大缩短,其系统设计如图18所示。吴玉生等[121]深入探讨了多视角成像与图像增强技术在烟草在线检测视觉系统的具体应用,包括烟丝异物检测、烟支缺陷检测和烟盒外观检测3种检测过程,每种检测过程针对其特点与问题,涵盖不同的视觉成像设备与图像检测算法,并详细阐述了深度学习模型在提高检测准确性和效率方面的应用价值,指出了这一技术在烟草工业检测中的发展潜力。
图18 BubCam智能协作成像系统

注:图片修改自文献[120],网络版为彩图。

Fig.18 BubCam intelligent collaborative imaging system

在自主导航领域,Zhang等[122]开发了一种基于多视角成像的手术导航系统,并与手术机器人进行了联合标定。该系统采用增强现实技术,通过多视角成像显著提升手术机器人的导航精度,比传统单视点系统提高35%。这种多视角成像与增强现实技术相结合,能够为医生提供更全面的手术区域视图,增强手术的准确性和安全性。此外,江洁等[123]基于四平面镜的虚拟多视角成像技术,开发了一种复合多视场光学敏感器,通过四平面镜能够同时观测多个目标的位置关系,为导航量测信息的获取提供更为有效的途径。
本课题组在多视角成像与图像增强技术领域的研究成果不仅推动了成像技术的发展,也为机器人视觉等多个行业提供了创新的解决方案。我们采用虚拟多视角成像技术,通过旋转棱镜调整相机视轴,实现对大范围场景的分区成像。在此基础上,设计了图像预定位拼接算法,通过预先定位的重叠子区域,有效降低了图像拼接过程中的计算量和时间消耗。这种成像方法不仅提高了图像的拼接效率,而且生成的全景图像具有大视场和高分辨率的特点,拼接效率的提升幅度为21.89%~39.38%,对于军事侦察、遥感监测和红外搜索等需要兼顾场景搜索与目标辨识的应用场景具有重要的实用价值[124]
在图像中目标信息的提取方面,利用旋转棱镜成像视轴的特点,设计了一种提取方向的旋转估算和用于恢复位置的平移估算,结合计算成像技术,实现了对目标的多维信息提取,完成了六自由度的精确重构。该方法控制点少、抑制噪声能力强,平均误差优于0.4 mm和0.4°,在航空航天探测和智能制造等领域具有巨大潜力,尤其是在狭小受限空间中的应用,显示出了其独特的优势[125],如图19a所示。
图19 本课题组在图像目标信息提取和机器人视觉导引方面的工作

注:图片修改自文献[125-126],网络版为彩图。

Fig.19 The extraction of image target information and robot vision guidance of our research

此外,通过粗精耦合孔径调整原理,结合高分辨率相机与大视场相机,建立一种主从相机协同监控模型。这种模型不仅能增强机器人在宽广空间内的操作能力,而且通过实时监控和快速反馈机制,提高机器人对环境变化的适应性和灵活性,确保在复杂工业环境中的高精度定位和操作。为了进一步提升机器人视觉系统的性能,在传统眼在手机器人上引入变视轴感知系统,并提出动态目标跟踪算法和静态超分辨成像增强技术。这不仅为机器人扩展了视场,同时也保持了高精度和动态性[126],如图19b所示。
在成像技术的研究中,我们还深入探索了成像正逆向解算和光束扫描性质分析[127],以及盲点和奇点消除方法[128]。这些研究成果不仅提高了成像技术的理论深度,也为实际应用中的技术难题提供了解决思路。
综上所述,基于多视角的成像与图像增强方法将更加精准地应用于各种复杂场景,它们将为这些领域提供更加高效、智能的视觉解决方案,在提高生产效率和保障产品质量方面发挥关键作用。

4 总结与展望

智能成像已经走向了广泛的应用实践,涵盖了智能制造、机器人导航、自动驾驶和航空航天等多个领域。本文综述了多种多视角成像技术和图像增强方法,详细分析了各个多视角成像系统的性能特点以及在不同应用场景中的独特优势。传统的多视角图像增强方法相对成熟,但在处理高复杂度图像时,其性能往往受限于算法的固定模式和有限的参数调整能力。基于深度学习的图像增强技术通过学习丰富的图像特征,能够在更广泛的应用场景中提供更为精确的增强效果。
随着应用需求的不断增长,多视角的成像与图像增强技术仍然面临诸多挑战。成像系统的动态成像可行性、视场范围、成像精度、设计成本等关键指标相互制约,多元化的图像数据要求研究者根据具体应用场景设计合适的增强策略,以兼顾系统、算法等多方面需求。未来多视角成像和图像增强技术的研究重点包括:
1)小型化与低功耗的多视角成像系统。随着技术应用领域的不断拓宽,特别是在对设备体积重量和功耗要求严格的机器人技术领域,研究者们更加专注于开发更为小型化和低功耗的多视角成像系统。这一趋势促进了轻量级硬件组件和高效图像处理算法的创新,实现性能、便携性与节能性之间的优化平衡。随着微纳光学技术的进步和超构成像技术的进步,预计未来的多视角成像系统将能够在保持高分辨率成像能力的基础上,大幅减小体积和降低能耗,为复杂环境下的成像提供更加高效和可靠的解决方案。
2)高效的多视角图像增强计算技术。未来研究应在保证实时性的同时,进一步提高多视角图像增强的效率和精度,尤其是在处理高分辨率、大规模多视角图像数据集时。深度学习特别是大模型技术在增强算法中的应用将继续拓展,通过基于深度学习的大模型整合多视角信息,自动学习图像增强的最佳策略,并结合模型压缩和加速等技术,使这些大模型能够在资源受限的设备上部署,实现更加智能、高效和安全的图像处理能力。
3)多模态数据的高效集成研究。多视角成像技术将越来越多地与其他传感器(如红外、激光雷达等)相结合,以提供更全面的环境感知能力。未来的研究应探讨如何将来自不同传感器的数据进行有效整合,以提供更为全面和精确的环境感知,这包括数据同步、特征级融合、决策级融合、信息优化和智能处理等策略,以及在特定应用场景下的实际表现。通过这些研究,未来的多视角成像与图像增强技术将能够提供更加丰富和可靠的感知能力,以适应复杂多变的应用环境,在各个领域发挥关键作用。
[1]
QADEER N, SHAH J H, SHARIF M, et al. Multi-camera tracking of mechanically thrown objects for automated in-plant logistics by cognitive robots in Industry 4.0[J]. The Visual Computer, 2024,40:9063-9082.

[2]
FU G Q, WANG Y N, YANG J Y, et al. Monocular visual navigation algorithm for nursing robots via deep learning oriented to dynamic object goal[J]. Journal of Intelligent & Robotic Systems, 2023, 110(1):6

[3]
MA Y L, LI Y C, WU S L, et al. Automatic recognition of vehicle differentiated driving behaviour in automatic driving scenarios[J]. International Journal of Vehicle Design, 2024, 95(1/2):38-57.

[4]
ANAGNOSTOPOULOS C, ARVANITIS G, PIPERIGKOS N, et al. A multi-stereo camera system for improving physical ergonomics in human-robot collaboration scenarios[J]. Ercim News, 2023,132:10-12.

[5]
EBADI K, BERNREITER L, BIGGIE H, et al. Present and future of SLAM in extreme environments:the DARPA SubT challenge[J]. IEEE Transactions on Robotics, 2024,40:936-959.

[6]
张碧星, 张萍, 阎守国, 等. 超声成像检测研究进展[J]. 陕西师范大学学报(自然科学版), 2022, 50(6):1-16.

ZHANG B X, ZHANG P, YAN S G, et al. Research progress of ultrasonic imaging detection[J]. Journal of Shaanxi Normal University (Natural Science Edition), 2022, 50(6):1-16.

[7]
ESCRIVA D M, RUIZ J T, CARBO P G, et al. Computer vision on the edge to reduce network bandwidth consumption and computing resources in multi-view 3D industrial inspection without hidden surfaces[J]. Journal of Signal Processing Systems, 2023, 95(9):1079-1090.

[8]
ZHU J G, LI Y J. Single camera simulating stereo vision measurement technology[C]// Advanced Laser Technologies 2005,September 3-6, 2005, Tianjin.Bellingham:SPIE,2006:524-529.

[9]
WANG X G. Intelligent multi-camera video surveillance:a review[J]. Pattern Recognition Letters, 2013, 34(1):3-19.

[10]
ARAI J, YAMASHITA T, MIURA M, et al. Integral three-dimensional image capture equipment with closely positioned lens array and image sensor[J]. Optics Letters, 2013, 38(12):2044-2046.

[11]
VON SCHULTHESS G K, BURGER C. Integrating imaging modalities:what makes sense from a workflow perspective?[J]. European Journal of Nuclear Medicine and Molecular Imaging, 2010, 37(5):980-990.

[12]
郭珮瑶, 蒲志远, 马展. 多相机系统:成像增强及应用[J]. 激光与光电子学进展, 2021, 58(18):1811013.

GUO P Y, PU Z Y, MA Z. Multi-camera system:imaging enhancement and application[J]. Laser & Optoelectronics Progress, 2021, 58(18):1811013.

[13]
WILBURN B, JOSHI N, VAISH V, et al. High performance imaging using large camera arrays[J]. ACM Transactions on Graphics, 2005, 24(3):765-776.

[14]
BRADY D J, GEHM M E, STACK R A, et al. Multiscale gigapixel photography[J]. Nature, 2012,486:386-389.

[15]
YUAN X Y, JI M Q, WU J M, et al. A modular hierarchical array camera[J]. Light:Science & Applications, 2021,10:37.

[16]
WANG Y, CHEN L D, BAI L. Large-field 3D imaging using an array of gradually-changed FOV cameras[C]// 2017 IEEE International Conference on Systems,Man,and Cybernetics(SMC), October 5-8,2017, Banff,Alberta.New York: IEEE,2017:630-634.

[17]
WANG T C, ZHU J Y, KALANTARI N K, et al. Light field video capture using a learning-based hybrid imaging system[J]. ACM Transactions on Graphics, 2017, 36(4):1-13.

[18]
LEE B, SONG B C. Multi-image high dynamic range algorithm using a hybrid camera[J]. Signal Processing:image Communication, 2015,30:37-56.

[19]
SONG K C, WEN H W, XUE X T, et al. Modality registration and object search framework for UAV-based unregistered RGB-T image salient object detection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2023,61:5531015.

[20]
XIAN C H, ZHANG J, YANG W H, et al. Multi-scale progressive fusion-based depth image completion and enhancement for industrial collaborative robot applications[J]. Journal of Intelligent Manufacturing, 2024, 35(5):2119-2135.

[21]
HARIS M, WATANABE T, FAN L, et al. Superresolution for UAV images via adaptive multiple sparse representation and its application to 3D reconstruction[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(7):4047-4058.

[22]
ZHANG Z X, ZHU L X. A review on unmanned aerial vehicle remote sensing:platforms,sensors,data processing methods,and applications[J]. Drones, 2023, 7(6):398.

[23]
韩文霆, 张立元, 牛亚晓, 等. 无人机遥感技术在精量灌溉中应用的研究进展[J]. 农业机械学报, 2020, 51(2):1-14.

HAN W T, ZHANG L Y, NIU Y X, et al. Review on UAV remote sensing application in precision irrigation[J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(2):1-14.

[24]
SAGAN V, MAIMAITIJIANG M, SIDIKE P, et al. UAV-based high resolution thermal imaging for vegetation monitoring,and plant phenotyping using ICI 8640 P,FLIR vue pro R640,and thermoMap cameras[J]. Remote Sensing, 2019, 11(3):330.

[25]
张晓晔. 面向无人机应用的异源图像融合方法研究[D]. 武汉: 武汉大学, 2019.

ZHANG X Y. Research on heterogeneous image fusion method for UAV applications[D]. Wuhan: Wuhan University, 2019.

[26]
CHEN X, KONG W, CHEN T, et al. Fiber-laser-pumped green laser for photon-counting bathymetric Lidar on UAV platform[C]// Seventh Symposium on Novel Photoelectronic Detection Technology and Applications, November 5-7,2020, Kunming.Bellingham:SPIE,2021:895-902.

[27]
ISCIMEN B, ATASOY H, KUTLU Y, et al. Smart robot arm motion using computer vision[J]. Elektronika Ir Elektrotechnika, 2015, 21(6):3-7.

[28]
ROBINSON N, TIDD B, CAMPBELL D, et al. Robotic vision for human-robot interaction and collaboration:a survey and systematic review[J]. ACM Transactions on Human-Robot Interaction, 2023, 12(1):1-66.

[29]
JIANG J F, LUO X, LUO Q S, et al. An overview of hand-eye calibration[J]. The International Journal of Advanced Manufacturing Technology, 2022, 119(1):77-97.

[30]
ZHAN Q, WANG X. Hand-eye calibration and positioning for a robot drilling system[J]. The International Journal of Advanced Manufacturing Technology, 2012, 61(5):691-701.

[31]
PACHTRACHAI K, ALLAN M, PAWAR V, et al. Hand-eye calibration for robotic assisted minimally invasive surgery without a calibration object[C]//2016 IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS), 2016, Daejeon.New York: IEEE,2016:2485-2491.

[32]
WANG X, HUANG J S, SONG H W. Simultaneous robot-world and hand-eye calibration based on a pair of dual equations[J]. Measurement, 2021,181:109623.

[33]
CHEN L, ZHONG G W, WAN Z H, et al. A novel binocular vision-robot hand-eye calibration method using dual nonlinear optimization and sample screening[J]. Mechatronics, 2023,96:103083.

[34]
TSAI R Y, HUANG T S. Uniqueness and estimation of three-dimensional motion parameters of rigid objects with curved surfaces[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984, 6(1):13-27.

[35]
LEVOY M, HANRAHAN P. Light field rendering[M]// Seminal graphics papers:pushing the boundarie. New York: ACM,2023:441-452.

[36]
OVERBECK R S, ERICKSON D, EVANGELAKOS D, et al. A system for acquiring, processing,and rendering panoramic light field stills for virtual reality[EB/OL].( 2018-10-08)[2024-09-15].

[37]
UNGER J, WENGER A, HAWKINS T, et al. Capturing and rendering with incident light fields[C]// Rendering Techniques,June 25, 2003, Leuven,Belgium.New York: ACM.2003:141-149.

[38]
杨柯, 张长江, 周军华, 等. 基于全景视觉的态势感知系统研究[J]. 电子技术与软件工程, 2019, 151(5): 49-52.

YANG K, ZHANG C J, ZHOU J H, et al. Research on situational awareness system based on panoramic vision[J]. Electronic Technology & Software Engineering, 2019, 151(5): 49-52.

[39]
MURRAY D W, BRADSHAW K J, MCLAUCHLAN P F, et al. Driving saccade to pursuit using image motion[J]. International Journal of Computer Vision, 1995, 16(3):205-228.

[40]
NEBELUK R, ZARZYCKI K, SEREDYNSKI D, et al. Predictive tracking of an object by a pan-tilt camera of a robot[J]. Nonlinear Dynamics, 2023, 111(9):8383-8395.

[41]
CAO S X, WANG X Y, XIANG K. Visual object servo tracking based on the particle filter method using a pan-tilt-zoom camera[J]. International Journal of Advanced Robotic Systems, 2012, 9(4):134-140.

[42]
GUO J C, YUAN C H, ZHANG X, et al. Vision-based target detection and tracking for a miniature pan-tilt inertially stabilized platform[J]. Electronics, 2021, 10(18):2243.

[43]
侯凡, 孟祥印, 唐志锋, 等. 隧道排水管沟机器人摄像云台系统设计[J]. 机械设计与制造, 2023, 393(11):263-267.

HOU F, MENG X Y, TANG Z F, et al. Design of robot camera head system for tunnel drainage trench[J]. Machinery Design & Manufacture, 2023, 393(11):263-267.

[44]
PAN B, YU L P, ZHANG Q B. Review of single-camera stereo-digital image correlation techniques for full-field 3D shape and deformation measurement[J]. Science China Technological Sciences, 2018, 61(1):2-20.

[45]
刘兴盛, 李安虎, 邓兆军, 等. 单相机三维视觉成像技术研究进展[J]. 激光与光电子学进展, 2022, 59(14):1415007.

LIU X S, LI A H, DENG Z J, et al. Advances in three-dimensional imaging technologies based on single-camera stereo vision[J]. Laser & Optoelectronics Progress, 2022, 59(14):1415007.

[46]
YIN W, ZUO C, FENG S J, et al. Fast panoramic 3D shape measurement using the multi-view system with plane mirrors[C]// Seventh International Conference on Optical and Photonic Engineering, July 16-20,2019, Phuket,Thailand.Bellingham:SPIE,2019:16-20.

[47]
KIM J S. Auto-calibration of multi-view RGB-D cameras for virtual mirrors[C]// 2021 IEEE International Conference on Consumer Electronics-Asia, November 8-10,2021, Gangwon.New York: IEEE,2021:1-4.

[48]
XU Z Y, WANG Y, YANG C. Multi-camera global calibration for large-scale measurement based on plane mirror[J]. Optik, 2015, 126(23):4149-4154.

[49]
PAN B, CHEN B. A novel mirror-assisted multi-view digital image correlation for dual-surface shape and deformation measurements of sheet samples[J]. Optics and Lasers in Engineering, 2019,121:512-520.

[50]
GLUCKMAN J, NAYAR S K. Rectified catadioptric stereo sensors[C]// Proceedings IEEE Conference on Computer Vision and Pattern Recognition, 2000,Hilton Head Island,South Carolina. New York: IEEE,2000:380-387.

[51]
GLUCKMAN J, NAYAR S K. Catadioptric stereo using planar mirrors[J]. International Journal of Computer Vision, 2001, 44(1):65-79.

[52]
YAGI Y. Real-time omnidirectional image sensor for mobile robot navigation[C]// Proceedings of the IEEE Internatinal Symposium on Intelligent Control, September 27-30,2002,Vancouver,British Columbia. New York: IEEE,2003:702-708.

[53]
TAKEDA G, YENDO T, TEHRANI M P, et al. All-around convergent view acquisition system using ellipsoidal mirrors[C]// Three-Dimensional Imaging, Visualization, and Display 2010 and Display Technologies and Applications for Defense, Security, and Avionics IV, April 5-9,2010,Orlando,Florida. Bellingham:SPIE,2010:185-193.

[54]
WU C J, TSAI W H. A novel method for lateral vehicle localization by omni-cameras for car driving assistance[C]// Proceedings of the 13th International Conference on Knowledge-Based Intelligent Information and Engineering Systems, September 28-30,2009,Santiago. Berlin:Springer,2009:403-410.

[55]
NISHI R, AOTO T, KAWAI N, et al. Ultra-shallow DoF imaging using faced paraboloidal mirrors[C]// Computer Vision-ACCV 2016: 13th Asian Conference on Computer Vision,November,20-24,2016,Taipei,China. Berlin:Springer,2017:115-128.

[56]
FUJIGAKI S, KODAMA K, HAMAMOTO T.Multi-view imaging system using paraboloidal mirror arrays for efficient acquisition of dynamic light fields[C]// 2019 IEEE International Conference on Image Processing(ICIP), September 22-25,2019,Taipei China. New York: IEEE,2019:3532-3536.

[57]
DUCROCQ J, CARON G, MOUADDIB E M. HDROmni:optical extension of dynamic range for panoramic robot vision[J]. IEEE Robotics and Automation Letters, 2021, 6(2):3561-3568.

[58]
HENAO R, RABAL H, TORROBA R. Dynamical digital speckle pattern shearing interferometry[J]. Optik, 1997, 105(1): 13-15.

[59]
JANG J Y, CHO M. Controllable spatial filtering method in lensless imaging[J]. Electronics, 2024, 13(7):1184.

[60]
PAN B, WANG Q. Single-camera microscopic stereo digital image correlation using a diffraction grating[J]. Optics Express, 2013, 21(21):25056-25068.

[61]
JANG J Y, YOO H. Image enhancement of computational reconstruction in diffraction grating imaging using multiple parallax image arrays[J]. Sensors, 2020, 20(18):5137.

[62]
JANG J Y, YOO H. Computational three-dimensional imaging system via diffraction grating imaging with multiple wavelengths[J]. Sensors, 2021, 21(20):6928.

[63]
WAN L Y, LI H L. White-light imaging analysis of bi-grating systems[J]. Journal of the Optical Society of America A, 2009, 26(11):2336-2339.

[64]
LI Y L, LI N N, WANG D, et al. Tunable liquid crystal grating based holographic 3D display system with wide viewing angle and large size[J]. Light:Science & Applications, 2022,11:188.

[65]
HABIB M K. Fiber-grating-based vision system for real-time tracking,monitoring,and obstacle detection[J]. IEEE Sensors Journal, 2007, 7(1):105-121.

[66]
LEE D, KWEON I. A novel stereo camera system by a biprism[J]. IEEE Transactions on Robotics and Automation, 2000, 16(5):528-541.

[67]
CUI X Y, ZHENG J. Biprism-based monocular stereovision system parameter optimization[J]. Journal of Electronic Imaging, 2018, 27(3):033020.

[68]
GENOVESE K, CASALETTO L, RAYAS J A, et al. Stereo-digital image correlation (DIC) measurements with a single camera using a biprism[J]. Optics and Lasers in Engineering, 2013, 51(3):278-285.

[69]
YUAN T Y, DAI X J, SHAO X X, et al. Dual-biprism-based digital image correlation for defect detection of pipelines[J]. Optical Engineering, 2019, 58(1):014107.

[70]
朱新军, 侯林鹏, 宋丽梅, 等. 基于虚拟双目的条纹结构光三维重建[J]. 红外与激光工程, 2022, 51(11):20210955.

ZHU X J, HOU L P, SONG L M, et al. Fringe structured light 3D reconstruction based on virtual binocular[J]. Infrared and Laser Engineering, 2022, 51(11):20210955.

[71]
CHEN C Y, YANG T T, SUN W S. Optics system design applying a micro-prism array of a single lens stereo image pair[J]. Optics Express, 2008, 16(20):15495-15505.

[72]
SUN W S, TIEN C L, CHEN C Y, et al. Single-lens camera based on a pyramid prism array to capture four images[J]. Optical Review, 2013, 20(2):145-152.

[73]
XIAO Y, BIN LIM K. A prism-based single-lens stereovision system:from trinocular to multi-ocular[J]. Image and Vision Computing, 2007, 25(11):1725-1736.

[74]
BIRCH G C, WOO B L, DAGEL A L, et al. Pseudo-random prism arrays for lensless computational imagers[C]// Optical Design and Fabrication 2017,July 9-13, 2017,Denver,Colorado. Washington:OSA,2017:59-64.

[75]
NERO G M, PEI Y X, ZHANG T Y, et al. Field-of-view expansion via diffractive image steering and prism array[C]// Optical Architectures for Displays and Sensing in Augmented,Virtual,and Mixed Reality ⅣJanuary 30, 2023,San Francisco. Bellingham:SPIE,2023:328-333.

[76]
STEVENS R F, HARVEY T G. Lens arrays for a three-dimensional imaging system[J]. Journal of Optics A, 2002, 4(4):S17-S21.

[77]
LUMSDAINE A, GEORGIEV T. The focused plenoptic camera[C]//2009 IEEE International Conference on Computational Photography(ICCP), 2009,San Francisco. New York: IEEE,2009:1-8.

[78]
CHA Y G, NA J, KIM H K, et al. Microlens array camera with variable apertures for single-shot high dynamic range (HDR) imaging[J]. Optics Express, 2023, 31(18):29589-29595.

[79]
BAE S I, KIM K, YANG S, et al. Multifocal microlens arrays using multilayer photolithography[J]. Optics Express, 2020, 28(7):9082-9088.

[80]
LI A H, LIU X S, ZHAO Z S. Compact three-dimensional computational imaging using a dynamic virtual camera[J]. Optics Letters, 2020, 45(13):3801-3804.

[81]
LI A H, WAN Y M, WU Y S, et al. Large-field-of-view three-dimensional imaging from multiple virtual views[J]. Optical Engineering, 2024, 63(4):043102.

[82]
LI A H, LIU X S, SUN J F, et al. Risley-prism-based multi-beam scanning LiDAR for high-resolution three-dimensional imaging[J]. Optics and Lasers in Engineering, 2022,150:106836.

[83]
LIU X S, LI A H. Multiview three-dimensional imaging using a risley-prism-based spatially adaptive virtual camera field[J]. Applied Optics, 2022, 61(13):3619-3629.

[84]
DONG X, WANG G, PANG Y, et al. Fast efficient algorithm for enhancement of low lighting video[C]// 2011 IEEE International Conference on Multimedia and Expo, 2011,Barcelona. New York: IEEE,2011:1-6.

[85]
赵夫群. 图像配准技术研究综述[J]. 数字技术与应用, 2016(6):245.

ZHAO F Q. A review of research on image alignment techniques[J]. Digital Technology & Application, 2016(6):245.

[86]
CHEN J Y, LIU Y H, WEI S W, et al. A survey on deep learning in medical image registration:new technologies,uncertainty,evaluation metrics,and beyond[EB/OL].( 2023-07-15)[2024-09-15].

[87]
WELLS W M, VIOLA P, ATSUMI H, et al. Multi-modal volume registration by maximization of mutual information[J]. Medical Image Analysis, 1996, 1(1):35-51.

[88]
LI J W, WU X Y, LIAO P H, et al. Robust registration for infrared and visible images based on salient gradient mutual information and local search[J]. Infrared Physics & Technology, 2023,131:104711.

[89]
KUGLIN, HINES. The phase correlation image alignment method[C]// IEEE International Conference on Cybernetics and Society, October 26-28,1975,New York. New York: IEEE,1975:163-165.

[90]
ORDONEZ Á, HERAS D B, ARGÜELLO F. Surf-based registration for hyperspectral images[C]// 2019 IEEE International Geoscience and Remote Sensing Symposium, 2019,Yokohama. New York: IEEE,2019:63-66.

[91]
ROCCO I, ARANDJELOVIC R, SIVIC J. Convolutional neural network architecture for geometric matching[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 41(11):2553-2567.

[92]
RAJPOOT K, GRAU V, NOBLE J A, et al. The evaluation of single-view and multi-view fusion 3D echocardiography using image-driven segmentation and tracking[J]. Medical Image Analysis, 2011, 15(4):514-528.

[93]
RUBIO-GUIVERNAU J L, GURCHENKOV V, LUENGO-OROZ M A, et al. Wavelet-based image fusion in multi-view three-dimensional microscopy[J]. Bioinformatics, 2012, 28(2):238-245.

[94]
ZHANG T, TIAN W M, ZENG T, et al. Multi-angle fusion of SS-BiSAR images using Compass-2/Beidou-2 Satellites as opportunity illuminators[C]// 2014 International Radar Conference, 2014,Lille. New York: IEEE,2014:1-4.

[95]
ZHANG Z G, BIAN H Y, SONG Z Q. A multi-view sonar image fusion method based on the morphological wavelet and directional filters[C]//2016 IEEE/OES China Ocean Acoustics(COA), 2016,Harbin. New York: IEEE,2016:1-6.

[96]
RICHTER T, GENSER N, SEILER J, et al. Sequential polarization imaging using multi-view fusion[C]// 2017 IEEE International Workshop on Signal Processing Systems, 2017,Lorient. New York: IEEE,2017:1-5.

[97]
XUE Z, LI G R, WANG S H, et al. GOMES:a group-aware multi-view fusion approach towards real-world image clustering[C]// 2015 IEEE International Conference on Multimedia and Expo, 2015,Turin. New York: IEEE,2015:1-6.

[98]
FAN J, WU Y, ZENG X, et al. A multi-view super-resolution method with joint-optimization of image fusion and blind deblurring[J]. KSⅡ Transactions on Internet and Information Systems, 2018, 12(5):2366-2395.

[99]
FENG X M, LI J J, HUA Z, et al. Low-light image enhancement based on multi-illumination estimation[J]. Applied Intelligence, 2021, 51(7):5111-5131.

[100]
PECE F, KAUTZ J. Bitmap movement detection:HDR for dynamic scenes[C]// 2010 Conference on Visual Media Production, 2010, London.New York: IEEE,2010:1-8.

[101]
LIU Y, WANG Z F. Dense SIFT for ghost-free multi-exposure fusion[J]. Journal of Visual Communication and Image Representation, 2015,31:208-224.

[102]
XUE X, ZHOU Y. Multi-view multi-exposure image fusion based on random walks model[M]//Lecture notes in computer science. Berlin:Springer,2017:491-499.

[103]
WU G R, KIM M, WANG Q, et al. Unsupervised deep feature learning for deformable registration of MR brain images[M]//Lecture notes in computer science. Berlin:Springer,2013:649-656.

[104]
SIMONOVSKY M, GUTIÉRREZ-BECKER B, MATEUS D, et al. A deep metric for multimodal registration[C]// International Conference on Medical Image Computing and Computer-Assisted Intervention, 2016, Athenes.Berlin:Springer,2016:10-18.

[105]
de VOS B D, BERENDSEN F F, VIERGEVER M A, et al. A deep learning framework for unsupervised affine and deformable image registration[J]. Medical Image Analysis, 2019,52:128-143.

[106]
KORI A, KRISHNAMURTHI G. Zero shot learning for multi-modal real time image registration[EB/OL].(2019-08-06)[2024-09-15].

[107]
XU Z, LUO J, YAN J P, et al. Adversarial uni- and multi-modal stream networks for multimodal image registration[J]. Medical Image Computing and Computer-Assisted Intervention, 2020,12263:222-232.

[108]
WANG Z H, DELINGETTE H. Attention for image registration(AiR):an unsupervised transformer approach[EB/OL].(2021-05-02)[2024-09-15].

[109]
LIU Y, CHEN X, PENG H, et al. Multi-focus image fusion with a deep convolutional neural network[J]. Information Fusion, 2017,36:191-207.

[110]
LUO X J, SHAO L L. Exploring the application of deep learning in multi-view image fusion in complex environments[J]. Traitement Du Signal, 2023, 40(6):2731-2740.

[111]
JUNG H, KIM Y, JANG H, et al. Unsupervised deep image fusion with structure tensor representations[J]. IEEE Transactions on Image Processing,2020:3845-3858.

[112]
XU H, MA J Y, JIANG J J, et al. U2Fusion:a unified unsupervised image fusion network[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, 44(1):502-518.

[113]
XIAO Z Y, LIU Y T, GAO R S, et al. CutMIB:boosting light field super-resolution via multi-view image blending[C]// 2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2023, Vancouver.New York: IEEE,2023:1672-1682.

[114]
WANG X L, LIN Y F, ZHANG S. Multi-stream progressive restoration for low-light light field enhancement and denoising[J]. IEEE Transactions on Computational Imaging, 2023,9:70-82.

[115]
JI Z C, ZHENG H, ZHANG Z, et al. Multi-scale interaction network for low-light stereo image enhancement[J]. IEEE Transactions on Consumer Electronics, 2024, 70(1):3626-3634.

[116]
PENG F Y, ZHANG M J, LAI S M, et al. Deep HDR reconstruction of dynamic scenes[C]// 2018 IEEE 3rd International Conference on Image, Vision and Computing, June 27-29,2018, Chongqing. New York: IEEE,2018:347-351.

[117]
YAN Q S, GONG D, SHI J Q, et al. Dual-attention-guided network for ghost-free high dynamic range imaging[J]. International Journal of Computer Vision, 2022, 130(1):76-94.

[118]
HAZARIKA A, VYAS A, RAHMATI M, et al. Multi-camera 3D object detection for autonomous driving using deep learning and self-attention mechanism[J]. IEEE Access, 2023,11:64608-64620.

[119]
LIU S, LYU C G, GONG H T. Vehicle video surveillance system based on image fusion and parallel computing[J]. International Journal of Circuit Theory and Applications, 2021, 49(5):1532-1547.

[120]
CHEN J L, VAN LE D, TAN R, et al. BubCam:a vision system for automated quality inspection at manufacturing lines[C]// Proceedings of the ACM/IEEE 14th International Conference on Cyber-Physical Systems, 2023, San Antonio.New York: ACM,2023:12-21.

[121]
吴玉生, 李安虎, 万亚明, 等. 基于机器视觉的烟草在线检测技术研究进展[J]. 激光与光电子学进展, 2024, 61(8):231332.

WU Y S, LI A H, WAN Y M, et al. Progress in research on tobacco online inspection technology based on machine vision[J]. Laser & Optoelectronics Progress, 2024, 61(8):231332.

[122]
ZHANG F F, CHEN L, MIAO W H, et al. Research on accuracy of augmented reality surgical navigation system based on multi-view virtual and real registration technology[J]. IEEE Access, 2020,8:122511-122528.

[123]
江洁, 郑佳怡, 凌思睿. 新型复合多视场光学敏感器及其导航方法[J]. 北京航空航天大学学报, 2016, 42(1):1-7.

JIANG J, ZHENG J Y, LING S R. A new composite multi-field-of-view optical sensor and its navigation method[J]. Journal of Beijing University of Aeronautics and Astronautics, 2016, 42(1):1-7.

[124]
LI A H, LIU X S, GONG W, et al. Prelocation image stitching method based on flexible and precise boresight adjustment using Risley prisms[J]. Journal of the Optical Society of America A, 2019, 36(2):305-311.

[125]
DENG Z J, LI A H, LIU X S. Equivalent virtual cameras to estimate a six-degree-of-freedom pose in restricted-space scenarios[J]. Measurement, 2021,184:109903.

[126]
LI A H, DENG Z J, LIU X S, et al. A cooperative camera surveillance method based on the principle of coarse-fine coupling boresight adjustment[J]. Journal of the International Societies for Precision Engineering and Nanotechnology, 2020, 66: 99-109.

[127]
LI A H. Double-prism multi-mode scanning:principles and technology[M]. Singapore: Springer, 2018.

[128]
LI A H, ZUO Q Y, SUN W S, et al. Beam distortion of rotation double prisms with an arbitrary incident angle[J]. Applied Optics, 2016, 55(19):5164-5171.

Outlines

/