高光谱解混技术是高光谱遥感分析领域的关键技术。基于自编码器的解混方法因其特征提取与数据重建等优势,成为近年研究焦点。文中从模型架构演进和与物理模型融合两个方面,系统梳理了该技术的发展脉络,揭示其创新路径与演进趋势。首先,通过三阶段框架说明技术进展:基础自编码网络验证了解混理论与深度学习的初步适配性;集成卷积、循环及Transformer模块的复合架构强化了光谱-空间联合建模能力;神经架构搜索与即插即用机制则推动动态优化自适应网络的形成。其次,物理模型与数据驱动方法的融合呈现递进特征:早期研究通过非负性、丰度和为一等约束条件建立物理联系,而当前方法通过将物理模型嵌入网络层或损失函数,实现物理机理与特征学习的深度耦合。最后,未来研究将聚焦于构建"物理可解释-数据自适应"混合智能模型,重点突破先进模型创新、物理模型深度融合、复杂场景适应性、计算效率优化等关键技术,有望将应用边界拓展至医学影像分析、农产品品质检测等新兴领域,为高光谱解混技术体系发展提供理论支撑和应用指引。
研究背景
高光谱遥感成像领域长期面临着一个棘手矛盾——传感器分辨率的物理极限与自然界地物复杂多样性的冲突。这导致单一像元内往往融合了两个或多个地物类型的信息,形成混合像元。若仅以单一像元的综合信息为依据开展分析,势必引入较大误差。为化解这一难题,亚像元级信息提取成为关键,而解混技术则是其中的核心技术。
在众多解混技术中,深度学习相较于传统的物理模型及浅层神经网络学习,具备了卓越的模型表达与特征表示能力。深度学习能够更精准地对现实世界中的真实地物进行模拟与分析。凭借强大的数据驱动能力以及海量多样数据的训练,深度学习模型在高光谱遥感解混领域展现出独特优势。自编码器作为一种常用的深度神经网络架构(图1),在高光谱解混场景下,该架构可以同时求解端元与丰度,尤其在盲解混问题求解中优势凸显,基于自编码架构能精准契合盲源分离问题的特殊形式,为解混问题的高效解决提供有力支撑。
图1 自编码网络结构图
主要内容
深度自编码神经网络作为深度学习神经网络的一种,通过编码器和解码器的结构设计,能够保留物理可解释性,从而有效提取丰度和端元。在高光谱解混任务中,可以将丰度估计与编码器相对应,将端元和混合机制(F)与解码器函数相对应,以适应特定的问题表述。这种对应关系有助于将自编码神经网络的结构与解混任务的目标紧密结合(图2)。
图2 高光谱解混自编码网络结构图
高光谱解混自编码网络的第一阶段:采用基础自编码器架构,即全连接层组成的自编码器进行解混。但这种方式面临噪声、高维数据处理、模型泛化等问题。为了应对这些挑战,研究者们提出了多种解决方案,除此之外,还有一些多分支网络的设计,例如通过双流网络来分别进行端元和丰度的计算。这些方法在不同的数据集和场景中表现出色,为高光谱解混技术的发展提供了重要的理论和实践基础。
高光谱解混自编码网络的第二阶段:基于自编码器的异构模块融合架构,其核心思想是将自编码器的端到端非线性映射能力与不同网络模块的特征建模优势相结合,构建更具鲁棒性和可扩展性的解混框架。近来,基于 Transformer 网络的高光谱解混方法发展迅速。该方法结合了卷积自编码器和 Transformer(图3),利用 Transformer 的全局特征依赖性捕捉能力,提高了端元光谱和丰度图的质量。实验结果表明,该方法在 Samson、Apex 等数据集上的表现优于现有的先进方法。
图3 基于Transformer矿物解混网络
高光谱解混自编码网络的第三阶段:自适应网络结构,其核心在于通过自动化架构搜索或模块化重构实现网络结构的动态适配,以提高模型在不同任务和数据集上的性能和效率。为解决传统手动设计效率低、次优性问题,引入神经网络架构搜索(Neural Architecture Search,NAS),通过自动化模块重构动态适配网络结构,增强模型性能与泛化能力。可以实现更高效、更智能的解混。
但是在实际应用场景下,单纯依赖数据驱动的方法偶尔会出现偏差,导致得出的结果与现实世界的实际情况存在出入。而将高光谱解混自编码神经网络与物理模型相结合的策略,巧妙地兼顾了二者的优势,这种创新性的结合方式应用成效良好。就目前而言,这种结合大致可划分为两个阶段。第一阶段,物理模型作为神经网络的约束条件,为神经网络的运行提供了一定的规范和引导;第二阶段,则是在第一阶段的坚实基础上,实现物理模型与神经网络的深度融合。例如hapke辐射传输模型与深度学习网络的融合方法(图4)。这种深度融合不仅进一步优化了模型的性能,还催生了高光谱解混领域重要的研究方向。
图4 hapke-ANN高光谱解混模型
结论
展望未来,高光谱解混自编码网络将朝着构建 “物理可解释、数据自适应” 的混合智能模型方向发展。在模型创新上,通过融合更多先进架构、发展新型自编码器变体以及构建多模态数据融合架构,进一步提升自编码器对高光谱数据复杂特征的提取与解混能力。与物理模型的结合也将更加深化,使解混过程更符合物理规律,提高对复杂物理现象的解混能力。同时,为提升对复杂场景的适应性,需研究能处理更复杂混合类型、应对高动态范围场景的解混方法。在计算效率与可扩展性方面,借助模型轻量化、加速技术以及分布式与并行计算,满足实时处理与大规模数据处理需求。此外,基于自编码的高光谱解混方法在跨领域应用与行业深度融合上也具有广阔的拓展空间。
作者介绍
秦凯
秦凯,铀资源探采与核遥感全国重点实验室正高级工程师,中核集团遥感图像分析技术领域科技带头人,中核铀业遥感图像分析技术领域科技带头人。担任中国光学工程学会高光谱技术及应用研讨会光谱智能专题主席(2021-2024),中国遥感应用协会专家委员会副秘书长。第一作者在遥感领域权威发表40余篇论文。研究成果被纳入国家自然资源部《中国地质调查技术规程》技术标准体系。获得省部级一等奖、二等奖等10项,国家发明专利授权7项,北京市优秀青年人才,中核集团中核青年五四奖章,中核铀业十大杰出青年,中核铀业青年地矿英才等荣誉称号。
赵英俊
赵英俊,高级工程师(研究员级二级),博士生导师,核工业北京地质研究院科技委副主任、中核集团遥感勘查技术领域首席科学家。长期从事遥感技术应用研究。为新世纪百千万人才工程国家级人选,国务院政府特殊津贴获得者。获得省部级一等奖 二等奖 10 项。中国遥感应用协会理事,遥感协会专家委副主任等。
文章信息
秦凯, 郝予希, 赵英俊, 等. 基于自编码的高光谱遥感解混技术研究综述(内封面文章·特邀).红外与激光工程, 2025, 54(5): 20250131. DOI: 10.3788/IRLA20250131
全文链接:http://irla.cn/article/doi/10.3788/IRLA20250131(阅读原文)