中科北纬(北京)科技有限公司

010-5289 6043

中科北纬(北京)科技有限公司

公司动态

Technology and information

技术与资讯

网站首页 > 技术与资讯 > 公司动态

新基建驱动产业转型升级 | AI赋能共创遥感新时代

2021-07-05 14:28:43 30 发布:中科北纬

新基建成为科技领域的焦点话题。作为新基建的重要内容,人工智能的发展愈发受到人们关注,不过与基础设施相比,人工智能很难将其具象化而出。但伴随图像处理技术、光学成像技术、传感器技术等的发展,以及算法的不断优化,使人工智能的两大分支(自然语言处理与机器视觉)拥有了感知物理世界的能力,作为图像图形领域中的重点内容之一,遥感应用行业也站在了产业智能化的风口。

图来源网络

1950年,科学家Alan Turing提出使用机器伪装人类对话的能力来衡量机器的智能水平,掀起了人工智能(Artificial Intelligence,AI)的浪潮。概括而言,AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术科学,涉及到数学、语言学、神经科学、心理学、物理学、认知科学、计算机科学等学科。党的十八大以来,党和国家高度重视和大力扶持新一代信息技术发展,移动互联网、云计算、大数据、物联网等技术加速交叉融合发展,有效地推动人工智能技术快速成熟、产业快速发展和经济社会领域广泛应用。2021年3月5日,“十四五规划”和2035年远景目标纲要草案提请十三届全国人大四次会议审查。其中,将新一代人工智能中的“前沿基础理论突破、专用芯片研发、深度学习框架等开源算法平台构建、学习推理与决策、图像图形、语音视频、自然语言识别处理等领域的创新”作为了一项需要重点突破的科技前沿领域。作为图像图形领域中的重点内容之一,遥感应用行业站在了产业智能化的风口,AI与大数据技术赋能于遥感应用,也成为了行业以及学术界广泛关注和研究的课题,而如何利用人工智能手段辅助挖掘这些丰富的信息也成为了遥感图像分析与理解的重要内容。

以深度学习为主要应用的AI技术为遥感影像解译提供了新的方法,适用于遥感大数据的自动化处理和数据挖掘,其能够深度地挖掘遥感影像中的有效信息,从而快速赋能于行业应用。人工智能发展的三要素包括算力、算法和数据,而深度学习本质上是采用监督学习的方式,通过大量样本数据来学习目标的本质特征,并据此对未知数据进行预测判别,其基础性的研究主要分为两大方面,一方面是样本库的设计与标注,另一方面是网络结构与模型设计。


遥感影像样本库的设计与构建

在样本库的设计与标注研究中,在计算机视觉领域经过多年的发展已经构建了以ImageNet为代表的众多自然图像样本库,并多次作为深度模型训练与验证的数据集。样本库的数量和质量作为深度学习模型成功应用的重要决定因素,其标注应能够客观真实的反映实际地物情况,在标注过程中可以遵循以下原则:

(1)最大最小范围原则:标注的目标区域要尽量大到包含目标区域的边界,但也要小到除了目标区域边界外,不包含其它物体特征;

(2)宁无不错的原则:错误的标签对于模型训练的过程是很大的扰动,会导致模型训练难以收敛,最终导致模型的泛化性极差、难以拟合等问题;

(3)所标即所见原则:标注过程中只标注从视觉上确定的目标物体,对于有遮挡或者无法分辨的地物不进行标注,也即是不添加主观想象力和先验知识。

在具体的遥感影像应用上,由于受到尺度效应、成像条件、地表场景等众多因素的影响,使得遥感图像包含了分布复杂的多种地物类型。在建立遥感图像样本库时,学者们提出了不仅需要考虑更多的地物属性特征,既标注单一地物,也应标注其特征的存在背景和关联数据,也即是构建面向对象的遥感知识库,为深度学习模型提供包括基础图形、对应的属性类别、位置信息以及地物对象的物理和社会特征等辅助信息。目前,研究者们已经构建了大量用于目标探测和图像分类的标记样本库,如针对车辆识别的TAS数据集(图像数30,图像大小792×636)、OIRDS数据集(图像数900,图像大小256~640×256~640)、DLR 3K Vehicle(图像数20,图像大小5616×3744);针对飞机识别的UCAS-AOD数据集(图像数1510,图像大小1280×659);针对建筑物识别的SZTAKI-INRIA数据集(图像数9,图像大小800×800);针对船只识别的HRSC2016数据集(图像数1070,图像大小>1000×600);针对多种地物提取的NWPUVHR-10数据集(图像数800,图像大小1000×1000)、VEDAI数据集(图像数1210,图像大小1024×1024)、ROSD数据集(图像数976,图像大小1280×1280)以及DOTA-v1.5数据集(图像数2806,图像大小800~4000×800~4000)等。


面向遥感解译的深度学习网络结构与模型设计

在网络结构与模型设计研究中,应用在遥感影像分类方面的深度学习模型主要有深度置信网络(Deep BeliefNetwork,DBN)、卷积神经网络(Convolutional Neural Network,CNN)和栈式自编码器网络(Stacked Auto-encoder Network,SAE),各方法的原理、分类效果以及优缺点如表1所示。


表1 不同深度学习方法的特征比较

1998年,Lecun总结完善了经典卷积神经网络在手写体数字识别中的应用,作为深度学习方法中的典型代表,CNN可以接受图像作为输入数据,避免了传统识别算法中复杂的特征提取和数据重建过程。此外,CNN采用卷积和权值共享训练策略,极大地降低了模型复杂度,节省了训练开支,且能够识别图像的空间特征。更重要的是,CNN具有局部连接和空间下采样特点,使得CNN具有一定的平移、尺度和扭曲不变性,被广泛的应用于图像的目标识别和分类中。CNN模型通常由卷积层、池化层和全连接层组合而成:

(1)卷积层。卷积层是CNN的核心,目的是对输入数据进行特征提取。在卷积层中,使用一组滤波器(即卷积核),与前一层中位置邻接区域内的元素进行卷积操作,并使用非线性激活函数进行映射,获取图像的卷积特征;

(2)池化层。在卷积层进行特征提取后,采用空间池化方法对卷积特征图进行下采样,用于特征选择和空间降维。池化层可以有效地降低模型复杂度,节省计算成本。常用的池化方法包括极大值池化和均值池化;

(3)全连接层。全连接层是将当前网络层中的每个节点与上一层的所有节点相连,可以整合卷积层或者池化层中提取到的特征。

2012年,Hinton研究组构建了深度学习模型AlexNet并在ImageNet图像识别中一举夺冠,其采用ReLU激活函数,从根本上解决了梯度消失问题,并采用GPU极大的提高了模型的运算速度。在此后的几年中,分别涌现出了诸如VGGNet、ResNet、GooleNet、MobileNet、DenseNet等特征自动提取网络,并且在数据集测试上获得了优秀的提取结果。近年来,深度学习网络模型不断完善,在图像识别和信息提取方面取得了突破性进展,在很多任务上的精度已然超过人工识别精度。深度学习在计算机视觉领域的巨大成功为遥感大数据信息智能提取提供了重要机遇,然而,遥感影像具有其专业化特征,如遥感影像中的目标存在方向任意性、尺度多样性、几何形变和密集排列等特点,因此要求基于CNN模型的改进能够结合遥感图像目标的特点,有效地实现目标检测。遥感学界的学者和从业者也对不同的深度学习模型进行了修改,将其应用于遥感影像解译中。例如,针对遥感图像目标方向的不确定性,可以提取旋转不变特征实现水平框目标检测,也可以设计能够准确识别目标角度的方法来实现有向边框目标检测;针对目标的尺度差异性,采用多尺度方法对网络结构进行改进,实现多尺度目标检测;针对遥感目标的密集排列问题,采用自适应方法,实现密集目标检测。此外,针对遥感影像存在纹理特征复杂的特点,为提高分类精度,现有研究通常基于两个方向:一方面通过增加网络层数,训练更深的神经网络来提取深层次的的语义信息;另一方面则采用结合更高效模块提高网络的特征提取能力。深度学习模型在遥感影像解译中已经产生了大量的应用并获得了优秀的解译效果,其具有以下优势:不需要人工设计特征,具有很强的特征学习和表达能力,可以直接从数据中学习更加抽象且含有语义信息的高层特征,模型预测性能高,具有较好的迁移学习能力。


遥感智能视觉平台的构建

目前,深度学习技术虽然在遥感影像解译中取得了显著的成果,但仍然存在着一些问题,如网络模型大多依赖经验设计;需要大量有标注的数据;网络模型复杂度高,容易出现局部最优解或过拟合问题;训练耗时,计算量大;存储和计算资源要求高,通常需要GPU平台;模型的超参数选择多依赖于经验和技巧。鉴于此,测绘地理信息行业涌现出类似中科北纬(北京)科技有限公司这样的企业,以中科北纬为例,他们开发了面向用户的遥感智能视觉平台——天枢。在整体架构上,依托于国际领先的国产开源框架飞桨(PaddlePaddle),打造出了影像智能解译闭环链路,如图1所示。在对遥感数据进行挖掘提取过程中,经过大规模迭代优化,能够避免季相变化、卫星型号对解译效果造成的影响,地块分割准确率达到90%以上,可对四个像素以上的影像变化进行提取和输出。此外,遥感智能视觉平台集成了改变大小、标准化、随机翻转、局部随机放大、随机高斯模糊、随机锐化、波段数量降维、添加NDVI通道、添加NDWI通道、添加NDBI通道等17种方法,重新定制并优化了图像增强方案。


图1 影像智能解译闭环链路

在功能上,中科北纬公司开发的天枢遥感智能视觉平台采用B/S结构开发,面向非专业化用户设计了友好的操作界面,提供了针对遥感数据的三大功能模块:斜框检测、地块分割变化检测,如图2所示。该平台构建了一体化的遥感影像特征自动提取流程,包括遥感影像预处理、模型训练、模型下发和使用、精度评价、结果后处理等过程。在常规任务上,如建筑物、水体、道路等特征的提取以及变化检测,无需用户过多干预,模型能够输出高精度的地物提取结果;此外,产品具有可扩展性,也即是用户可以按需训练适应特定场景的模型,可用于不同尺度、不同分辨率、不同时期的遥感影像特征的提取及变化检测。


图2 遥感智能视觉平台界面

可以预见,算法、算力和海量数据的沉淀使得AI与遥感应用的结合正当时。“可感知、能学习、易扩展” 的遥感解译平台,能够实现多源影像数据中的变化特征及建筑、林地、水域、道路、农作物等多种目标信息的智能化解译,一定会受到泛在自然资源应用和管理的欢迎。

未来十年,遥感是否可以深刻地影响社会发展,切实解决了生产生活中的问题,兼具普适性和经济价值,其关键点在于对遥感数据的解译和应用。科技进步给人类带来的不止是效率的提升、生活质量的改善,更将为人类带来别样的认识世界的方式和视角。当脚下的地球被源源不断地读取进计算中心,一个全新的认知维度缓缓在我们面前展开,迎来新一轮的技术革新。人工智能技术的出现,恰逢其时,正如吴一戎院士所说,将AI赋能遥感技术,贯穿海量多源异构数据从处理分析到共享应用的全链路,将能够大幅度缩短遥感图像的解译周期,催生一些新的遥感应用,并促进遥感数据服务模式的变革,从而共创遥感新时代。


图文 / 岳汉秋


其他新闻

-->