图像处理(image processing)是对图像进行各种加工,以达到改善图像的视觉效果并减少数据量的过程,主要重点是图像之间的变换及其之间的相互转换。广义上图像处理泛指各种图像技术,但狭义上专指图像的底层基本操作。图像处理可分为虚拟图像处理和数字图像处理,前者通过数学方法处理图像,而后者依赖
计算机对图像属性进行操作。现代图像处理多指通过计算机进行的图像处理。
最早的图像处理技术诞生于20世纪20年代,当时人们利用巴特兰(Bartlane)图片传输系统传输数字化的新闻图片,之后又改用光学还原技术来处理图片。到了20世纪50年代,随着电子计算机的普及,计算机开始应用于图像处理领域,并在20世纪60年代逐渐成为一门独立的学科。到了20世纪80年代、随着
离散数学理论的创立和完善,数字图像处理理论和方法进一步完善。进入90年代,图像处理技术朝实时性、智能性和网络化方向发展,并在21世纪进一步涵盖小波分析、机器学习、计算机视觉等领域。2010年后,图像处理技术不仅广泛应用于
可见光和CT图像处理,还扩展到红外、磁共振和太赫兹图像处理领域,其中AI技术促进了图像处理技术的深入发展,2018年,法国Thales公司在其最新研发的TALIOS光电系统中采用人工智能技术,实现了对目标的自动探测和识别。
图像处理技术主要包括图像获取、图像预处理、
图像增强和复原、图像重建、
特征提取、图像变换、图像编码压缩、图像分割以及图像识别等。典型的图片处理工具包括图像处理软件Adobe Photoshop、
计算机视觉库
OpenCV、图形处理
编程语言MATLAB等。图像处理技术被广泛应用于安全、航空航天、
生物医学等领域。其发展趋势在于提高处理速度,结合
新技术开发新的处理方法,并加强标准化研究。
基本概念
图像
“图”是物体投射或反射光的分布,“像”是人的
视觉系统对图的接受在大脑中形成的印象或反映。图像是对客观对象的一种相似性的生动描述或写真,或者说是客观对象的一种表示,它包含了被描述对象的有关信息,即图像是客观和主观的结合。一幅图像是其所表示物体的信息的一个浓缩和高度概括,广义地讲,凡是记录在纸介质上的,拍摄在底片和照片上的,显示在电视、
投影器和
计算机屏幕上的所有具有视觉效果的画面都可以称为图像。
图像类型
模拟图像:模拟图像是通过某种
物理量(光、电等)的强弱变化来记录图像上各点的亮度信息的,如
模拟电视图像。
数字图像:数字图像是指完全是用数字(即计算机存储的数据)来记录图像亮度信息的。
可见图像:人眼可以直接观测的图像称为可见图像,可见图像包括图片和光图像,图片包括照片、用线条画的图和画,光图像是用
透镜、
光栅和全息技术产生的图像。
不可见图像:人眼不可以直接观测图像称为不可见图像,不可见图像包括不
可见光成像(如
红外线、
微波等的成像)和不可见量按
数学模型生成的图像(如温度、压力及人口密度等的分布图)。
图像格式
在
计算机中图像是以位图和矢量图的形式显示的,图像处理的过程也与二者密切相关。
位图:位图又称点阵图、栅格图像、像素图,是以像素作为最小单位构成的图,放大后会失真。在位图中,每个像素都有自己的颜色对象,在进行图像处理时,可操作的对象是每个像素。此外,位图的像素点之间的颜色值不会互相影响,这也使得位图可以表示任何图像。位图文件的格式有BMP、PCX、GIP、JPG等。
矢量图:矢量图又称向量图,即缩放不失真的图像,它通过多个对象的组合生成,对其中的每一个对象的记录方式,以数学函数来实现。在
矢量文件中,图像元素均为自成一体的实体,具有颜色、形状、轮廓、大小和屏幕位置等属性。矢量图形与
分辨率无关,清晰度不受大小影响,它的文件格式有AI(
奥多比 Illustrator)、EPS、SVG、
Dplus KIA等。
颜色与像素
颜色模型:颜色模型是指某个颜色空间中的一个
可见光子集,它包含某个颜色域的所有颜色。例如在RGB颜色模型中,它就是三维直角坐标系颜色系统的一个单位
立方体。颜色模型的用途是在某个颜色域内方便地指定颜色,由于每一个颜色域都是可见光的子集,因此任何一个颜色模型都无法包含所有的可见光。常见的颜色模型包括RGB颜色模型、CMY颜色模型、HSV颜色模型等。
像素:假设图像是由一系列不同颜色的点排列组合而成,形成图像的点称为像素。像素一般是由数字表示,数字的值决定像素的颜色。把一幅图像想象成一个正方形网格,每个网格由一个特定颜色的像素组成。像素有灰度和颜色两种表示方式。
彩色图像:彩色图像的数据不仅包括亮度信息,还要包含颜色信息。常规的彩色图像也都是用RGB三基色来表示,每个像素包括红绿蓝三种颜色的数据,每个数据用1个
字节(8位
二进制位)表示,则每个像素的数据为3个字节(即24位二进制)。
灰度图像:灰度图像是数字图像的最基本的形式,灰度图像可以由黑色照片数字化得到,或对彩色图像进行去色处理得到。在
灰度图像中,每个像素的值都介于0和255之间。0表示黑色,255表示白色。中间的值表示不同程度的灰色阴影,接近0的值是较深的灰色,接近255的值是较亮的灰色。
二值图像:二值图像是灰度图像经过二值化处理的结果。二至图像只有两个
半色调,理论上只需要1个
二进制表示。一幅二值图像的二维矩阵仅由0、1两个值构成,“0”代表黑色,“1”代表白色。由于每一像素(矩阵中每一元素)取值仅有0、1两种可能,所以
计算机中二值图像的数据类型通常为1个二进制位。二值图像通常用于文字、线条图的扫描识别(OCR)和掩膜图像的存储。
分辨率
分辨率又称解析度、解像度,可以细分为显示分辨率、图像分辨率、打印分辨率和扫描分辨率等,如无特殊强调,主要指图像分辨率。图像分辨率是指单位长度上的图像像素的多少,即用每英寸多少点表示。
图像分辨率:图像分辨率是指图像中存储的信息量。其和图像尺寸的值一起决定文件的大小及输出质量,该值越大图形文件所占的
磁盘空间也就越大,同时,图形分辨率以比例关系影响文件的大小,及文件大小与其图形分辨率的平方成正比。
扫描
分辨率:扫描分辨率是指在扫描一幅图像之前所设定的分辨率,它将影响所生成的
图像文件的质量和使用性能,它决定图形将以何种方式显示或打印。一般情况下,扫描分辨率不会大于一般屏幕的设备分辨率。
打印分辨率:打印分辨率又称为输出分辨率,是指在打印输出时横向和纵向两个方向上每英寸最多能够打印的点数,通常以“点/英寸”(dpi)表示。它是衡量打印机打印质量的重要指标,它决定了打印机打印图像时所能表现的精细程度,其中最高
分辨率就是打印机所能打印的最大分辨率。
发展历程
图像远距离传输
最早的图像处理在
计算机出现之前就已产生。但由于通信和
电子技术的限制,图像技术的发展较为缓慢,传输的图像大小和清晰度都受到了极大的限制,在20世纪20年代,人们利用巴特兰(Bartlane)图片传输系统传输数字化的新闻图片,在伦敦和
纽约之间经大西洋海底电缆传输,传输一幅图像的时间需要几天或者几个小时。为了改进传输图像的清晰度,改用了一种基于光学还原的技术,在
电报接收端用
穿孔纸带打出图片。早期的Bartlane系统可以用5个灰度等级对图像编码,到1929年已增加到15个等级。在这一时期,由于引入了一种用编码图像纸带去调制光束,而使底片感光的系统明显地改善了复原过程。
计算机图像处理
计算机图像处理最早产生于20世纪50年代,当时的电子计算机已经发展到一定水平,人们可以利用计算机来处理图形和图像信息。然而数字图像处理作为一门学科大约形成于60年代初期。早期的图像处理的目的是改善图像的质量,是以人为对象,以改善人的视觉效果为目的;常用的图像处理方法有图像增强、复原、编码、压缩等。
美国
喷气推进实验室(JPL)首次成功将图像处理技术应用于科学研究。他们对航天探测器勘测者7号在1964年发回的几千张月球照片使用了图像处理技术,如采用几何校正、灰度变换、去除噪声等方法进行处理,并考虑了
太阳位置和月球环境的影响,由
计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,构造出了月球的
地形图、彩色图及全景镶嵌图,取得了非凡的成果,为人类
登月奠定了坚实的基础,也推动了数字图像处理学科的诞生。在以后的宇航空间技术,如对
火星、
土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。
推广应用
20世纪70年代以来,JPL以及各国
有关部门已把数字图像处理技术从空间技术推广到生物学、X射线图像增强、光学显微图像的分析、
地球资源技术卫星、多波段
遥感图像的分析,粒子物理、地质
钻探、
人工智能、工业检测等应用领域。其中1972年,英国EMI公司工程师
亨斯菲尔德(Housfield)发明了用于头颅诊断的X射线
计算机断层摄影装置,也就是通常所说的CT(Computer Tomograph)。CT 的基本方法是扫描人体组织的截面影像,经计算机处理来重建截面图像。1975年,EMI公司成功研制了全身CT
扫描仪,这种设备能够获取人体各部位的清晰断层图像。这项突破性的成就帮助EMI在1979年荣获
诺贝尔奖。CT扫描仪的成功不仅标志着医学成像技术的进步,也极大地推动了图像处理技术的深入发展。在这一时期,罗森菲尔德(Rosenfeld)出版了第一本专门讨论数字图像处理的专著,进一步促进了该领域的学术和应用研究。
从20世纪70年代中期开始,随着
计算机技术和
人工智慧、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或
计算机视觉。
新理论发展
到了20世纪80年代、随着
离散数学理论的创立和完善,数字图像处理理论和方法进一步完善,应用范围更为广泛。20世纪90年代后,数字图像处理的发展方向包括实时性、智能性、普及化、网络化、低成本等,同时随着因特网的迅速发展和
personal computer性能提升和应用普及,大量图像在网络中进行传输,数字图像编码、压缩等研究逐步深入,形成了JPEG、MPEG等图像压缩标准。
21世纪后,越来越多从事数学、物理等理论研究以及
计算机科学研究的人员关注和加人到图像处理这一研究领域,逐渐改变了图像处理仅受
工程技术人员关注的状况。各种与图像处理有关的新理论与新技术不断出现,如
小波分析、
机器学习、形态学,
偏微分方程,模糊集合,
计算机视觉、
人工神经网络,
压缩感知等,已经成为图像处理理论与技术的研究热点。与此同时,计算机运算速度的提高,硬件处理器能力的增强,使得人们由仅能够处理单幅的二维彩色图像,到开始能够处理多频段彩色图像、三维图像和多视点视频图像。
新学科及新技术
随着图像处理技术的发展,其深入各个领域并诞生出了众多交叉技术,例如医学图像处理、航天图像处理、智能图像处理、
多媒体信息处理、
遥感图像处理、生物图像特征识别、
虚拟现实技术等。如在2010年10月,中国嫦娥2号月球探测器在距月球表面100km处用CCD立体相机拍摄的7m
分辨率、100%覆盖的全月球图像的一个局部——Daniel环型坑,直径29km。
2010年之后,图像处理不仅对
可见光、CT图像进行处理,而且扩展到对红外图像、磁共振图像(Magnetic
共振 lmaging,MRI),太赫兹图像(THz Imaging)等新的研究和应用。2016年年底,World View-4卫星发射升空,其最高分辨率可达0.31米,同时AI(
人工智慧)图像处理技术也在快速的发展,2018年,法国Thales公司在其最新研发的TALIOS光电系统中采用人工智能技术,实现了对目标的自动探测和识别。
分类
虚拟图像处理
虚拟图像处理又称光学处理,主要采用连续数学的方法处理,处理方式很少,往往只能进行简单的放大、缩小等,并且模拟图像的保存性较差。例如,望远镜、
显微镜哈哈镜、
透镜、胶片合成照相、
凸透镜都属于模拟图像处理的范畴。其优点是实时处理速度快;缺点是精度低,灵活度差,难有判断功能。
数字图像处理
数字图像处理又称
计算机处理,是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理,从而达到某种预期的处理目的的方法和技术。随着
数字技术和数字计算机技术的飞速发展,数字图像处理技术在近二十年的时间里,迅速发展成为一门独立的有强大生命力的学科,应用领域十分广泛。其优点是精度高、内容丰富、方法易变、灵活度高;缺点是处理速度较慢。数学图像处理的特点包括再现性好、精度高、适用面广。
图像技术
图像获取
图像的获取过程就是将自然的影像转变为数字化图像的过程,它的图像通常用
扫描仪、数码
照相机直接获取,也可以从互联网、光盘图片库等来源获取。在图像获取的过程中通常会涉及到图像的采样以及量化,其具体描述如下:
图像预处理
图像预处理的主要目的为消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而可以改进后续的特征抽取、
图像分割、
边缘检测等。常见的图像预处理包括噪声去除、图像滤波、归一化等,这些操作旨在提取有用特征,减少计算复杂度,并适应不同算法的要求。其具体描述如下:
图像增强
图像增强是通过一定的方法或手段对原图像附加一些信息或交换数据,有选择地突出图像中感兴趣的特征或者抑制图像中某些不需要的特征,使图像与视觉响应特征相匹配,使之改善
图像质量。图像增强的主要方法包括
对比度增强,锐化以及颜色校正,其具体描述如下:
图像复原
图像复原是在假定已知模糊或噪声的情况下,试图估计原图像的一种技术,它可以除去或减少在获得图像过程中因各种原因产生的退化,这类原因包括光学系统的
像差或离焦、摄像系统与被摄物之间的相对运动、
电子或光学系统的噪声等。图像复原的方法包括去模糊技术、超
分辨率、图像填充等,其具体描述如下:
图像重建
图像重建是指根据对物体的探测获取的数据来重新建立图像,用于重建图像的数据一般是分时、分步取得的。图像重建的意义在于获取被检测物体内部结构的图像而不对物体造成任何物理上的损伤。图像重建主要有投影重建、明暗恢复形状、立体视觉重建和
激光测距重建等,其具体描述如下:
特征提取
图像特征提取是指通过
计算机提取图像中属于特征信息的方法及过程,它通过检查每个像素来确定该像素是否代表一个特征。其中,图像特征包括图像的颜色特征、纹理特征、形状特征和
空间关系特征。在图像处理过程中,使用较广泛的特征包括HOG(Histogram of Oriented
梯度)特征、SIFT(Scale Invariant Feature Transform)特征等,其具体描述如下:
图像变换
图像变换技术往往应用于图像阵列较大时,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理结果,图像的变换实质上是改变图像中像素点与像素点的
空间关系,通过改变图像的空间结构,来实现预处理的效果,常用的图像变换方法包括缩放、平移、镜像、旋转、
仿射变换、投射变换等,其具体描述如下:
图像编码压缩
图像编码压缩技术可减少描述图像的数据量(即比特数),以便缩短图像传输、处理时间和减少所占用的存储器容量。压缩可以在不失真的前提下进行,也可以在允许的失真条件下进行。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早目比较成熟的技术。图像数据压缩方法根据不同的依据可产生不同的二分类,根据压缩质量有无损失可分为有损压缩编码和无损压缩编码,其具体描述如下:
图像分割
图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别分析和理解的基础。主要的图像分割方法主要包括基于阈值的分割方法、基于边缘的分割方法和基于区域的分割方法。
图像描述
图像描述是图像识别和理解的必要前提。一般图像的描述方法为二维形状描述,它有边界描述和区域描述两类方法。对于特殊的纹理图像可采用二维纹理特征描述随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。
图像分类(识别)
图像分类是指将一幅图像分类到其对应的类别,其目的在于根据图像信息所能反应的不同特征,将不同类别的图像区别开来,换言之,图像分类就是从已知的类别标签集合中为给定的输入图像选定一个类别标签。分类的方法有很多,其中最常用的包括场景、材质或者纹理分类等。
图像分析
图像分析是通过
计算机技术和算法从图像中提取有用信息的过程,它涉及图像预处理、
特征提取、
模式识别和数据解释等步骤。图像分析广泛应用于医疗诊断、
安防监控、工业检测和自动驾驶等领域,旨在将视觉数据转化为可理解和可操作的信息,从而辅助决策和实现自动化处理。
形态学
形态学图像处理是指通过
数学形态学对图像进行处理,其中数学形态学的语言是
集合论,其集合表示图像中的对象。常用的形态学算法有腐蚀、膨胀、开运算和闭运算等。
典型工具
图像处理软件
编程库和框架
应用
图像安全与隐私
图像安全方面的应用可分为
公共安全和
信息安全,在公共安全方面,包括车站、
机场等人员流动密集的场所设置监控器,在处理紧急情况时,警方需要得到清晰明确的图片信息,以便做出进一步的处置;在信息安全方面,对于某些特殊领域,如军事、商业和医疗,数字图像还有较高的隐私保密要求,因此需要对数字图像进行加密处理,数字图像加密的安全模型和理论框架包括图像安全策略、图像安全评价标准、
图像质量的评价以及加密算法的抗攻击性等。
航天和航空技术
数字图像处理技术在航天和航空技术方面的应用,除了对月球、
火星照片的处理,还有在飞机
遥感和卫星遥感技术中的应用,其通过侦察卫星和飞机进行空中拍摄后,经过
计算机进行图像研判,及节省了人力,也加快了速度。现在世界各国都在利用陆地卫星所获取的图像进行资源调查、灾害检测、资源勘察、农业规划、
城市规划。
生物医学工程
数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了CT技术,还有一类是对医用显微图像的处理分析,如
免疫细胞、红细胞、
白细胞分类,
染色体分析,
癌细胞识别等。以免疫细胞图像为例,其呈现块状分部,但在实际操作中,由于整体噪声的存在很难获得满意的结果,可以通过对获取的图像进行自动分割来获得更为清晰的图像。此外,在X光肺部图像增晰、
超声波图像处理、
心电图分析、立体定向
放射治疗等医学诊断方面都广泛地应用了图像处理技术。
通信工程
当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。其中以图像通信最为复杂和困难,其通过在发射端,图像信源首先经过图像数字化(A/D转换)形成数字图像信号,并去除或减少图像信息中的冗余度,压缩图像信号的频带或降低其数码率,以达到经济有效的传输或存储的目的。在上述过程中的压缩编码技术主要有熵编码、DPCM编码、
变换编码,目前国内外正在大力研究新的编码方法,如分行编码自适应
网络编码、小波变换图像压缩编码等。
军事、公安领域
军事、公安方面的应用特点是高精尖,数字图像与数字图像处理的算法和设备(尤其军用的)都是最高档的和最先进的,图像
分辨率、成像速度等技术指标甚至是保密的。在军事方面,图像处理和识别主要用于
导弹的精确制导,各种侦察照片的判读,具有图片传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等。在公安方面,主要用于图片的判读分析、指纹识别、人脸鉴别、不完整图片的复原及交通监控、事故分析等。目前,已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。
农业领域
图像处理技术在农业领域起步较晚,近年来,随着
计算机多媒体技术的发展,农作物长势监测、病虫草害诊断、农作物自动收获,种子质量检测、农作物的缺素识别、农产品质量分级检测等方面有着广泛的应用。特别是在
病虫害防治方面,通过对病虫
草海的自动检测与识别技术,开发视觉型智能化控制系统,可以准确地获取植物受害的病因、
病种及受害程度,从而保证农业生产
可持续发展。
挑战
噪声
图像中存咋的噪声种类很多,例如加性高斯
白噪声、
量化噪声、泊松噪声和斑点噪声,虽然人们一直在研究去噪技术,但在实际应用中,噪声往往是复杂且不规则的。一方面,改善成像硬件设备性能以抑制噪声非常重要;另一方面,如何进一步设计从叠加的噪声图像中恢复“干净”图像的算法模型也同样关键。
伪影
在CT和MRI中,容积内引入
金属材料可能会导致图像产线伪影,这是由于金属材料会影响周围
磁场,导致局部磁场不均匀,加大磁敏感差异以及感生出大量的
涡流。该问题很难被解决,金属导致的伪影只能被忽略掉。此外,金属伪影在CT和MRI上的表型也不同,对图像的影响程度也不同。在MRI中,金属导致的伪影除了引起图像
对比度和灰度改变,还会导致图像形变、扭曲,产生严重的几何失真。
泛化能力
在图像识别中,泛化能力的适应性与数据密切相关,在图像识别模型中,数据集会被随机划分为训练集和测试集,模型也相应地在此数据集上训练和评估,在一般情况下,由于测试集和训练集都是从具有相似场景内容和成像条件的数据中采集得到的,因此两者具有相同的数据分布,但在实际应用中,由于视角、大小尺度、场景配置等因素的影响,导致测试数据与训练数据存在较大差异,最终会导致模型的泛化能力受到限制。
图像质量
图像质量的含义包含两方面,分别为图像的逼真度和图像的可懂度,图像质量直接取决于成像装备的光学性能、图像
对比度、仪器噪声等多种因素的影响。但是,在获取过程中必须会经过采集、传输和处理的过程,由于传输介质、记录设备和处理技术等的不完善,不可避免的会导致图像的失真和降质。因此,需要对图像质量进行综合的评价,从多角度来完善对图像质量的控制。
发展趋势
由于图像处理逐渐深入人们的日常生活,因此需要进一步发展在不同领域的深度研究,其主要包括: