时间:2023-12-20 10:48:55
引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇计算机视觉研究内容范例。如需获取更多原创内容,可随时联系我们的客服老师。
1、引言
随着经济的迅猛发展,汽车的迅速普及,根据社会对汽车产业的要求,车辆的各方面指标都受到人们越来越多地关注,汽车涂装过程中的瑕疵直接影响汽车的外观质量,因此如何在生产过程中利用计算机视觉检测技术检测出并及时修补汽车涂装过程中产生的瑕疵就成了首要的任务[1]。本文的研究内容是首先了解计算机视觉检测系统的工作原理,汽车涂装瑕疵的种类,然后结合两者的特点,应用计算机视觉检测系统检测汽车涂装瑕疵。该研究的价值在于两方面:①对于汽车生产的自动化和过程自动化,计算机视觉是现实真正意义的自动的基础和一种重要的质量控制的手段;②对于汽车涂装瑕疵的修补可以提高其修补的精度。
2、汽车涂装瑕疵的计算机视觉检测系统
汽车涂装瑕疵检测系统主要包括照明系统、图像采集卡、CCD摄像机、计算机以及软件处理等几个主要部分[2]。综合计算机视觉检测系统的构成和线结构光测量的原理,基于计算机视觉的汽车涂装瑕疵的检测系统大致是这样构成的:将线结构光投射到被测物上,所形成的光斑作为传感信号,用CCD摄像机采集光斑图像,采集到的图像信号被传输到计算机,根据图像处理和计算机视觉检测系统的处理产生处理结果,返回到涂装生产线,对车身的涂装进行修正,从而提高产品质量。汽车涂装瑕疵的视觉检测系统如图1所示[3]。
3、计算机视觉检测
计算机视觉是计算机对图像进行自动处理并报告“图像中有什么”的过程,也就是说它识别图像中的内容。图像中的内容往往是某些机器零件,而处理的目标不仅要能对机器零件定位,还要能对其进行检验。计算机视觉系统基本原理:机器视觉系统通常采用CCD相机摄取图像,将其转化为数字信号,再采用先进的计算机硬件与软件技术对图像数字信号进行处理,从而得到所需要的各种目标图像特征值,并在此基础上实现模式识别、坐标计算、灰度分布图等多种功能。计算机视觉系统能够根据其检测结果快速地显示图像、输出数据、指令,执行机构可以配合其完成指令的实施。计算机视觉系统主要由图像获取、图像分析和处理、输出显示或控制三个功能模块组成[4]。视觉检测按其所处理的数据类型可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测。另外,还有X射线检测、超声波检测和红外线检测。一个完整视觉检测系统包括:图像采集、图像分割、零件识别、模型匹配和决策判断。Newman[5]等描述了利用深度图像进行零件检测的AVI系统,具有一定的代表性。一个典型的AVI系统如图2所示。
4、汽车涂装瑕疵的检测算法
由于汽车涂膜中一些缺陷的边界比较模糊,例如:气泡、爆裂气泡孔、气泡针孔、抽缩等等。边缘处灰度变化很小,直接用传统的微分边缘检测算法无法有效的检测出来。所以对缺陷模糊边缘的检测成为了算法的关键[6]。本文介绍了基于线结构光的边缘检测方法。汽车涂装表面被光源投射器发出的线结构光照射,反射出的图像被CCD摄像机所接收传输到计算机视觉检测系统中。若涂装表面没有瑕疵,则产生图3的图像。若涂装表面有瑕疵,则产生图4的图像[7]。
在我国市场经济不断发展的盛况下,我国科技发展水平也紧随其后,成为世界上的科技强国之一。在计算机水平的不断提高下,计算机视觉技术应运而生。其中,计算机视觉技术被应用与各个领域,并在各个领域都得到广泛有效的应用,比如军事领域、医疗领域、工业领域等。本文针对计算机视觉技术在交通领域中的应用进行分析。
【关键词】计算机视觉 交通领域 探究
近年来,随着科技水平的提高,计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说,视觉能获得更多的信息。因此,在我国交通领域中,也对计算机视觉技术进行研究完善,将计算机视觉技术应用在交通领域各个方面中,并取得了显著的成效。
1 计算机视觉的概述及基本体系结构
1.1 计算机视觉概述
通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。
计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。
计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。
1.2 计算机视觉领域基本体系结构
提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。
2 计算机视觉在交通领域的应用
2.1 牌照识别
车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。
2.2 车辆检测
目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。
2.3 统计公交乘客人数
城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。
2.4 对车道偏离程度和驾驶员工作状态判断
交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。
2.5 路面破损检测
最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。
3 结论
本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。
参考文献
[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).
[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).
[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).
[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).
[5]朱学君,沈睿.关于计算机视觉在交通领域中的探讨[J].信息通信,2013(01):123.
[6]王大勇.关于计算机视觉在交通领域中的应用分析[J].科技与企业,2013(01):115.
作者简介
夏栋(1988-),男,湖北省孝感市人。现为同济大学软件学院在读硕士。研究方向为计算机视觉。
关键词 计算机;视觉技术;应用研究
中图分类号:TP212 文献标识码:A 文章编号:1671-7597(2013)16-0114-01
计算机视觉技术自20世纪70年代产生以来就得到了全世界的广泛关注。作为一种多学科综合应用下的新技术,随着专家对其研究会的不断深入,其应用领域也越来越广,给人们的生产生活带来了极大方便。
1 计算机视觉技术
计算机视觉技术是在计算机技术应用下发展起来的一种新技术,主要用来研究计算机模拟生物的宏观或外显功能。该技术在应用过程中会涉及到计算机科学、神经生物学、人工智能、模式识别以及图像处理等多个学科,多学科技术的综合运用使得计算机具有了“感知”周围世界的能力,这也正是该技术发挥作用的核心所在。计算机视觉技术的特点就在于,首先,它能在不接触被测者的前提下完成对被测者的检测;其次,该技术应用的领域和检测的对象非常广,能在敏感器件的应用下,完成对人类难以观察到的超声波、微波和红外线等的检测;最后,该技术还突破了人在视觉观察上长时间工作的限制,能对检测对象进行长时间观察。
2 计算机视觉技术在各领域的应用分析
随着计算机视觉技术研究的不断加深,该技术的应用领域也越来越广,下面,本文就选取工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面对计算机视觉技术的应用进行简要分析。
2.1 在工业领域中的应用
工业生产对产品的质量要求极高,计算机视觉技术在工业上的应用主要集中在以下3方面:1)产品形状和尺寸的检测上。对制造业而言,产品的形状和尺寸是否合格直接影响到产品在实际应用过程中作用的发挥。计算机视觉技术的应用能对产品进行二维和三维等几何特征的检测,如产品的圆度、位置及形状等。2)产品零部件缺失情况的检测。在生产线运行过程中,计算机视觉技术能准确检测出产品在生产过程中是否存在铆钉、螺丝钉等零部件的缺失以及产品内部是否在生产过程中掺进杂质等。3)产品表面质量的检测。为了从各个方面保证产品的合格性,对其进行表面质量的检测也是一个极其重要的环节。计算机视觉技术实现了对产品表面的纹理、粗糙度、划痕、裂纹等各方面的有效检测。
2.2 在农业生产领域中的应用
该技术在农业领域的应用主要集中在以下两方面:1)对病虫害的预测预报。预测预报作用发挥的关键环节是建立起计算机视觉技术对所有昆虫的识别体系。对昆虫图像识别系统进行数字化建模所使用的方法主要以下2种,一种是运用数学形态学的方法对害虫的边缘进行检测,进而提取害虫的特征;第二种是从昆虫的二值化图像中提取出昆虫的周长、面积和复杂度等基本信息,并对这些信息建立害虫的模板库以实现对昆虫的模糊决策分析。2)对农作物生长的监测。常用的方法就是运用计算机视觉技术下的非接触式监测系统对农作物生长环境下的光照、温度、湿度、风速、营养液浓度等相关因素进行连续地监测,进而判断出农作物长势。
2.3 在林业生产中的应用
该技术在林业生产中的应用主要集中在农药喷洒和林木球果采集这两方面。就林业的农药喷洒而言,常规的农药喷洒方式易造成农药的大量流失,不仅达不到防止林业有害生物的目的,还浪费了大量的人力、物力和财力。计算机视觉技术的应用能通过对施药目标图像进行实时分析,得出具体的施药量和准确的施药位置,该技术指导下的施药工作极大发挥了农药的效果。就林木球果采集而言,该采集工作的操作难度一直都很大,我国当前使用的方法主要是人工使用专业工具下的采集以及机械设备运用下的高空作业车采集和摇振采种机采集,这两种方式都存在一定的安全性和效率问题。计算机视觉技术的应用能通过对需要进行采集的林木球果进行图像采集来得出球果所处的具置,再结合专业机械手的使用完成球果采集。该技术不仅节省了大量劳动力,还极大提高了采摘效率。
2.4 在农产品检测中的应用
农产品在生产过程中受自然环境的影响比较大,所以农产品不仅会产生质量上的差异,还会造成颜色、大小、形状等外观上的极大不同。由于农产品在出售时大多要进行产品等级的划分,所以将计算机视觉技术运用到对其颜色和外形尺寸的检测上,有效达到了对农产品进行检测的目的。通过对外观大小尺寸的检测,不仅提高了对农产品进行分门别类地等级划分的效率,还在很大程度上减少了对产品的损坏;通过对西瓜等农产品进行颜色上的检测,能准确判断其是否成熟,有效避免了人工操作下的失误。
2.5 在电力系统自动化中的应用
计算机视觉技术在电力系统自动化应用的表现当前主要表现在以下2个方面:1)在人机界面中的应用。人机界面在运行过程中更加强调人的主体地位,实现了用户对各种效应通道和感觉通道的运用。具体来讲,计算机视觉技术在用户向计算机的输入方面,效应通道实现了手动为主向手、足、口、身体等的转变;在计算机向用户的输出方面,感觉通道实现了视觉为主向触觉、嗅觉、听觉等的转变。2)在电厂煤粉锅炉火焰检测中的应用。对煤粉锅炉火焰的检测既能有效判断锅炉的运行状况,又能在很大程度上实现电厂的安全性运营。由于煤的负荷变化和种类变化会在使着火位置发生移动,所以为了保证炉膛火焰检测的准确性,必须弥补之前单纯应用火焰检测器只能判断有无火焰开关量信号的弊端。计算机视觉技术的应用,就在弥补火焰检测器应用弊端的基础上,实现了对火焰形状的进一步检测。
2.6 在图书馆工作中的应用
随着当前数字图书馆和自动化管理系统的建立,计算机技术在图书馆方面的应用越来越广泛。当前计算机视觉技术在图书馆方面的应用主要集中在古籍修补和书刊剔旧这两方面。就古籍修补而言,古籍图书等在收藏的过程中,受温度、湿度、光照等的影响,极易导致纸张变黄、变脆以及虫洞等现象的出现。在进行修补时,依靠计算机视觉技术开展具体的修补工作,能在很大程度上提高修补工作的效率。就书刊剔旧而言,由于图书馆藏书众多,对那些使用率低且较为陈旧的文献资料进行及时地剔除,能实现图书资源的及时更新。计算机视觉技术在该方面的应用,极大地保证了工作的准确性和效率性。
3 结束语
通过以上对计算机视觉技术在工业、农业、林业、农产品检测、电力系统自动化及图书馆工作这6个方面的研究可以看出,随着计算机技术的进一步发展以及计算机与各专业学科的不断渗透,该技术的发展前景和应用领域都将更加广阔。
参考文献
关键词:动态场景;自适应预测;多特征融合;计算机视觉;运动目标
接受信息的关键手段之一就是视觉系统,随着科学技术水平的不断发展,以及计算机和信号处理理论的诞生,让机器拥有人类视觉功能已经不再是梦。对所采集视频中的运动目标进行跟踪、检测,并对其目标行为进行分析,就是运动目标分析的内容,运动目标分析是计算机视觉领域关键内容之一,其属于图像理解与图像分析的范畴。而在运动目标分析系统中,跟踪与检测运动目标则为中级和低级处理部分,是分析与理解行为的高等层分析模块的基础。检测与跟踪运动目标技术主要包括了:机器人视觉导航、军事领域、运动图像编码、交通管制、视觉监视等。
1目标检测算法
连续图像序列由视频中提取出,由前景区域与背景区域共同组成了整个画面。前景区域包含了如运动的人体、车辆等动态要素,它是指人们较为感兴趣的区域。而背景区域主要包含例如树木、建筑物等静态要素,它的像素值仅发生微弱变化或者不产生变化。在连续图像序列中,采用一系列算法分隔开背景区域和前景区域,将运动目标信息有效提取,则为运动目标检测。以静态场景为基础的运动目标检测算法包括了光流法、背景差分法、帧间查分法等,文章主要针对背景差分法进行介绍。
背景差分法通常适用于静态场景,其是将背景图像与当前帧图像进行差分,运动目标依靠阀值化进行检测,因为该算法仅能够在背景变化缓慢或者不发生变化的情况下应用,因此就有着一定的局限性。假设当前帧图像为fk(x,y),背景图像B(x,y)可通过一定的方法得出,而这时背景差分图像则为:
(1)
而假设二值化阀值为Th,二值化图像B(x,y)则为:
(2)
运动目标检测结果可通过数学形态学处理获得。
2 背景模型的实时更新
要更新背景图像可采用一阶KALMAN滤波来实现,为了克服气候变化、光照变化等外部环境变化对运动检测产生的影响,采用一阶KALMAN滤波更新背景图像公式如下:
Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)
而增益因子则为:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)
公式中?琢1和?琢2是权值系数;M是第k时刻二值化后目标图像中p像素的值;B为背景图像;I为当前帧图像。要想将运动目标从背景序列图像中有效分割出来,就必须要达到?琢2足够小的条件,且?琢1应等于或者大于10?琢2,若?琢1值过大,就会将算法自身的去噪特性丧失,在序列背景图像中也会存储越来越多的运动变化。
3 更新车辆目标模型
核与活动轮廓算法具有效率高、技术复杂度低等特点,它以非参数核概率密度估计理论为基础,在视频运动目标跟踪中广泛应用。彩色图像序列通过摄像机获取,人脸目标模型可以采用RGB颜色空间来进行描述。在跟踪车辆的过程中,噪声、遮挡、光照等干扰或多或少存在,因干扰因素的存在,车辆像素特征也会发生相应的微弱变化。若不对目标模型进行更新,会对跟踪精度产生影响,所以,采用的矩形模板会包括一定背景。而在实施跟踪的过程中,要对车辆目标模型进行更换。如果其过程物遮挡,当BHATTACHARYYA系数满足?籽>Tudm条件时,更新车辆目标模型,更新模型为:
(5)
公式中Tudm是模板更新阀值;qk-1是更新之前的车辆目标模型。通过视频跟踪,在近场景和远场景拍摄到的视频中,多尺度图像空间由各个帧图像构成。例如:将将书本作为跟踪对象,由远及近从书本的正上方拍摄六十帧图像,为了能使矩形框正好能够包含书本,对每帧图像张书本手工划定矩形框,并对框内图像的信息量进行统计。最后,随书本尺度的变化,给出图像信息量变化曲线。
4 计算机视觉原理
计算机视觉是一门研究怎样使机器进行观察的科学,更切确地说,就是指利用电脑和摄影机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为传送给仪器检测或更适合人眼观察的图像。计算机视觉研究相关的理论和技术作为一个科学学科,尝试创建能够从图像或者多维数据中获取信息的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个决定的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中感知的科学。
计算机视觉就是由计算机来代替大脑完成处理和解释,用各种成象系统代替视觉器官作为输入敏感手段。使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力就是计算机视觉的最终研究目标,而需要经过长期的努力才能达到这个目标。所以,在实现最终目标以前,通过努力的中期目标是建立一种视觉系统,这个系统能依靠反馈的某种程度的智能和视觉敏感完成一定的任务。例如:计算机视觉的一个重要应用领域就是自主车辆的视觉导航,但要实现自主导航的系统,却还没有条件实现象人那样能识别和理解任何环境。所以,人们通过不懈的努力,研究在高速公路上具有道路跟踪能力,有效避免与前方车辆碰撞的视觉辅助驾驶系统。人类视觉系统是有史以来,人们所知道的功能最强大和完善的视觉系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理,但并不等于计算机必须按人类视觉的方法完成视觉信息的处理。可以说,对人类视觉处理机制的研究将给计算机视觉的研究提供指导和启发,所以,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,与此同时也是一个十分重要和让人感兴趣的研究领域。这方面的研究被称为计算视觉。计算视觉可被认为是计算机视觉中的一个研究领域。计算机视觉领域的不完善性与多样性为其突出特点。
5 结束语
对视频中的运动目标进行跟踪、识别、检测,并对目标行为进行研究、分析,这就是基于视觉运动目标分析。以计算机视觉为基础,分析运动目标,包括了目标行为的理解与分析、目标跟踪、运动目标检测、预处理图像等,它是计算机视觉领域重要内容之一。理解与分析运动目标的行为,既是计算机视觉的根本目的之一,也是检测与跟踪运动目标的最终目标。从理论层考虑,理解与分析运动目标的行为可以分为人工智能理论研究与模式识别。简要阐述基于计算机视觉的运动目标分析,而所面临的是对运动目标行为的理解。
参考文献
[1]杨可,刘明军,毛欣,夏维建,刘伟,周旋,吴炜,周凯.基于计算机视觉的电缆终端表面温升分析系统[J].电视技术,2013(7).
[2]叶闯,沈益青,李豪,曹思汗,王柏祥.基于人类视觉特性(HVS)的离散小波变换(DWT)数字水印算法[J].浙江大学学报:理学版,2013(2).
[3]何青海,马本学,瞿端阳,李宏伟,王宝.基于机器视觉棉叶螨自动监测与分级方法研究[J].农机化研究,2013(4).
[4]贾挺猛,苟一,鲍官军,董茂,杨庆华.基于机器视觉的葡萄树枝骨架提取算法研究[J].机电工程,2013(4).
关键词:计算机图形学;计算机视觉;可视化技术
中图分类号:TM862 文献标识码:A 文章编号:1671-2064(2017)01-0054-02
计算机图形学、计算机视觉以及可视化技术三者均是计算机领域重要组成部分,要做好计算机知识,就要先学好计算机图形学,但计算机图形学学习相对枯燥,尤其是算法教学难以理解,为解决这一问题,计算机视觉与可视化技术被应用到计算机图形学中。可见,三者之间存在一定的联系,因此,有必要对计算机图形学、计算机视觉以及可视化技术展开研究。
1 计算机图形学概述
1.1 计算机图形学目的
所谓的计算机图形学实际上就是怎样利用计算机表示图形,并利用计算机完成图形计算与处理,而这一过程的实现需要得到相关算法的支持。学习计算机图形学的目的是利用计算机技术为人们呈现既带有美感又不缺真实的图形(如下图1所示),为实现这一目标,就需要按照图形的要求创设合适的场景,并在一些光照模型的作用下,做好光照效果设计,在这一过程中需要计算机图形学能够与其他计算机技术相配合。经过计算机图形学出来的图像,多会以数字图像的方式展示出来,总的来说,计算机图形学与图像处理之间存在着一定的联系[1]。计算机图形学的涉及范围相对宽泛,不仅有图形硬件设计,还包括动画制作,虚拟现实等多个部分。此外,计算机图形学在动画制作中的应用频率也很高,如45分钟一集的动画影片中,85%的画面都需要用算机图形学来完成,由此可见,计算机图形学的应用频率极高,并在动画制作中发挥着不可替代的作用。因此,应重视计算机图形学的应用。
1.2 计算机图形学应用
随着计算机图形学的发展,它被应用到各个领域中,并发挥着重要作用。首先,在计算机辅助设计与制造中的应用,这是计算机图形学应用最多的领域,在计算机图形学被应用以后,不仅可以设计出更精准的图形,还能做好人机交互设计,强化修改能力。计算机图形学还被应用到三维形体重建中,利用该技术可以将原理的二维信息转化为三维信息,如在某次工程图纸设计中就应用了计算机图形学,经过一系列的处理以后,三维形体逐渐形成,最终实现了重建。其次,在医学领域中的应用。计算机图形学在医学领域中的应用多以计算可视化的形式展示出来,如在脑部手术中,医生为看清患处真实情况,经常需要利用在可视化技术的作用下将复杂的数据转化为图像,这时就体现了计算机图形学在其中的应用[2]。再者,在计算机动画中的应用,人们看到的动画影片就是计算机图形学作用的结果,以动画人物的行走为例,为保证动画人物的行走与自然人不存在过大差异,就需要应用大量的计算机技术,并在计算机图形学的作用下完成设计。最后,在计算机艺术中的应用。计算机图形学在计算机艺术中也有广泛应用,它不仅可以用于艺术制作,很多场景都是通过计算机图形学来完成的,现阶段,一些人正在利用计算机图形学创设人体模拟系统,其目的是让已故人士再次出现在荧屏上,这一目标的实现就需要得到计算机图形学的支持。
2 计算机视觉技术
2.1 计算机视觉技术含义
所谓的计算机视觉技术,实际上就是用计算机取代人眼做识别、跟踪以及测量等,同时也兼顾图形处理,其目的是让图像在计算机被处理以后更适于识别。对于计算机视觉技术来说,意在实现人工智能,主要是从图像与多维数据等方面实现人工智能系统设计[3]。计算机视觉是一种在相关理论与模型基础上发展起来的视觉系统,其主要构成部分有以下几种:
(1)程序控制,这一点主要体现在机器人设计上;(2)事件检测,多体现在图像监测上;(3)信息组织,主要体现在图像数据库等方面。计算机视觉三个阶段如图2所示,通过观察图1可以发现,计算机视觉存在于图像处理始终,从早期处理直到后期结束都存在,最终实现了3D描述,可见,计算机视觉具有十分重要的作用[4]。
2.2 计算机视觉技术的应用
现阶段,现代社会已经进入信息化时代,计算机技术也被应用到各个领域,并发挥着重要作用。计算机视觉的应用促使计算机实现了智能化,在该技术的支持下,计算机可以像人一样透过视觉看待世界万物,且具有良好的适应能力,但这一目标的实现还需要很长时间,需要一系列的努力才能实现。现阶段,计算机视觉应用最多的就是车辆视觉导航,然而,这种导航还没有实现完全自主导航,这也是需要进一步研究的地方。计算机视觉技术的适应性较好,特别适合在工业领域应用,即便是存在电子在干扰或温度变化较大的地方都能很好的运行,其整体效果也不会受到影响,再者,计算机视觉技术的嵌入性较好,成本相对较低,尤其适合在PC方案中使用,同时,具有一定的非接触能力,能够获取大量信息,且不受距离限制,总的来说,计算机视觉技术总体效果较好,适合利用在各种工业环境中应用,因此,应重视计算机视觉技术的应用[5]。同时计算机视觉还被应用到移动机器人设计中,主要是利用小波模板展示人体形态,然后做图像扫描,这样就可以顺利完成小波变换,进而了解到人的存在。同样,将计算机视觉应用到机器人设计上,可以自动检测出正在行动的人或车辆,而无法检测到静止的人,之所以会出现这样情况,主要是由于其中采用率步态分析法。
3 可视化技术
3.1 可视化技术含义
可视化技术是一种综合了计算机图形学与图像处理于一体的技术,它可以将复杂的数据转化为图像并在屏幕上展示出来。在可视化技术中,融合了以上两种技术的特点,并在多个领域都有应用,随着可视化技术的应用,不仅有效实现了数据表示,还强化了数据处理能力,更对数据决策分析有一定作用[6]。现阶段,虚拟现实技术已经成为可视化技术主要发展方向。
3.2 可视化技术的应用
首先,在计算机图形学教学中的应用,计算机图形学相对枯燥,相关知识也很抽象,不便于学生理解,在计算机图形学中最重要的部分是曲线曲面,而这些曲线曲面多是与数学模型有关,具有一定的抽象性,学生理解难度较大,以往教师只能通过一系列的公式演算帮助学生理解,尽管这样依然难以让学生掌握曲线变化情况,学生依旧无法正确理解。为减少这种情况的发生,可视化技术被应用到计算机图形学教学中,教师将抽象的知识用动画的形式展示出来,学生只要观看动画,拖动一定的控制点就可以了解到曲线变化情况,这样一来不仅增加了教学趣味性,学生也可以随意变动曲线,让复杂的知识变得简单,深化学生对计算机图形学知识的深度理解,同时,利用可视化技术在一定条件下,还可以完成代码编译,如在Actoin ScriPt中做编译,这样也可以增强学生的理解能力[7]。
其次,在医学领域中的应用。医学领域对于可视化技术的应用主要体现在放射治疗与矫正手术上。通过可视化技术可以屏幕上看到手术整个过程,并将原来细节部位放大,手术医生观察的更加细致,手术成功几率也会大幅度提升,患者生命也能得到保证(如图3所示)。如在对某名患者进行身体检查的过程中需要应用到可视化技术,由于通过检查会获得大量数据,而这些数据又相对复杂,但在可视化技术下就可以通过图表、曲线图或立柱图的方式展示出来,经过可视化技术的作用,了解到患者的血糖为5.6mmol/L,医生可以根这一数据做出诊断,而不必再分析这些数据。据不完全统计,80%的医疗检查工作都是需要利用可视化技术。
地质勘探是我国最重要的工作之一,由于多数矿藏都深埋地下,即便使用探测仪受多种因素影响也无法了解到实际矿藏情况,这就需要应用到可视化技术,在可视化技术的作用下,相关工作人员可以了解到地下有无矿藏,如果存在矿藏,相关工作人员也可以了解到矿藏所在位置与实际储备量,进而为矿藏开采奠定基础。如在地质勘探中,相关工作人员利用可视化技术做地形图整理,然后从中提取地形数据,再用CATIA做导入,这样就可以完成地形模型创建,这样就完成了三维地质模型创建工作,同时在相关工作台的影响下,还可以完成地形数据导入,进而生成一定的地形云点,如果其中存在错误,可视化技术也可以将其中的错误内容删除,这些都是可视化技术所带来的好处[8]。由此可见,可视化技术已经成为地质勘探中不缺少的技术。
最后,在气象预报中的应用(如图4所示)。利用可视化技术能够将数据转化为图像,通过观察图像就可以了解到云层变化情况,同时也能了解到实际风力大小与风走向等,气象预报人员就可以根据图像做出精准分析,需要了解气象变化的人也能了解到现实情况,如果气象条件恶劣,相关工作人员也可以及时做出工作调整,减少危险事件的发生。据不完全统计,可视化技术在气象预报中的应用频率高达100%,由此挽回的经济损失高达13.2亿元,可见,可视化技术在气象预报中的应用十分有必要,因此,应重视可视化技术在气象预报中的应用。
4 结语
通过以上研究得知,计算机图形学、计算机视觉以及可视化技术三者各具特色,三者间也存在一定的关系,尤其是可视化技术综合了前两者的特点,并融合了其他技术,在很多领域中都有应用。可视化技术是现阶段应用最多的一种技术,在计算机图形学教学中也有应用,并发挥着不可替代的作用。本文分析了计算机图形学、计算机视觉以及可视化技术的含义与应用,希望能为相关人士带来有效参考,正确利用这些技术。
参考文献:
[1]陈敏雅,金旭东.浅谈计算机图形学与图形图像处理技术[J].长春理工大学学报,2011(01):138-139+146.
[2]柳海兰.浅谈计算机图形学的发展及应用[J].电脑知识与技术,2010(33):9551-9552.
[3]滑瑞朋.计算机图形学的应用及研究[J].山西科技,2012(05):37-38+45.
[4]刘涛,仲晓春,孙成明,郭文善,陈瑛瑛,孙娟.基于计算机视觉的水稻叶部病害识别研究[J].中国农业科学,2014(04):664-674.
[5]关然,徐向民,罗雅愉,苗捷,裘索.基于计算机视觉的手势检测识别技术[J].计算机应用与软件,2013(01):155-159+164.
[6]许志杰,王晶,刘颖,范九伦.计算机视觉核心技术现状与展望[J].西安邮电学院学报,2012(06):1-8.
关键词: 计算机视觉;快速开发;框架;模块化;模块耦合;底层剥离
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2012)29-7084-04
在视觉分析实际应用项目中,如何通过建立计算机视觉分析快速开发框架,搭建一个分工明确,快捷有效的图像学应用处理平台,提高开发效率,缩短开发时间,已成为项目开发人员关注的重点内容之一。本框架从项目应用和实际需求出发,将计算机视觉技术的核心算法从底层研究工作中剥离,可极大的缩短开发时间,提高开发效率。
在本框架下,开发人员可各司其职,分工、构成和职能划分明确,框架开发人员只专注于框架接口的定义;算法开发人员只专注于图像处理与识别等算法的开发;上层应用开发人员只负责抽取出一般的处理流程,专注于项目的具体实现和功能模块的组合应用。
1 研究与应用
1.1背景
计算机视觉是用摄像机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉。系统将获取的视频或图像资料,通过计算机处理成为更适合人眼观察或传送给仪器检测的图像,其中包括图像处理、模式识别或图像识别、景物分析、图像理解等相关内容,它们之间既有差别,又有相互重叠。
在计算机视觉分析技术中,对于一些复杂的问题,往往不是某单一学科能够解决的,它需要一系列相关技术的支持。例如:对航道中船舶的识别,获取的视频流往往要经过平滑、去噪等图像处理操作后,便于下一步运用基于直方图分类器的图像识别算法来区分船舶和水面,通过图像分割技术来提取检测目标。而这些方案的实现中,同一个问题的解决又往往需要有一系列的算法来支持。还是以船舶识别为例,图像平滑有领域平均、低通滤波等算法;图像去噪有各种滤波器算法;基于直方图的分类器也存在决策树、贝叶斯、SVM等等算法。虽然上述的算法本身没有优劣之分,但在特定的环境下一定会有某个最佳算法。
因此,在实际应用项目中如何找出其最优路径,除了需要开发者拥有深厚的图像学功底,更需要的是通过大量的对比实验来找出该最优路径的解决方案。即便如此,也只能解决特定环境下的计算机视觉需求,换个应用场景,上述步骤又需要重新进行,此类过程的重复,既增加了开发成本,又延长了开发时间。
本框架从工程化的角度出发,在不同项目中的计算机视觉软件开发中,研究如何提高开发结果的复用性,尽量降低上述各条件间的相互依赖关系,将视觉技术的核心算法从底层研究中剥离,达到缩短开发时间,提高开发效率的目的。
1.2研究目标
1) 框架系统的扁平化、模块化;
2) 完成处理过程的任意组合,使图像处理模块单一化;
3) 理行为在处理模块内部完成,处理结果可通过接口方式进行输出;
4) 处理模块间的数据流动定义在框架之中,框架负责配置数据流;
5) 置好的数据流,通过指定图像处理模块实现对物体的识别、行为的识别。
1.3.5框架的效果演示
从右侧功能区中选取两个输入模块:MediaOpen00和MediaOpen01,分别打开视频文件“.\公司监控视频.avi”和图片“.\Lena.jpg”,任意添加一些图像处理模块或者图像识别模块,这里我们选取了行人检测算法、基本全局阈值二值算法、人脸检测算法、轮廓检测算法,加入输出展示模块用于显示处理结果。最后我们用曲线将模块间的输入输出点连起来,完成数据流向的配置过程。其中一个输出点可以连接多个输入点,但一个输入点只能接入一个输出点。
2 结论
随着计算机视觉技术发展的日新月异,算法的更新和积累将会越来越多。计算机视觉快速开发框架从实际应用工程的角度出发,在不同项目计算机视觉软件的开发过程中,将视觉技术的核心算法从底层研究中剥离,使视觉分析应用项目中的框架开发人员专注于框架接口定义的开发,而项目中的算法、上层应用等开发人员各司其职,分工明确,不但提高了开发结果的复用性,同时,也降低了项目开发中各条件间的相互依赖关系,缩短了开发时间,提高了开发效率。
参考文献:
[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.
[2] 张广军.机器视觉[M].北京:科学出版社,2005.
[3] 张少辉,沈晓蓉,范耀祖.一种基于图像特征点提取及匹配的方法[J].北京航空航天大学学报,2008,34(5).
[4] 刘立,彭复员,赵坤,万亚平.采用简化SIFT算法实现快速图像匹配[J].红外与激光工程,2008,37(1).
[5] 戴斌,方宇强,孙振平,王亮.基于光流技术的运动目标检测和跟踪方法研究[D].国防科学技术大学机电工程与自动化学院.
[6] 陈胜勇,刘盛.基于OpenCV的计算机视觉技术实现[M].科学出版社.
关键词 模式分析 计算机视觉 教学改革
中图分类号:G643.2 文献标识码:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析与智能计算研究所师资团队是江苏省“青蓝工程”创新团队,主要研究领域包括智能数据分析、图像处理和机器视觉等方向,承担研究生和本科生的模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程的教学任务。以往的教学过程中虽然积累了丰富的教学经验,但当前新知识不断涌现、新技术发展迅猛,对模式分析与视觉处理课程群的知识体系、实践体系改进提出了新的挑战。
近年来,国内外高校在该类课程教学上,已涌现出众多新理念、新方法。Coursera联合创始人Andrew Ng推出的机器学习课程,开启了教育领域的MOOC时代,引领了教育教学方法的新革命。①深圳大学、②江苏科技大学③分别进行了基于CDIO工程教育理念的计算机视觉课程教学改革实践,实现多层次项目设计的教学模式改革,讲座式、讨论式、实践式教学方法的探索。国防科技大学④在计算机视觉课程中引入研讨式教学模式,通过案例教学、小组研讨的方式来替代传统的教学方式。华中科技大学⑤从教学内容国际化、教学方式国际化、教学成果国际化三个方面开展了计算机视觉课程的国际化建设。另外,也有高校进行了图像工程课程群建设,⑥基于图像分析与计算机视觉应用课程结合的项目协同创新能力培养实践。⑦
在分析上述国内外高校该类课程改革的基础上,我们重点以模式分析与视觉处理课程群的实践教学体系改革为切入点,优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
2 模式分析与视觉处理课程群特点
模式分析与视觉处理课程群涵盖了模式识别、机器学习、数据挖掘、数字图像处理、计算机视觉等多门课程。该类课程存在以下特点。
(1)该类课程属于多学科交叉,涉及的知识面既广又深。由于该方向涉及计算机科学与技术、应用数学、自动化、电子科学与技术、信息工程等多学科内容,而学生在大学本科阶段很难学习和了解如此多的知识模块,这对研究生阶段学习来说,具有相当大的挑战。同时,对于每个知识模块,所要求的数学基础较高,理论具有相当的深度,理解和掌握不容易。
(2)该类课程既重视扎实的基础理论,也强调良好的工程实践能力。该类课程的基础理论教学一直受到各高校的重视。随着近年来产业界的迅猛发展,计算机视觉应用层出不穷,对学生的工程实践也提出了更高要求,需要能够在系统层次上有整体认知,同时要能对各功能模块进行优化,提升系统的整体性能。
(3)该类课程所面向的选修学生面广。该类课程既是多学科交叉,也面向计算机应用、电子科学与技术、自动化、应用数学等不同研究方向、不同水平层次的研究生开设。这对课堂教学和实验实践也带来更大挑战。
3 模式分析与视觉处理课程群改革举措
针对上述分析的课程群特点,我们重点以实践体系改革为突破口,通过优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式等举措,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
3.1 师资队伍结构优化
为了学生能够适应模式分析与视觉处理产业的快速发展,在课程群建设过程中更强调学生的工程实践和创新能力培养。这首先对师资队伍结构提出了新的要求。
近年来,课程教学团队引进海内外具有深厚理论功底和较强工程能力的高水平师资4名,大大充实了机器学习、数据挖掘、图像处理等课程的教学力量。对于现有教师队伍,鼓励教师跟产业一线企业广泛合作,目前已与华为、中兴等企业在视频检索、智能交通视觉处理等方面开展了实质合作。这些来源于产业界的高质量课题对科研和教学起到了良好的促进作用。
与此同时,通过研究生工作站、企业短期实习等渠道,鼓励企业高级研发人员参与到学生实践能力培养环节中,将实际项目进行适当切分或提炼,实现该类课程实践环节的模块化、专题化训练。
综上,通过引培并举,优化校内师资队伍结构;通过校企合作,积极吸引企业师资参与。良好的师资队伍为该类课程的实践体系改革提供了有力支撑。
3.2 课程群知识体系梳理与授课模式改革
模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程既有一定的逻辑关系,也存在相互交叉的混杂关系。一般认为,模式识别、机器学习是模式分析与视觉处理领域的基础理论课程,数据挖掘是建立在模式识别、机器学习和数据库基础上的应用类课程,智能信息检索则是数据挖掘基础上更为具体的应用实现。数字图像处理为计算机视觉课程提供了基础支撑,计算机视觉则是在综合利用模式识别、机器学习、数字图像处理、数据挖掘等知识模块基础上面向应用的系统实现。但是,这些课程也存在着知识点的交叉或重复。例如,模式识别和机器学习中都有贝叶斯参数估计、支持向量机模型等知识点,但视角和侧重点有所不同;图像处理、计算机视觉中都有颜色模型、成像模型等知识点,也同时存在与模式识别、机器学习交叉的知识点。
我们针对来自不同研究领域的学生群体,对该课程群的知识点进行系统梳理,既避免知识点的重复讲授,也防止重要知识点的缺漏。课程教师集体讨论,形成每门课程的核心知识集,和针对不同研究领域的选讲知识集。学生在学习课程时,在掌握核心知识集的基础上,结合自己的研究方向选择相关的选讲知识集学习。
在课程教材和参考书的选择上,注重挑选国际上有影响力的教材。例如,模式识别的参考书为Richard O. Duda等人编著的Pattern Classification;机器学习的参考书为Tom M. Mitchell编著的Machine Learning和Christopher M. Bishop编著的Pattern Recognition and Machine Learning;数据挖掘的参考书为Jiawei Han等人编著的Data Mining:Concepts and Techniques;数字图像处理的参考书为K. R. Castleman编著的Digital Image Processing;计算机视觉的参考书为D. A. Foryth编著的Computer Vision: A Modern Approach和Richard Szeliski编著的Computer Vision: Alogrithms and Applications。这些教材已被国内外著名大学普遍采用。同时,每门课程都提供相关的国内外顶级会议和期刊的列表,供学生课后追踪研究领域的热点问题。
在课堂授课环节上,注意采用灵活多样的授课方式。对于核心基础知识模块,以教师讲授为主,同时提供国内外该类课程的热门MOOC网址给学生参考。对于选讲知识模块,鼓励学生事先结合各自研究方向有目的自学,在学生报告的基础上进行课堂讨论方式进行。充分发挥学生学习的主体作用,也便于教师了解学生的水平和学习状况。
除此以外,不定期邀请国内外著名学者来校做学术报告,让学生充分了解该研究领域的最新前沿动态,并就热点问题进行专题讨论。
3.3 课程群实践体系完善与考核方式改革
工程实践和创新能力的培养是该课程群改革的重要目标。我们在上述师资队伍结构优化、课程群知识体系梳理与授课模式改革的基础上,着力进行课程群实践体系的改革与完善。我们通过多层次菜单式的实验项目选择、项目牵引的创新能力训练、学生综合研究能力的全面考查等方面来实现。
首先,整合和优化课程群实践内容,实现多层次菜单式灵活选择。根据各研究领域的要求进行灵活搭配,根据学生个体的能力与水平选择适当规模和难度的实践内容,通过课程内的基础实验、课程间的综合实验、课程群的创新实验来选择和组合,如图1所示。
图1 多层次菜单式实验内容示意图
基础型实验内容主要是各课程核心知识点的实验验证,主要包括模式识别,机器学习,数据挖掘,图像处理与分析,计算机视觉等课程的实验。要求选课学生对这些基础实验必做,打下良好的研究基础。
综合探索型实验在基础型实验基础上,既有单门课程内总的综合实验,也有课程间知识的综合应用。主要分为两大块,包括模式分析与机器学习方向的综合实验,以及图像处理与机器视觉方向的综合实验。实验目的主要是针对这两大块方向重点知识的综合分析和比较,能够熟练掌握和灵活应用。例如模式分析、机器学习、数据挖掘等方向都用到的线性判别分析、支持向量机、均值聚类等内容;图像处理与机器视觉中的图像特征抽取、视觉系统选型、目标检测、特定平台的算法优化等内容。学生可根据各自研究方向有目的的选择两块综合实验的大部分内容。
在综合型实验基础上,该课程群通过若干创新型实验来检验学生理论知识掌握程度和实践方法应用能力,为后续的研究课题开展打下良好的科研素养。主要内容包括人脸识别、二维条码识别、车辆属性识别、智能视觉监控、以及企业来源的关键技术等。这些项目实践既涉及用到图像处理与机器视觉的内容,也涉及模式分析与机器学习方向的知识。并且需要学生在综合运用相关知识的基础上有创新能力。
其次,重视各类项目牵引的创新能力训练。一方面,鼓励教师从国家自然科学基金、企业合作项目等研究中提炼出问题规模和难度适中的训练项目,作为课程群的综合能力训练项目。另一方面,鼓励学生参加挑战杯、全国研究生智慧城市技术与创意设计大赛等各类具有挑战性的竞赛项目,以赛代练,提升学生的工程实践和创新能力。同时,也鼓励学生利用百度、微软等相关研究领域的企业实习机会,参与产品一线的工程实践能力训练。
再次,注重考核环节,实现科研素养和实践能力的全面考查。只有严格、公平、公正的考核,才能保证实验实践的质量和水平,才能提升学生的科研素养和实践能力。我们主要在手段、方式方法上进行了改进。在题目选择上,根据学生个体水平和研究领域要求的差异,在选题上有适当的难易区分度,让每位学生都有锻炼和提升的机会;在考核方式上,采用结题书面报告来检验学术论文的写作能力,采用程序演示检验系统的设计与实现水平,采用上台汇报的方式检验学生的表达能力,多管齐下全面检查学生的综合科研素养;在考核成绩评定上,采用现场教师和学生共同评分的方式,公平合理;最后,通过网站展示、发表学术小论文、专利、软件著作权等方式展示和公开优秀成果,激发学生的学习热情,并由此形成积累,有利于学生实验实践氛围的传承。
4 结语
本文在分析国内外高校模式分析与视觉处理类课程群改革现状的基础上,以学生国际化视野、理论联系实际、工程实践和创新能力全面提升为目标,重点开展了师资队伍结构优化、课程群知识体系梳理、课程授课模式改革、课程群实践体系完善和实践考核模式改革等工作,取得了良好的效果,并为校内其他课程群的教学改革作为示范推广。
注释
① https:///learn/machine-learning/
② 郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践.理工高教研究,2010.29(5):98-100,148.
③ 史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践.计算机教育,2013.9:40-43.
④ 陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式.当代教育理论与实践,2013.5(7):112-114.
⑤ 王岳环,桑农,高常鑫.计算机视觉课程的国际化教学模式.计算机教育,2014.19:101-103.
关键词:三目摄像机;标定;立体视觉;外部参数
一、绪论
1.1研究的背景及意义
计算机视觉是当今极为重要的学科之一,它在具有很强的挑战性的同时又拥有广泛的应用前景和实用价值。计算机视觉以视觉理论为中心,以图像处理、模式识别、计算机技术和生理学、心理学为基础,研究内容主要有两个方面:一是开发从输入图像数据自动构造场景描述的图像处理系统;二是理解人类视觉机理,用机器代替人去做人类难以达到或根本无法达到的工作[1]。
计算机视觉应用的广泛性体现在其不仅用于文字、指纹、面部、商标以及图像数据库、检测集成电路芯片、多媒体技术这些图像方面,还应用到机器人导航、工业检测和产品的自动装配、CT图像器官重建和遥感照片解释等空间物体的定位、识别以及重建上。现如今,计算机视觉已经应用到机器人、地理、医学、物理、化学、天文等各大的研究领域。
作为多个学科交叉与融合中心的计算机视觉,摄像机是其研究的重要工具,而摄像机标定又是计算机视觉研究的一个关键问题,故摄像机的标定越来越受到广泛的重视。摄像机标定是通过物体空间上的点与图像中的对应点的几何关系,来确定摄像机的内外参数的过程。标定结果是否准确影响着三维测量的精度和三维重建的结果,而且实时的标定更能满足自动导航机器视觉的需要[2]。
伴随着应用的发展,摄像机广泛地被应用于三维立体的测量、视觉检测、运动检测等领域。由此,对摄像机标定的精度要求也日益增加。摄像机标定结果的优劣影响了计算机视觉在各领域的应用。摄像机标定的准确与否,对能否提高计算机视觉在各领域测量的准确度有重要影响[3]。因此,研究摄像机标定方法具有重要的理论研究意义和实际应用价值。
1.2摄像机标定技术研究的发展及现状
摄像机有一个图像平面和提供三维空间到图像平面转换的镜头。由于镜头会产生畸变,不能把这个转化过程简单描述为投射变换。所以它表示的是畸变的模型,这些模型近似于真实数据,而其精确性则依靠于建立的模型及模型参数的准确性。
首先进行摄像机标定工作的是加拿大的Deville,他于1910年建立实验室,使用多个瞄准仪对他的“测量摄像机”(surveying camera)进行标定[4]。上个世纪三十年代后期,美国标准局发明了一种精确镜头,用来检测摄像机,同时将它用在摄像机标定上。四十年代后期,该项工作得到进一步加深,有了更多对高精度的需求和对易操作设备的需求。1955年,Carman出版了 《棋盘平面度的干涉测量和控制》,该书引起了社会各界对摄像机标定的关注。二战时期,随着飞机的大规模使用,航空摄影与制图兴起,为得到更加精确的测量结果,对摄像机镜头的校正要求也变得更高。五十到七十年代也是镜头校正技术发展最为迅速的时间段。在这期间,各种镜头像差的表达式逐步被提出并且得到普遍认同与采用,建立了很多的镜头像差的模型,D.C.Brown等人作出了比较大的贡献,他们导出了近焦距情况下给定位置处径向畸变表达式并证明了近焦距情况下测量出镜头两个位置的径向畸变就可以求出任何位置的径向畸变[5]。这些径向与切向像差表达式成为后来各摄像机的标定非线性模型的基础。这段时间里,研究的重点是如何校正镜头与用何种方法补偿镜头像差,这些研究对促进各性能镜头组的研制起到了重要作用。在1999年,张正友提出了一种简便的摄像机标定方法,该方法介于传统标定和自标定之间,操作方便灵活,能够得到不错的精度,满足了众多拥有桌面视觉系统的用户在摄像机标定方面的需求。
1.3本文的主要研究内容
本文的主要研究多个摄像机的标定问题。标定主要是对摄像机内外参的测量计算,利用这些参数对多个摄像机识别的物体尺寸进行衡量并建立起多摄像机系统的数字环境。
论文的内容包括:
第一章为绪论,介绍摄像机标定相关的研究背景、国内外研究现状。
第二章为摄像机标定理论基础:主要介绍标定的坐标系与待标定的参数。
第三章提出本文的多摄像机标定方法与实验过程。
第四章进行全文的总结。
二、摄像机标定方法研究
2.1摄像机标定原理
摄像机通过透镜将三维物体投影到--维图像平面上,这个成像变换的过程称为摄像机成像模型。摄像机成像模型有多种,最常用的为小孔成像模型。由于实际的摄像机镜头会发生一定的畸变,使得空间点所成的像不在线性模型描述的位置而会发生一定的偏移,为了能准确的标定摄像机参数,标定的过程中要考虑非线性畸变因子。
一般来说,得到标定结果后要对其精度进行评估,然而很难得到准确的摄像机标定参数真值作为参考,其中基于图像坐标和世界坐标的绝对和相对误差的评价方法应用广泛,本文将对这些方法的原理进行探讨。
2.2摄像机标定坐标系建立
首先定义了四个坐标系,如图1所示,图像坐标系的坐标原点为O0,列与行由坐标轴u和v表示;成像平面坐标系的原点是摄像机光轴与图像坐标系的交点0l,x、y 轴分别与u、v 轴平行;在摄像机坐标系中,坐标原点0c即为在摄像机的光心,Xc、Yc轴与x、y 轴平行,与图像平面垂直是摄像机光轴作为Zc轴,0c0l为摄像机焦距f;世界坐标系是假想的参考坐标系,可固定于场景中某物体上,用于描述摄像机的位置,由Xw,Yw,Zw轴组成。
图(1)
2.3摄像机外部参数构成
主动视觉传感器从在笛卡尔直角坐标系中的运动表现为相应的旋转矩阵和平移矩阵,故摄像机外部参数表现为旋转矩阵R和平移矩阵T,则摄像机坐标系与世界坐标系的转化关系可以表示成:
上式中(Xc,Yc,Zc)表示空间点在摄像机坐标系下的坐标,(Xw,Yw,Zw)表示空间点在世界坐标系下的坐标。根据靶标点在像空间坐标系和物方空间坐标系中的坐标,通过分解旋转矩阵线性计算像空间坐标系与物方空间坐标之间的转换参数,即外方位元素(摄站参数)[6]。
2.4各摄像机相对位置确定
三目摄像机拥有三个视觉传感器,而三个传感器之间的相对位置可通过已获得的外部参数进行确定。将三个摄像机坐标系设置为,Oci xci yci zci(i=1,2,3),由2.3中所介绍的内容可知,这三个摄像机坐标系与世界坐标系的关系为:
i=(1,2,3)
由此我们可以得到任意两个摄像机i,j的坐标系转换关系:
其中: = = i,j=1,2,3
三、摄像机标定实验过程及结果
3.1实验系统介绍
实验中被用来标定的是一个多摄像机系统,摄像机标定有关的基本参数、系统组成和开发环境如下:
(1)硬件环境
标定板、三目摄像机和图像采集卡等。
(2)软件环境
OpenCV开源视觉库,它仅由一系列C函数和少量C++类构成,为Python、MATLAB等语言提供了接口,在图像处理和计算机视觉方面实现了很多通用算法。
3.2实验过程
本系统以棋盘格模板作为标定模板。采用激光打印机打印棋盘格黑白方块间隔纸,方块边长为3cm,共6行9列,将打印纸固定在一块平板上,作为标定模板,如图(2)。安装三目摄像机系统,调节固定好个摄像机位置,如图(3)。手持标定板在三目摄像机前方各个位置拍摄5组共15张各姿态的照片,利用Canny算子进行像点灰度中心提取、同名像点匹配并解算出三个摄像机在标定板坐标系中的外部参数值。
3.3标定结果
摄像机1:
R= T=
摄像机2:
R= T=
摄像机3:
R= T=
四、总结
随着计算机技术的高速发展,计算机视觉成为当今热门的研究课题,受到了广泛关注。本文就如何在机器视觉的理论基础上对三目视觉系统进行标定进行了研究,讨论了计算机视觉理论知识,分析摄像机标定原理以及标定坐标系的建立。同时通过计算机视觉知识的分析讨论了基于三目视觉系统的摄像机标定技术,完成了三目视觉系统的外部参数标定实验。三目摄像机测量系统外部参数的标定能够解决测量作业现场、测量控制场建立难的问题,为快速地建立简单实用的控制场提供了方案,有一定的实用价值。
参考文献
[1] 荆丽秋.双目视觉系统标定与匹配的研究与实现[D].哈尔滨工程大学,2009.DOI:10.7666/d.y1489086.
[2] 马颂德.计算机视觉―计算理论与算法基础[M].北京:科学出版社,1998.
[3] 王荣一.摄像机标定及关键技术研究[D].哈尔滨理工大学,2011.DOI:10.7666/d.y2012483.
[4] Clarke T A,Fryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66
[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.
[6] 范亚兵,黄桂平,高宝华等.三目立体工业摄影测量系统外部参数的快速标定[J].测绘工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013
关键词:计算机视觉分析;微小尺寸;精密校正;阈值;图像分割
中图分类号:TP274.4
计算机视觉分析理论是基于精密模式识别和人工智能程序化校验技能进行综合整编的方法,利用光学信息对真实物理结构的实时反映,配合人机协调手段进行二维图像的呈现。在工件表面进行质量检测和图片制备要素分析的系统环节中,阐述物体在空间环境之间的关系样式,争取三维场景的科学搭建。集合要素内容包括边缘、线条和曲面的配备,建立以工业部件为中心的坐标体系,并适当运用不同符号表现模式实现必要三维结构和空间关系的调整,促进精密仪器细节检验工作质量的不断提高。
1 计算机视觉检测技术的相关理论研究
1.1 技术原理分析
渗透性计算机辅助支持结构的视觉鉴定技术在被测实体中的图像显示支持功能基础形势上进行质量状况的把控,这其实就是根据既定的偏差标准实现规模物件的逐个排查。细致的检测工作在深度零件的诱导性特征和完整性配件的支持下,对整体完好效果的几何制备模型进行测量[1]。近阶段的视觉规范系统利用电耦合器件和摄像机进行主题元素的捕捉,并利用计算机内部程序的数字信号转化工具实现图像的并行处理。采用目标图像的特殊坐标记录,利用灰度分布图内的多种综合功能处理系统改善的要务。常规视觉下的检测过程相对比较繁琐,主要是将被检测物体放置于照明效果相对均匀的可控制背景环境中,联结CCD技术和图像卡实现被测部件和数字图像的共性要素融合,保证计算机自动化处理程序的录入。当然,这类研究系统是需要利用相关软体进行放大的,其主要必备功能就是进行图像的预处理、识别和有效分析,将整个过程内部的实际结果数值,包括被测部件的自身缺陷、尺寸等进行整理。
1.2 计算机视觉微小尺寸精密检测工业应用技术的现状
在科学设计信息内容和工业加工制备要领集成化对待的环节中,通常不会直接进行部件表面的接触,一般运用计算机程序下的扫描认知和图像即时呈现功能进行快速的比对检测,整体信号抗干扰能力较强,因此在现代工业生产技术领域内部广受好评。电子工业是在建立计算机视觉分析工艺之后表现最为活跃的行业类型,在此基础上衍生的印刷电板路和集成电路芯片就是利用标准模型的整改,实现规模工序的紧密排列。目前,时下流行的汽车生产、纺织、商品包装等也逐渐向这类手段靠拢,全面改善了现代化工业制备的应用效果。
2 应用视觉微小尺寸分析技术内部拓展机能的补充
灰度图像的主要分割方法包括灰度阈值校正、边缘检测制备等手段。
2.1 灰度阈值校正
这是区域分割方法中一种常见的手段,主要配合多个或单个阈值将图像自身的灰度级别划分为几个项目组,对相同像素的单位数据进行整编。根据实效范围进行分类,包括局部和全局阈值探究两种手段,全局规模下的阈值分析方法就是利用整幅图的灰度直方分布图进行内部最优阈值分割,包括单阈值和多阈值两种形式;同时还可以将初始分析的图像进行子元素的拆解,之后利用单个子图像的既定阈值范围进行最优化分割[2]。分割的基本原理公式为:
其中,合理阈值的选取是非常重要的,目前阈值确定的手段主要包括直方图双峰对照法和最大类间方差累积法等。这种利用灰度阈值实现精准质量的划分手段,计算执行工作相对比较简单,并且实际工作效率水平较高,即便是实际需要分割的物体与图像背景对比深度较强也可以收放自如,但唯一的缺点就是缺少对空间信息的掌控,涉及亮度不足的图像问题,这种阈值分割技术的施工质量往往不会太高。
2.2 边缘检测制备工序
图像内部元素的分割其实就是进行部件边界效益的提取,而边缘检测制备工序则是利用像元及邻域的整体状态进行物体边界相关结构的搭建。边缘检测分割制备技术具体包括并行和串行两种模式,并行手法是运用梯度信息的提取实现不同类别算子的整理;串行边界分割原理则是根据适当强度标准和相似走向的两个边缘端点位置实现连接,主要代表算法包括启发式智能搜索手段等。这种串行算法较并行边界积累统计原则来说具有更强的抗干扰能力,但实际的边缘检测同样不能完好地维持连续效果,需要利用其余技术内容进行边缘制备技巧的修复。
(1)原始图像 (2)Robert算子边缘检测 (3)Sobel算子边缘检测
(4)Prewitt算子边缘检测 (5)Kirsch算子边缘检测 (6)Gauss-Laplace算子检测
图1 微小双联齿轮边缘检测
3 视觉检测系统的创新性改进
根据以上现状问题,创新式视觉整改校验系统利用照明光源、摄像机和图像采集卡等结构实现计算机输出结果质量的补充。其主要运行过程如下:利用被测部件在均匀照明背景的全面优化控制基础,实现物体结构的全面清晰呈现,使用摄像机对相关图像信号进行梳理并转化为电荷信号,配合相关的图像资源采集卡进行部件数字化图像的格式转化;计算机内部软体操作程序将得到的数字图像进行处理和识别,并将最终结果数据输出,实现现代工业技术整体质量规模控制的既定要求。
系统硬件在实现部件转化图像信息的环节中,连接检测机理下的连续软件规划和照明光源等相关设备进行图像适当分辨率的调整,维持图像较为清晰的对比效果。全面控制获取数字图像的时间,抵抗不良因素的干扰影响,维持内部成本经济规模的合理控制,促进科技应用和可持续发展经济战略双重价值标准的同步进展。其中,光源设备的选择必须落实到部件既定的几何形状条件下,利用相关性能参数进行实际工作要求的提供,包括光源位置、亮度、寿命特性等因素的堆积,常用的可见光源包括水银灯、荧光灯等,但这类光源使用寿命有限,因此现下多配用LED光源进行快捷反应、小功耗标准的补充,并且长期使用后的照明效果比较稳定[3]。而摄像机等结构主要还是校正参数的表达方式,进行图像合理分辨率的整改,促进图像采集数字化协调功能的发展,提高系统工作速度等。
4 结束语
计算机视觉检测系统在进行一定部件性能评比的活动中有着很高的贡献,不仅配合硬件的照明、参数制备要领制备功能,同时促进数字化图像对比的速度,使得工业生产环节中的部件检查工序得到大范围整改,满足可持续发展战略规模的视觉意义,促进现代智能化分析处理技术的全面覆盖。
参考文献:
[1]陆春梅.基于数字图像处理技术的接杆激光环焊焊缝视觉检测系统研究[D].上海交通大学,2008.
[2]罗敏.基于机器视觉的黑片缺陷检测图像边缘提取算法研究[D].沈阳理工大学,2010.