欢迎来到易发表网,期刊咨询:400-808-1701 订阅咨询:400-808-1721

关于我们 期刊咨询 科普杂志

匹配算法论文优选九篇

时间:2023-03-08 15:32:04

引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇匹配算法论文范例。如需获取更多原创内容,可随时联系我们的客服老师。

匹配算法论文

第1篇

【关键词】深度挖掘匹配算法 毕业论文管理 应用

在毕业论文管理工作不断加强的情况下,注重管理模式的更新和合理选用,提高匹配算法的针对性,才能真正提高高校教务管理水平。因此,对深度挖掘匹配算法在毕业论文管理中的应用有比较全面的了解,才能为高校教务管理工作提供可靠参考依据。

1 深度挖掘匹配算法的相关分析

根据深度挖掘匹配算法在毕业论文管理中的应用情况进行全面分析来看,其主要包括如下两个方面:

1.1 志愿自动匹配算法的相关分析

对学生和课题的选择关系进行合理分析可知,两者的最优、最大匹配,最好是根据学生的实际情况量身定做,才能真正实现课题与学生的最完美匹配。因此,教师提出相关题目时,需要对学生的情况、特性和要求等进行全面分析,才能在学生对课题的特性、关联性等有一定了解的情况下,提高课题与学生的匹配概率,最终让学生选定最合适的课题。在实践过程中,志愿自动匹配算法的合理运用,需要根据毕业论文的管理流程,从教师出题开始。一般情况下,教师应该先提出大题让学生自由选择,在匹配学生确定好以后将大题分成几个小题,从而将每个小题分配给合适的学生。在这种情况下,教师设定的课题需要从修读课程达到的分数、难度、所属类别等多个方面确定,并从教务管理系统中获取学生的成绩和选题积分点等,才能根据分数线来判定学生是否符合相关选题。其中,选题的难度在简单、一般、难、很难和非常难几个等级,对应的成绩是及格、良好、优秀、极好。在实际进行选题时,学生可以根据自己的情况选择三个题目作为志愿,以在系统完成匹配后,自定将题目下发给学生。在实践过程中,初始化志愿显示的是学生的第一志愿,在经过while、if、else、break、continue等流程后,系统会将题目和学生进行适当分类,以确保题目与学生的匹配最合理、最科学。由此可见,志愿自动匹配算法是优先对具有课题相关能力的学生进行匹配的,在学生人数低于匹配数量的情况下,可继续为积分点高、能力稍差的学生进行匹配,对于确保课程成绩与积分点的完美结合有着极大影响。

1.2 调剂学生算法的相关分析

在经过上述算法进行匹配后,根据学生的实际情况进行深层挖掘,可以实现课题与剩余学生的完美调剂。因此,对上述阶段中匹配失败的学生志愿所选的教师、课题类别、难度等因素进行深度挖掘,并将搜索结果作为匹配课题的依据,才能在缩小搜索范围的情况下,找到与剩余学生最合适的课题。如果出现相近课题较多的情况,则需要有学生、工作人员共同协商,以确定最终和最适合学生的课堂。在实践应用中,调剂学生算法的运用需要对需要调剂的学生进行合理分析,并通过if、else、return、while、continue、else等多个流程,才能真正匹配出最适合学生的课题。

2 深度挖掘匹配算法在毕业论文管理中的实际应用

根据深度挖掘匹配算法的实际应用来看,在毕业论文管理中学生可以了解到最适合自己的课题信息,教师可以根据学生的积分点和成绩等确定课题,从而避免选择某一课题的学生过多或过少的情况出现,对于提高第一志愿自动匹配成功率有着极大作用。因此,在实际应用中,注重教师、课题类别、难度的合理设定,确保它们的排序科学,将课堂与学生的匹配关系看作是二分图,并且,每个学生可以选择的课题有三个,系统可以根据学生的实际情况进行自动匹配,最终深度挖掘与学生志愿匹配的课题。例如:志愿自动匹配和调剂学生的总数都为102人,通过深度挖掘匹配算法匹配成功的人数分别为72人和90人,成功率达到了70%、88%。在不使用任何算法进行匹配的情况下,两者的成功率是52%左右。由此可见,在毕业论文管理系统中,深度挖掘匹配算法在科学应用,可以为教务管理工作提供可靠参考依据,对于提高毕业论文管理工作人员的工作效率有着重要影响。

3 结语

综上所述,在深度挖掘匹配算法不断推广的情况下,其在毕业论文管理中的实际应用受到了很多教务管理工作人员的青睐。因此,充分发挥深度挖掘匹配算法的作用,提高深度挖掘匹配算法在毕业论文管理中的应用效果,才能更好的满足学生的选题需求。

参考文献

[1]冯丽慧,冯立智.数据挖掘在毕业论文成绩管理中的应用研究[J].电脑知识与技术,2012,30:7150-7153.

[2]徐章韬.用信息技术深度挖掘课程内容――以数学学科为例[J].教育发展研究,2015,12:29-33.

[3]连伊娜.深度挖掘高校档案文化内涵,更好为教育事业发展服务[J].黑龙江史志,2013,11:104-105.

作者简介

刘冰洁(1983-),女,江西省南昌市人。工程硕士学位。现为江西交通职业技术学院副教授。研究方向为大数据、系统集成、智能化技术。

第2篇

>> 算法与模型 快速图像匹配算法及其水下导航应用 刍议华帝战略选择与匹配 入侵检测模式匹配算法的研究与改进 论文相似度匹配算法的研究与实现 字符串匹配算法比较与分析 正向最大匹配分词算法的分析与改进 基于模拟退火算法的P2P借贷平台的债权匹配模型 基于轮廓特征点的三维模型相似性匹配算法 一种基于语言学特征的本体匹配改进算法 动作与音乐的节奏特征匹配模型研究 基于SIFT算法与RANSAC算法的X射线图像匹配研究 电影语言与影片风格的匹配问题 基于启发式算法的品牌模型的选择 软件可靠性模型选择的SRMS算法 双目立体视觉区域局部匹配算法的改进及其实现 软件工程过程模型及其选择 混合Copula模型选择及其应用 模式匹配查询算法研究 指纹快速匹配算法研究 常见问题解答 当前所在位置:l 德国

[4]

ZAKI T, ESSAADY Y, MAMMASS D, et al. A hybrid method ngramsTFIDF with radial basis for indexing and classification of Arabic document [J]. International Journal of Software Engineering and Its Applications, 2014, 8(2): 127-144.

[5]

SIDOROV G, VELASQUEZ F, STAMATATOS E, et al. Syntactic dependencybased ngrams as classification features [C]// MICAI 2012: Proceedings of the 11th Mexican International Conference on Artificial Intelligence, LNCS 7630. Berlin: Springer, 2013: 1-11.

[6]

YI Y, GUAN J, ZHOU S. Effective clustering of microRNA sequences by ngrams and feature weighting [C] // Proceedings of the 2012 IEEE 6th International Conference on Systems Biology. Piscataway: IEEE, 2012: 203-210.

[7]

BOURAS C, TSOGKAS V. Enhancing news articles clustering using word ngrams [C] // DATA 2013: Proceedings of the 2nd International Conference on Data Technologies and Applications. London: dblp Computer Science Bibliography, 2013: 53-60.

[8]

GHANNAY S, BARRAULT L. Using hypothesis selection based features for confusion network MT system combination [C] // EACL 2014: Proceedings of the 3rd Workshop on Hybrid Approaches to Translation (HyTra). Stroudsburg: Association for Computational Linguistics, 2014: 2-6.

[9]

SIDOROV G, VELASQUEZ F, STAMATAOS E, et al. Syntactic ngrams as machine learning features for natural language processing [J]. Expert Systems with Applications, 2014, 41(3): 853-860.

[10]

HAN Q, GUO J, SCHTZE H. CodeX: combining an SVM classifier and character ngram language models for sentiment analysis on Twitter text [C]// SemEval 2013: Proceedings of the Second Joint Conference on Lexical and Computational Semantics (*SEM), Volume 2: Proceedings of the Seventh International Workshop on Semantic Evaluation. Stroudsburg: Association for Computational Linguistics, 2013: 520-524.

http://p.nus.edu.sg/~antho/S/S13/S13-2086.pdf

[11]

BESPALOY D, BAI B, QI Y, et al. Sentiment classification based on supervised latent ngram analysis [C] // CIKM 11: Proceedings of the 20th ACM International Conference on Information and Knowledge Management. New York: ACM, 2011: 375-382.

[12]

MILLER Z, DICKINSON B, HU W. Gender prediction on Twitter using stream algorithms with ngram character features [J]. International Journal of Intelligence Science, 2012, 2(4A): 143-148.

[13]

WRIGHT J, LLOYDTHOMAS H. A robust language model incorporating a substring parser and extended ngrams [C] // ICASSP 1994: Proceedings of the 1994 IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington, DC: IEEE Computer Society, 1994: 361-364.

[14]

HACIOGLU K, WARD W. Dialogcontext dependent language modeling combining ngrams and stochastic contextfree grammars [C] // ICASSP 2001: Proceedings of the 2001 IEEE International Conference on Acoustics, Speech, and Signal Processing. Washington, DC: IEEE Computer Society, 2001, 1: 537-540.

[15]

SIU M, OSTENDORF M. Variable ngrams and extensions for conversational speech language modeling [J]. Speech and Audio Processing, 2000, 1(8): 63-75.

[16]

ZHOU S, GUAN J, HU Y, et al. A Chinese document categorization system without dictionary support and segmentation processing [J]. Journal of Computer Research and Development, 2001, 38(7): 839-844. (周水庚,关佶红,胡运发,等.一个无需词典支持和切词处理的中文文档分类系统[J].计算机研究与发展,2001,38(7):839-844)

[17]

GAO Z, LI X. Feature extraction method based on sliding window application in text classification[J]. Science & Technology Information, 2008(34): 23-24. (高振峰,李锡祚.基于滑动窗口的特征提取方法在文本分类中的应用[J].科技信息:学术版,2008(34):23-24.)

[18]

PENG H, LONG F, DING C. Feature selection based on mutual information: criteria of maxdependency, maxrelevance, and minredundancy [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(8): 1226-1238.

第3篇

关键词:文献检索;快速排序;分治;字符串匹配;时间复杂度

中图分类号:TP391.9 文献标识码:A 文章编号:1009-3044(2014)02-0305-03

伴随网络技术的发展,网络信息大量增加,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库应运而生,如万方数据库、百度文库、维普数据库等,文献存储容量近百万篇。如何有效搜集发现信息,并对信息提取、组织、处理,就需要寻找出高效算法,降低计算复杂度,提高运算效率,以适应文献资源的迅速扩充[[1]]。

1 文献资料搜索引擎技术特点

当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的信息,便采用特殊的算法,根据文献中关键词的匹配程度,如出现的次数、频率等计算出各文献的排名等级,然后根据关联度高低,按顺序将这些资源接返回给用户。

与网络搜索引擎不同,因用户需求为数据资料而非网络资源,因此文献检索主要依据为相关关键词、内容的相关度等,对域名、外链等因素考虑较少。可利用关键词匹配算法,计算出各文献特征值,以特征值作为依据,对检索文献排序删选,满足用户需求。为便于理解,该文利用词频和位置加权算法计算特征值,采用快速排序算法进行整理输出,数据库可高效检索出与用户需求匹配程度较高的文献[[2]]。

2 快速排序算法规则及性能分析

快速排序是由托尼·霍尔于1962年(Tony Hoare)所发展的一种递归排序算法,采用分治的思想。在平均状况下,排序 n 个项目需要Ο(n log n)次比较。

其算法规则可表述为:

3 算法设计与仿真

首先建立包含十五篇文献的资料库,根据用户需求,随机输入关键词,在此可将关键词视为子串,对各文献进行字符串匹配操作。文献为A串,即目标串,关键词为B串,即模式串。若A串中存在和B相等的子串( 若干连续的字符组成的子序列) ,则匹配成功,,否则,称匹配不成功[[3]]。

匹配过程如图2所示,将模式串设置为滑动窗口。在第一次匹配过程中,第三个字符出现不相同情况,此时根据KMP算法原则,利用已经得到的部分匹配的结果,将模式串窗口向后滑动一段距离后,继续进行比较[[4]]。

参考文献:

[1] 张兴华.搜索引擎技术及研究[J].现代情报,2002(2):142.

[2] 黄知义,周宁.几类搜索引擎的原理剖析、比较研究及发展趋势探讨[J].图书馆学研究,2005(3):61-62.

[3] 李静.字符串的模式匹配算法[J].青岛化工学院学报,2002(2):80.

[4] 俞文洋,张连堂,段淑敏.KM P模式匹配算法的研究[J].郑州轻工业学院报,2007(5):65.

[5] 黄德才,戚华春.PageRank算法研究[J].计算机工程,2006(2):145-146.

[6] 王奇才,宋国新才,邵志清.信息检索中基于链接的网页排序算法[J].华东理工大学学报,2000(5):456.

第4篇

关键词:入侵检测;免疫原理;r连续位匹配;检测集生成

中图分类号:TP18文献标识码:A文章编号:1009-3044(2012)26-6348-03

Network Intrusion Detection Based on Immune Theory

WU Xiang1, HAN Liang2

(1.Naval Headquarters, Beijing 100841, China; 2.The East China Sea Fleet of Navy, Ningbo 315122, China)

Abstract: After analysis of the immune algorithm characteristics, the metaphor mechanism which is associated with the intrusion detection is extracted and studied in-depth. And then on the basis of artificial immune system, intrusion Detection system based on immune mechanism is built and the definition of system self and system non-self, immune matching rules set, and also the generation and life cycle of the immune detector are explained. Finally, the model is validated by the simulation experiments. The establishment of the immune intrusion detection system and the simulation work is the cornerstone of this research.

Key words: intrusion detection; immune theory; r contiguous bits matching; detector set generation

人体的免疫系统功能是通过大量不同类型的细胞之间的相互作用实现的[1-2]。在这些不同类型的细胞主要作用是区分“自体”和“非自体”。“自体”是指人体自身的细胞,而“非自体”是指病原体、毒性有机物和内源的突变细胞或衰老细胞。淋巴细胞能对“非自体”成分产生应答,以消除它们对机体的危害;但对“自体”成分,则不产生应答,以保持内环境动态稳定,维持机体健康。

可以看出入侵检测系统和免疫系统具有一定程度的相似性。对于一个入侵检测系统,特别是网络入侵检测系统,免疫系统的组成、结构、特征、免疫机理、算法等都为入侵检测系统设计有着重要的借鉴意义。它们要解决的问题都可以被描述为:识别“自体”和“非自体”,并消除“非自体”。

1自体和非自体的定义

计算机安全的免疫系统保护的是计算机系统的数据文件,所以将“自体”定义为计算机中合法的数据,这些数据包括合法用户、授权活动、原始源代码、未被欺诈的数据等;将“非自体”定义为其它一切非法数据,这些数据包括自身遭受非法篡改的数据、病毒感染的数据以及外来数据等。

2免疫匹配规则

在计算机中,所有的数据都是以二进制来表示的,这就表明在进行仿真的过程中,使用免疫匹配规则的对象都应该是针对二进制字符串的,因此需要采用二进制的匹配算法。采用何种二进制字符串的匹配算法,这是一个十分关键的问题,因为只有采用了合适的匹配算法,才能有效的构造免疫检测器集[4]。目前有很多的近似匹配算法,如r连续位的匹配算法、海明距离匹配算法等。r连续位匹配规则能更好地反映抗体绑定的真实提取,即能更真实地反映检测器字符串与被检测字符串的匹配情况,所以它比海明匹配规则更常用,因此文章采用r连续位的匹配算法。

r连续位的匹配规则可以描述如下:对于任意的两个字符串x,y,如果两个字符串x,y在相应位置上至少连续r位相同,那么这两个字符串是r连续位匹配的,即Match(x,y)|r=true。例如,如果设定r=5,字符串x=“10111010”和字符串y=“11011010”,由于它们在相应位置4-8位上都为“11010”,因此这两个字符串是匹配的。

在训练阶段,首先随机生成候选检测器集合,然后让候选检测器与自体集进行匹配,这个过程也叫阴性选择过程。在匹配的过程中,那些与与自体集相匹配的候选检测器就被丢弃,而不与自体集匹配的候选检测器则作为成熟检测器,存储于检测器集合中。

[1] Oscar A,Fabio A G, Fernando N,et al.Search and Optimization:A Solution Concept for Artificial Immune Networks: A Coevo? lutionary Perspective [C].Proceedings of 6th international conference on Artificial Immune systems,Brazil,2007:26-29.

[2] Hofmeyr, S, Forrest, S. Immunity by Design: An Artificial Immune System[C]//Proceedings of the 1999 Genetic and Evolution? ary Computation Conference,1999:1289-1296.

[3]杨进,刘晓洁,李涛,等.人工免疫中匹配算法研究[J].四川大学学报:工程科学版,2008,40(3):126-131.

[4]马莉.基于免疫原理的网络入侵检测器生成算法的研究[D].南京:南京理工大学硕士论文, 2006.

[5]卿斯汉,蒋建春,马恒太,等.入侵检测技术研究综述[J].通信学报,2004,25(7):19-29.

[6]焦李成,杜海峰,刘芳,等.免疫优化计算、学习与识别[M].北京:科学出版社, 2006.

[7] Dasgupta D,Gonzalez F.An Immunity-Based Technique to Characterize Intrusions in, Computer Networks [J].Special Issue on Artificial Immune Systems of the Journal IEEE Transactions on Evolutionary Comput- ation.2002,6(3):281-291.

第5篇

关键词:模式匹配;藏文音节;BM算法

中图分类号:TP393.08

藏文网络舆情是当前必须关注的舆论涌现与信息传播现象。近几年藏文网络舆情的数量呈现递增的增长趋势,网络信息的传播途径也呈现出多样化和复杂化。由于藏文网络的这些显著的特点,藏文信息处理相对滞后于英文和中文等,短时间内迅速的获取大量信息则不容易。另,目前藏文网站大量的涌现,网页数量巨大,处理起来速度相对慢,以往藏文网络舆情页面的统计都是基于手工统计实现的,效率低,很难对网络舆情的变化做出快速响应。模式匹配技术是内容过滤的核心技术,是计算机信息技术领域研究的基础问题之一,研究敏感词作为模式串的藏文模式匹配算法具有重要的研究意义。

BM算法是Boyer和Moore提出的一种字符串快速匹配算法。其基本思想是从右向左的把模式字符串同文本做比较。开始时仍是P的最左边与T的最左边对齐,当在某一趟比较中出现不匹配时,计算模式串右移的距离,把模式串向右移动该距离,再进行从右至左的匹配,同时应用到了两种启发式规则,即坏字符规则和好后缀规则,来决定向右跳跃的距离。

1 BM算法在藏文中的改进

藏文字符匹配中应用BM算法时,必须结合藏文文字特征,对BM算法进行改进以符合藏文的特点,提高匹配效率。

1.1 藏文文字结构及编码特点

藏文是由多个基本字符通过纵向叠加组成的字符串,构成一个完整藏文词素的基本单位是由藏文中的“音节分割符tsheg bar”来确定。一个或多个音节构成一个藏文词。音节,则是由音节分割符(音节点)或者其他藏文标点符号来划分的。一个音节中基字符是不能被省略的,其余相关构件都可以减少掉一个或几个这样仍然可以成一个音节(藏字)。七个构件中辅音字母在各部位依据藏文语法要求都有一定限制并不是所有的辅音字母都能够做前加字或者后加字等。

藏文在计算机中进行编码时一个音节需要用多个编码来表示,长度是不定的,这使得藏文在信息系统中的实现非常的麻烦。

(1)国内的几种藏文处理系统将藏文作为整字给予编码。将藏文垂直组合的部分作为一个处理单元编码(预先进行垂直组合,称为垂直预组合,垂直预组合后的字符称为藏文字丁),比如北大方正的报刊排版系统、华光藏文排版和同元藏文处理系统、激光照排系统等,这几个系统都有各自的编码方案这类编码采用双字节进行编码。这样,具有完整构件组合的藏字(即一个音节最多由4个字丁组成)。因此,国内的这几种编码方式一个音节就最多有4个编码。国家标准的扩A和扩B编码方案采用的是也是整字编码方案。

(2)国外的几种藏文编码方式也是采用整字编码方案,但是将带元音的字丁与元音分离后分别进行了编码。一个藏文音节最多就由5个字丁组成,即一个藏文音节由5个编码组成。

(3)ISO/IEC 10646藏文基本集是国际标准的编码方案,它完全将藏文视做拼音文字,字丁则是通过字母的动态组合实现的。即将一个藏文音节拆分成不同构件的独立的部分,对每一个构件都单独进行编码。采用国际标准后一个藏文音节最多由7个编码组成。基于不同编码的方式使得一个音节的编码个数不同,即使具有相同编码个数的同一种编码方案,由于编码范围不同编码值也将不一致。1997年,我国的藏文基本字符集被收入了国际标准ISO/IEC 10646《信息技术通用多八位编码字符集》。藏文编码标准得到了统一。故本匹配算法以小字符集国际编码标准(ISO/IEC 10646)编码进行讨论。

依据藏文采用小字符集编码中音节字的特点:

(1)具有完整构件的音节具有7个编码且每个编码都是两个字节,则对一个藏文音节字的表示则最多需要14个字节,最少也需要两个字节。匹配过程中只有在一个音节的所有字节都相等的情况下,一个藏文音节才匹配成功。

(2)藏文音节与音节之间由音节点分割,在小字符集中该音节点为0X0F0B。

1.2 基于藏字特征改进的BM算法

改进后的BM模式匹配算法的具体思路:

(1)用模式串P的尾字符与文本串T进行比较,结果失配,且文本串字符不为音节点,则模式串P右移到下一个出现的音节点处在新的位置继续比较。

(2)用模式串P的尾字符与文本串T进行比较,结果匹配,再把模式串第一个字符与文本串T比较,结果匹配。则将模式串与文本串T由右向左依次比较。当所有字符都能匹配上时,则找到字符串返回查找结果并结束;如果模式串第一个字符与文本串T比较,结果不匹配,则:

求move(o)=First(OT)-First(OP),将模式串移动move(o)个字符。

其中First(OT):表示文本串T出现的第一个音节点;First(OP):表示模式串P出现的第一个音节点。move(o):距离差值;

(3)用模式串P的尾字符与文本串T进行比较,结果匹配,再把模式串第一个字符与文本串T比较,结果匹配。则将模式串与文本串T由右向左依次比较。如果在模式串P的某一字符x失配,则转4;

(4)如果失配的字符x在模式P中没有出现,则:

求:First(x):从x起始的字符到第一个出现的音节点的距离。那么从字符x开始的m(模式串的长度)+First(x)个文本显然不可能与P匹配成功,直接全部跳过该区域即可,则模式串移位m+First(x)个位置;

(5)如果失配的字符x在模式P中出现,则:以该字符进行对齐。设move(x)为P右移的距离,m为模式串P的长度,max(x)为字符x在P中最右位置。作模式串移位:[m-max(x)]+First(x)。

通过上对面算法的分析,我们可以看出,改进后的BM算法可以减少比较的次数,提高匹配的速度。

2 结束语

越来越多的藏文出版作品在以数字化方式存储,网络上的藏文资料也日益增多,改进针对西文以及中文的搜索算法,寻找适合藏文文字特点的字符查找算法是值得研究的。改进的BM模式匹配算法就是利用藏文字符构字特征以及编码特点,改变了BM算法的比对方式,从而提高匹配的效率。

参考文献:

[1]江涛,于洪志.基于藏文文本的网络舆情监控系统研究[A].全国计算机安全学术交流会论文集[C],2006.

[2]闵联营,赵婷婷.BM算法的研究与改进[J].武汉理工大学学报,2006(03):528-530.

[3]殷丽华,张冬艳,方滨兴.面向入侵检测的单模式匹配算法性能分析[J].计算机工程与应用,2004(24):46-47.

[4]扎西加,珠杰.面向信息处理的藏文分词规范研究[J].中文信息学报,2009(04):113-117.

[5]严蔚敏,吴伟民.数据结构[M].北京:清华大学出版社,1999.

作者简介:春燕(1977-),女,藏族,讲师,硕士研究生,主要研究方向:藏文信息处理、数据挖掘。

第6篇

关键词:浮动车;GPS;地图匹配;轨迹点

引言

建立城市交通综合信息平台,通过对庞大的城市交通网络中的实时交通信息进行深入分析,为改善城市交通信息服务水平,提高决策科学性,缓解城市交通拥堵提供了基础。交通综合信息平台的数据支撑来源于交通基础信息的实时采集,科学决策的依据在于数据分析的快速、准确。

GPS浮动车是获取道路实时车速便捷有效的方法,可以通过车载GPS定位信息获取道路实时车速及运行状态(拥堵、畅通、缓行),其作为一种便捷廉价、可操作性高的车速采集手段已经被各城市普遍采用,特别是公交车与出租车安装车载GPS设备最为常见。通过对公交车及出租车的GPS返回数据与城市道路网的匹配、分析来获取道路的实时车速,进而实现对道路状态的有效判断。因此确保GPS浮动车轨迹点数据与信息平台电子地图快速、准确匹配是管理决策的基础,研究准确适用的GPS浮动车轨迹点数据的地图匹配算法是非常重要的。

1 GPS数据的地图匹配原理

地图匹配(Map-Match)简称MM技术,就是利用电子地图的路网信息和GPS数据来实行对车辆行驶准确位置的确定,它是一种定位误差修正技术。

浮动车所上报的GPS数据中包含有经纬度等地理信息,但这些GPS坐标只能反映车辆位置情况,而不能与实际路网路段直接相关联。因此,车辆在路网中行驶的情况,必须要依赖于地图匹配算法来完成车辆位置信息与路网位置的关联。

地图匹配算法的直接目的是将GPS测得的车辆位置或行驶轨迹,与现有的电子地图道路路段数据进行比较,继而找到车辆所处的道路,计算出浮动车辆在道路上所处的位置。一般地图匹配过程有以下几个步骤:

(1)通过对获取的GPS数据的预处理及匹配模板的分析、描述,提取出点和道路的轨迹特征。

(2)根据对地图匹配规则的制定,计算出GPS样本和匹配模板两者的相似度、匹配度。

(3)选取待匹配点距离最近或者是轨迹相似度、匹配度最高的道路曲线模板,可更正匹配样本的位置或轨迹,作为匹配结果[1]。

图1 地图匹配原理图

地图匹配原理一般可分成两个过程来表达:即寻找GPS待匹配点最可能归属的道路,并将GPS浮动点投影到这条它所归属的道路上面。

以上两个过程的关键在于需找GPS待匹配点最可能归属的道路,基本的思想即是在GPS点四周一定范围内搜索所有的可匹配点,然后根据匹配度计算,淘汰匹配度较低的点,选出最优点。并将此最优点作为GPS浮动车车辆的当前行驶路线。这样,寻找最优点成为算法性能优劣的关键所在,如果搜索范围过大,需对周围各条道路一一筛选,增加了算法计算量,导致匹配速度缓慢。反之,如果搜索范围过小,则有可能未能准确寻找到最佳匹配点,出现匹配错误,降低匹配的准确率。

2 基于GPS轨迹点的浮动车地图匹配算法

可实现地图匹配的算法很多,在GPS数据量极大,且算法应用的场景为实时车速展示,需要选择一个合适的方法,保证匹配的准确性和匹配速度。因此文章提出的地图匹配算法是基于GPS点到校正点的匹配,并且利用连续几个GPS点的轨迹确定结果,最终获取较为正确的路网匹配结果。

2.1 网格匹配

Step1:计算GPS点所归属网格。

当在系统中导入GPS数据信息后,可从这些原始数据中提取出坐标信息。可设为(x,y)。然后对该GPS坐标信息进行可信度检测,首先取网格划分中最大和最小的两个坐标点,其中最大的坐标点位于地图的右上角,假设为(xm,ym),最小的坐标点则位于地图的左下角,假设为(xn,yn)。如果待匹配点坐标(x,y)满足以下条件:

则认为该GPS点在研究坐标范围之内,转到下一步计算。

Step2:搜寻所在网格匹配

根据该GPS点的坐标信息,在网格列表中搜寻其所属的网格。假设网格编号为G0,若

(x,y)∈{G0}

则判定该点位于G0网格内。

在搜寻到所在网格后,将所在网格G0中的所有校正点加入到待匹配集合。但在该匹配中需要注意的是当GPS点与网格边距离小于1/3时,则需要将其相邻网格(G1……G8)所包含的校正点一并加入待匹配集合,进行匹配度计算。(见图2)

2.2 节点匹配

Step1:计算GPS与路段的距离和方向差

在网格匹配中搜寻出的校正点集合被称为待匹配集合。需要将GPS点与带匹配集合中的各个校正点进行匹配,找寻出最佳匹配点。

计算GPS点与各待匹配校正点之间的距离。设GPS点坐标为(x,y),GIS校正点坐标为(xr,yr),由于两点距离较近,两点接近于平面,则可根据平面距离公式

得出GPS点与各校正点之间的距离d。

计算GPS点与路段各校正点之间的夹角。取GPS数据的角度为?渍0,再与网格内的GIS路段校正点的切线方向角度?渍r(取正北方向为0°)求差值。可得出GPS点与路段方向的夹角α。

Step2:匹配度计算

匹配度是判断校正点优劣的重要标准,是描述GPS点与一条道路的匹配程度,用实际算法所求得的数值进行量化,匹配度越大,就认为发出这个GPS数据的浮动车越有可能位于这条道路。对于匹配度的计算,主要考虑的是GPS与路段的距离及其与路段的夹角。

图3 GPS点匹配

Step3:Confidence Point(CP点)判断

针对GPS浮动车地图匹配的特殊性,本文提出了Confidence Point判断。所谓Confidence Point,就是可信点[8]。判断是否为CP点,主要判断其所有匹配点是否位于同一路段。

由于浮动车地图匹配的最终目的是为城市各条道路得到路段平均速度提供起点、终点以及时间信息,而当车辆距离路口(包括城市立交路口、普通平面交叉路口、主辅路的出入口等)比较近时,由于GPS浮动车减速、并线等驾驶行为导致GPS数据中的方向信息等变化较大、准确性降低,使得系统比较难以确定车辆的准确位置。 但是考虑到GPS浮动车地图匹配的一个最终目的是获取路况实时信息,因此,如果无论车辆当前在哪条道路上行驶,只要能确定车辆必定通过或者必定离开某个路口,就可以根据GPS浮动车辆的下一个GPS定位数据确定其这一段时间的行驶轨迹。

因此当GPS数据处于路口节点或分合流点附近时,它所对应的匹配点并不在同一路段上,系统将这样的数据判定为非CP点,作为延迟匹配点,利用行驶路径进行匹配。反之,若GPS数据所对应的匹配点位于同一路段,则系统将其判定为CP可信点,对其各匹配点进行匹配度计算。

其中对于CP可信点,系统按照step3中匹配度计算中所确定的方法进行匹配度计算。取匹配度最大的点为最佳匹配点。对于非CP点,则转入下一步。

Step4:延迟匹配

对于上一步所提到的非CP点,并无法通过单一的GPS数据匹配来确定浮动车的确切位置,这时就需要通过相同浮动车的多个GPS数据来联合判断车辆的行驶路线轨迹。

图5 非CP点延迟匹配示意图

假设某浮动车连续的n个GPS数据组成的序列Pn(n=1,2,3,……,k),满足以下条件:

(1)P1点为CP点,P2为非CP点,且k小于延迟匹配的允许最大值;(2)Pk为已经确定的CP点,并能按照地图匹配方法正确寻找到最佳匹配点。

则可利用前后两个CP点P1和Pk,寻找这相邻两个CP点的最短路径L。再利用最短路径L对P2,P3,Pn-1进行匹配,去掉不属于L的匹配点,再取最大匹配度点作为最佳匹配点。

3 结束语

文章所使用的地图匹配方法通过获取GPS浮动车数据,利用GPS坐标信息,通过比对电子地图各条路段的地理信息,将浮动车位置关联到路网上。

研究表明,该匹配算法具有以下优缺点:

(1)匹配速度快。由于将电子地图网格化,避免了将GPS数据坐标与地图中所有节点坐标的一一进行计算,而是仅选取了比较小范围的节点进行匹配。提高了运算、匹配的效率。

(2)匹配精度较高。由于在匹配方法上采取了多种方法进行联合使用,针对不同位置的GPS数据点运用不同的匹配方法,保证了每个GPS数据点匹配的准确性。特别是基于连续GPS点轨迹来判断位置,使得匹配的结果更为准确。

重庆市政府在2011年开展“重庆市交通综合信息平台”建设,信息平台对重庆城区的干路网交通信息进行采集与汇聚。文章的研究依托交通信息平台的基础数据,研究成果应用于重庆市主城区路网运行情况的评估与监控,经过实测对比,验证了该算法的良好精度和适用性。

参考文献

[1]张其善,吴金培,杨康凯.智能车辆定位导航系统及应用[M].北京:科学出版社,2002.

[2]肖锋.面向道路交通状态监测的GPS与GIS数据预处理关键技术研究[D].重庆大学硕士毕业论文,2008.

[3]重庆市交通综合信息平台试点工程技术报告[R].2012.

[4]孙棣华,等.基于预处理的城市路网拓扑结构构建算法[J].计算机工程与应用,2008(08).

[5]车莉娜.车辆导航定位中的关键技术研究[D].辽宁工程技术大学硕士论文,2008.

[6]Weiliang ZENG, Zhaocheng HE and Xiwei SHE. Data Repair Method for Real Time Urban Link Speed Estimation,ASCE2011.

[7]王华.GIS城市道路最短路径算法研究[J].测绘科学,2010.

[8]章威,等.基于大规模浮动车数据的地图匹配算法[J].交通运输系统工程与信息,2007(4).

第7篇

Abstract: With the rapid development of the city, the increasing number of cars, the city faces increasing traffic pressure, intelligent transportation system is one of the effective ways to solve the traffic congestion currently accepted, but to provide a reliable source of data for intelligent transportation systems an important issue in building intelligent transportation systems, floating car technology as newly

developed a traffic information collection methods, the practice has proved capable of reliable data source for intelligent transportation

systems. In order to grasp the macroscopic properties of the urban road traffic, the paper uses data preprocessing, coordinate conversion, map matching, statistical analysis and a more in-depth analysis of floating car data comparison, intuitive access to relevant features of the urban transport, urban transport planning and management decisions and people travel has some practical value.

关键词: 城市道路交通;GPS浮动车;宏观特征

Key words: Urban Road Traffic;GPS Floating Car;Macroscopic Characteristics

中图分类号:U496 文献标识码:A 文章编号:1006-4311(2013)03-0036-03

0 引言

随着城市化进程的不断加快,更多的人进入城市,交通拥挤日益成为城市发展的瓶颈,据公安部消息,截至2012年6月底,我国机动车保有量达2.33亿辆,汽车保有量达1.14亿辆,大中城市中汽车保有量达到100万辆以

上的城市数量达17个,私家车保有量达到8613万量,占

汽车保有量的75.62%[1]。发展智能交通系统对于城市交通诱导、缓解交通拥堵已成为国内外认可的有效方式之一,随着科技的发展进步,浮动车技术因其在交通信息采集方面建设周期短,投资少,覆盖范围广,数据精度高,实时性强受天气影响小等特点[2]越来越受到智能交通建设和研究领域的重视。浮动车技术在国外起步比较早,取得了一定的研究进展:英国的浮动车数据系统FVD,主要用于交通信息的采集与分析,预测道路形成时间及时向用户[3];德国的浮动车数据系统FCD,主要采集车辆的位置、速度、时间等信息,提取和分析交通信息,判断交通状态,及时向公众,为公众出行规划提供参考依据[4];美国的ADVANCE系统,该系统是浮动车与检测线圈相融合,预测旅行时间,为出行者提供实时的动态路线诱导信息[5];日本VICS系统,该系统能够提供多种信息,为旅行者出行规划提供参考[6];韩国KORTIC,该系统结合浮动车、环形线圈、闭路电视监控进行交通信息采集,把数据融合后提取交通信息,判断交通状态[7]。

浮动车技术在国内的研究起步比较晚,开始于2002年的北京交通大学利用少量的出租车进行的北京市路网分析评介,但是目前发展比较快,在北京、上海、杭州、宁波等城市利用现有的出租车建立起了浮动车系统,实时采集路网的交通信息。论文采用的数据为昆明市GPS浮动车数据。

1 数据采集及预处理

1.1 数据格式 浮动车就是在城市道路行驶的车辆(主要是公交车、出租车)上安装具有位置信息采集功能的GPS设备,在车辆的运行过车中通过无线网络(GPRS、WIFI等)实时向控制中心传回车辆的位置、时间、瞬时速度、车辆运行方向、设备终端编号等信息的车辆。

1.2 浮动车数据预处理

①剔除研究范围之外的数据:研究用的数据时间范围为:2010年12月01日00时00分00秒-2011年3月31日23时59分59秒的共计26984135条数据,研究的地理范围为东经102.647O-102.828O,北纬24.914O-25.117O的范围,数据分析之前,剔除研究范围之外的数据。

②剔除速度大于120km/h的数据:根据相关规定的道路的设计最高速度不得超过120km/h,包括高速公路,考虑到有绕城高速和二环快速路,删除速度高于120km/h的数据。

③剔除前后时间间隔超出数据回传时间间隔的数据:采用的数据回传的时间间隔为15s,如果某一条数据与前后数据的之间的时间间隔超出15s则需要对该数据进行剔除处理,算法如下:

Ti-Ti-1>15s且Ti+1-Ti>15s

则删除数据i。

Ti为浮动车传回的第i条数据记录的时刻。

1.3 坐标转换 浮动车数据采用的坐标为WGS-84大地坐标系,而昆明市道路网数据采用的是北京1954平面坐标系,为了能将浮动车数据准确的匹配到城市道路网上,必须对浮动车数据进行坐标转换,使浮动车数据坐标的坐标系与道路网电子地图数据坐标保持一致。

1.4 地图匹配 由于受GPS定位误差及建筑物遮挡等因素的影响,GPS浮动车数据并不完全准确的定位于道路网电子地图相应的道路上,而是存在一定的偏差,为了准确的研究城市道路交通的宏观特征,需要把GPS浮动车数据准确匹配到城市道路网上,实现这一过程的算法称之为地图匹配算法。目前地图匹配算法主要有点到点匹配算法、点到线匹配算法、线到线地图匹配算法。

单独的点到线的匹配算法只是采用投影距离大小比较确认匹配点,没有考虑到浮动车行驶轨迹的连贯性,因而在交叉口和“Y”字口等地点会出现错误匹配。考虑到行驶轨迹的连贯性,采用点到线匹配结合历史轨迹数据匹配算法。具体算法如下:

①GPS浮动车数据点P(x,y),匹配算法为求点到线的最近点距离来确定匹配的路段,设道路L1和L2的方程为A1x+B1y+C1=0和A2x+B2y+C2=0,与点P到两条道路的距离为:

d■=■(1)

d■=■(2)

如果d■>d■则点P匹配到道路L1上。但是点到线的匹配算法存在缺陷,如图1所示,点P4会被错误匹配到L2上而不是匹配到L1上。

②此缺陷可以通过完成点到线的最近距离匹配之后,采用统计分析的方法,依据浮动车数据的设备终端好及时间顺序,判别P4点与前后各点同为一辆浮动车的数据同时时间间隔不超过阀值,则可确定P4点在道路L2上。

2 交通宏观特征分析

2.1 浮动车不同速度区间比例分析 本论文为了便于研究选取2010年12月1日00时00分00秒至2010年12月31日00时59分59秒之间的浮动车数据作为研究对象,进行分析研究,其中分别选取工作日(星期一),周末(星期日)的数据进行分析,研究之前删除了数据中速度为零的数据,时间间隔为30分钟,时间段为00时00分-23时00分。

从图2中可以看出各阶段速度的比例在一天当中都是不断变化的,这反映了道路交通的动态特性。

①周日的浮动车数据量比例低速区域(15>speed>=0)在7:30之前保持在10%左右7:30之后开始平缓的增加,到15:00左右达到20%左右,高速区(speed>=30)的比例从7:30开始有70%左右下降达到50%左右持平,中速区(30>speed>=15)也出现了一定程度的增加,这反映了周末人们7:30出行的不开始不断增多导致交通状况发生变化,车辆运行速度开始减缓;

②周一的浮动车数据量比例低速区域(15>speed>=0)在6:30之前保持在10%左右6:30之后开始急剧增加,8:30达到20%左右,之后出现小幅波动,高速区(speed>=30)的比例从6:30开始有71%急剧下降达到50%左右持平,中速区(30>speed>=15)也出现了一定程度的上升,这反映了人们从6:30开始上班出行不断增多导致交通运行减缓。

③图中可以看出周日的低速区增加、高速区下降要比周一缓慢,同时周一由于人们上下班时间相对固定,基本集中在8时30分到9时00分的原因,早上出行时间主要集中在6:30到8:30之间形成早高峰,下午下班的时间集中在17时00分到18时00分之间,因而17:00到19:00之间形成晚高峰,而周日则反映出人们出行的时段比较分散,早晚高峰不是很明显。

④从晚上20时00分开始中速区和低速区的比例开始下降,高速区的比例开始升高,反映出了人们出行的减少,道路交通处于比较畅通的状态。

2.2 全路网一星期七天交通状况分析 通过对处理好的数据进行分析获取了一星期的昆明市研究区域全路网的不同时间段的速度分布特征如图3所示。

通过对趋势图进行分析,可以知道昆明市全路网的交通有以下特征:

①工作日与周末的交通状况有明显的不同,星期六和星期天从早上7:30才开始速度不断下降进入早高峰时段,全路网速度持续减慢到9:30左右速度开始低于30km/h,而且一直持续到12:30左右出现小幅的回升,之后几乎保持小幅波动,变化不是很大,到下午17:20左右速度又开始持续下降,回身保稳定的时间为下午19:00整,这一时段为晚高峰,之后速度有小幅波动,同时由于出行人数和车辆的减少,速度加快。

②工作日的速度从早上6:30开始持续降低,到8:30左右达到最低形成早高峰,之后基本保持稳定,没有出现大幅波动,持续到12:20左右之后速度出现小幅替提升,中午13:30左右速度因为下午上班出行等因素的影响速度再次出现降低,之后基本保持稳定,到下午17:20左右又再一次降低持续至18:40,形成晚高峰,之后速度出现小幅波动,并持续回升。

③从图中可以看出,不论是周末还是工作日,凌晨4:40-6:50之间的速度是最高的,速度接近于35km/h,说明在这一时段出行的人数及车辆都比较少,交通运行顺畅。

④工作日的早高峰要比周末的早高峰提前40分钟左右,同时工作日的早高峰形成快于周末,而且速度下降较快,另外工作日的晚高峰形成时间基本一致,保持稳定的趋势一致。

第8篇

关键词:图像匹配;归一化交叉算法;小波变换;多尺度;塔式结构

中图分类号:TP399 文献标识码:A文章编号:1009-3044(2011)23-5698-03

NCC Algorithm Optimization Based on the Wavelet Multi Scale

FU Yan-li

(Shandong SHENG DA Construction Group Limited Company, Jining 272000, China)

Abstract: Algorithms based on pixel gray value are already very common in mage template matching problem, which normalized cross correlation algorithm (Normalized CROSS Correlation. NCC) is one of the classic algorithm based on gray matching, and is widely applied, but the algorithm also has the disadvantages of high time complexity. Multi scale theory and the multiple resolution image are representation and analysis of relevant, i.e. a digital image can be expressed as a multiple resolution sub-images collection. Its characteristic cannot be found in a resolution while in the characteristics of another resolution is easy to find, the wavelet multi-scale analysis is an important tool, known as mathematical microscope, can be used to construct different adaptive filter with improved filter convergence, which is also one of the advantages of wavelet transform. Image after wavelet decomposition, in the lowest layer of the low frequency sub image resolution, retaining only the most information of image, that is after wavelet transform of image of a feature. Based on the wavelet multi scale NCC algorithm not only optimize the algorithm itself at the same time optimization based on gray matching search path, so that guarantee the NCC algorithm accuracy, and reduce the matching time, and also the simulation experiments show that this algorithm is effective.

Key words: image matching; normalized cross algorithm; wavelet transform; multi-scale; tower structure

图像匹配是对两幅图像找其对应的映射关系或根据已知模式到另一副图中寻找相应的模式。图像匹配是一种极其重要的图像处理和分析技术,无论在图像理解还是在视觉计算中都具有重要作用和地位,其成功应用到航空航天、地球物理信息、海洋船载导航和地理特征探测、工业生产、医疗卫生等,因此图像匹配技术越来越受到人们的重视和青睐。

图像匹配的实用的技术方法一般分为两大类,即基于灰度匹配和基于特征匹配。基于灰度匹配是把待匹配图像中的某一像素点的灰度邻域作为匹配模板或者称为子窗口,在参考图中搜索具有相同或者相似灰度值分布的对应的邻域,从而实现两副图的匹配。基于特征的图像匹配不是利用图像中的像素值进行匹配,而是通过灰度导出符号特征(如:拐点、角点、边缘线段、图像轮廓)实现图像的匹配。前者作为一种基本的匹配方法之一,在很多地方得到了充分的应用,可以充分利用图像的所有信息、尤其适合在图像仅有平移和模板图像中非零项比较少的情况下,便于匹配的实现。但是弱点也是很明显的,即对图像的几何变形、光照强度、对比度都很敏感,并且计算量大,不适合实时匹配。后者利用从图像得到的符合特征作为匹配的基元,有效的克服了前者的弱点,但是特征匹配过于依赖图像的特征点,并且特征点的提取涉及到几何和图形形态学的计算,没有统一的模型可以利用,需要对不同图像选择不同的自适应特征,需要额外的特征提取的计算,往往计算也比较复杂。

1 归一化交叉相关算法

归一化交叉相关算法[1] (Normalized Cross Correlation.简称NCC)定义如下:

假设模板图像w(s,t)的尺寸为m×n,其中m,n往往取奇数,参考图像f(x,y)是一个大小为M×N,(1≤m≤M, 1≤n≤N),则:

(1)

其中a=(m-1)/2,b=(n-1)/2

由于表示模板的能量所以是一个常量,,当模板移动距离比较小时,也近似一个常量,所以为使D(x,y)最小则需要达到最大值,由于对w(s,t)和f(x,y)的副值的变化比较敏感,所以定义归一化互相关函数为:

(2)

其中a=(m-1)/2,b=(n-1)/2

为了进一步克服噪声的影响和理想状态匹配时C(s,t)相同值太多,还进一步简化(2)式即:

(3)

其中a=(m-1)/2,b=(n-1)/2,Ef,Ew分别为f(x,y)和w(s,t)的期望。

当C(s,t)达到最大值时,两图匹配成功。

通过对NCC算法的理论分析,不难发现:为了让算法达到理想状态进行图像匹配,牺牲时间,换取了理想的匹配。通过对公式(1)(2)(3)分析,可以看出公式越来越复杂,计算量越来越大,匹配的时间越来越多,由于小波变换可以作为一个平滑过滤器来使用,所以小波变换可以消除图像的幅值和图像的噪音,因此选择了NCC算法的中的公式(1),这样就可以节省大量的计算时间,提高匹配的速度。

2 小波变换的多尺度分析

小波在1987年首次作为分析工具首次出现,小波是多尺度分析的重要工具,被誉为数学上的显微镜[3],因为小波变换具有时间-频率局部化的特点,即在小波变换中,时间窗函数的宽度与频域函数窗口的函数的都是一个常数,根据测不准原理,他们的乘积也是一个常数。在对低频分析是可以加宽时间窗,减少频率窗;而对于高频分析是,可以增高频率窗,减少时间窗,这种特性被称为“自适应窗口特性”所以小波的这种特性是小波变换能提高为多尺度分析的基础,可以用来构建不同的自适应滤波器以改进滤波器的收敛性。

小波多尺度分析的表示:以多分辨率来解释图像的一种有效并且容易理解的结构就是图像金字塔如图1。一副图像金字塔是一系列以金字塔形式排列的分辨率逐层降低的图像集合。0层是N×N的图像,对0层的图像进行小波亚抽样,可以达到一个原图四分之一的较粗略的缩略图。这个过程是可以重复进行直到N层,这时图像是1×1的图像。这时图像的分辨率也从0层最高到N层逐次下降,是原来图像的四分之一。这样一个图像的金字塔结构共(logN 2+1)层,或者有这么多不同的图像组成,并且图像所用的容量只是原来的图像的4/3N2。

多尺度小波的特点[3]:1)多尺度小波具有窗口自适应的特性,即可以使图像的小波分析聚集到间断点、奇异点和边缘,体现了局部特点;同时也可以获得全局的视点。这个特性是小波变换独有的,对非稳定性和快速变换的信号的分析特别有用的。2)小波变换相当于一组多分辨率的带通滤波器。利用这个特性,可以将图像的信号分解为如图1所示的频率子带上,在每个子带可以用小波变换进行处理。3)多尺度小波分解图像的所有子图的和等于原图像的大小,即不增加存储空间。4)分解后的图像,没有信号损失,保证图像的完整性,便于对低频和高频的处理和上层对下层的实时重建。

3 基于小波多尺度的匹配算法

多尺度小波匹配主要利用了小波多尺度的特性对待配图和参考图进行金字塔式分解,结构如图1,匹配基本流程如图2所示,具体步骤如下:

1)首选判断待配图和参考图的大小,一般待配图比参考图像小多,这时就是在参考图中寻找待配图的位置;反之就是在待配图中搜索作为目标的参考图的过程。两者原理是一样的,所以匹配算法是基于前者论述和测试的。

2)判断待配图和参考图的灰度光照强度、对比度、物体在拍摄时的遮挡情况以及空间几何等,这些都会对基于灰度匹配造成错误的匹配,进行图像匹配前的预处理。

3)以上两步看作图像预处理的过程。接下来选择小波,这步非常重要,本课题选择了Daubechies(db4)小波,因为此小波在运动估计中应用非常广泛,可以很好的保留低频中图像的绝大部分信息,去掉高频信号中的噪声,是一个行之有效的小波。然后利用小波的多尺度特性将待配图和参考图像分解为N层,结构如图1,待配图和参考图未分解的图像为0层(有些文献是将原图定义1层),从低到上,分解的最大层为N层(或者分解的最大尺度为N层),在MATLAB中实现小波变换的最大层的函数是wmaxlev()。但是为了保证低频的中含有未解图的绝大部分信息,尤其是灰度变化比较剧烈的区域,一般分解的层次为:一维分解的分解尺度N不超过5;二维的分解尺度N不超过3。第N层图像的尺寸和大小都是原图来1/(N+1)2。

4)通过前三步,待配图和参考图的原图被分为N层不同频率子图的集合,现在可以在分辨率最低的N层进行待配图的子图与参考图的子图进行匹配。采用了经典灰度相似度量算法:归一化交叉相关算法NCC进行对待配图和参考图进行匹配。整个匹配过程就是将N层的待配图看作模板,匹配的实现基本过程:1)在第N层利用归一化交叉相关算法NCC进行匹配,即求出(1)式的最大值;找出对应匹配区域;2)在N-1层按照N层的算法,再在对应匹配区域进行NCC匹配;3)重复第5步直到0层;4)输出匹配结果。

4 仿真实验

本算法使用Matlab2007b进行了大量的仿真实验,图3是选择了最著名lena图进行算法的仿真说明。

结果分析:

1)为了与其他文献在匹配速度和精确度的可比性,选择了其中的一组著名图像:lena图,如图3和图4中的A图所示。进行尺度为2的小波分解,两幅图像中的尺度为2的低频子图,基本上无法辨认,即所需要的信息基本上都被过滤,所以在第2层匹配是无法匹配的,根据第4节的匹配步骤,只能在第1层子图匹配,匹配实验的结果证明是可行的。

2)将这幅lena的待配图和参考图如表1所示的各种算法进行匹配。通过表1可以看出,此算法是可行的。

5 结束语

论文的创新是首选剖析了NCC算法,选择了算法的中间过渡式作为本算法的一部分,好处是减少图像匹配的计算量,同时也保证了匹配的精确度;采用了小波变换的多尺度特性,优化了匹配的搜索策略,提高了匹配的精确度和匹配的时间,所以结合两者的特点可以很好的完成某些领域中图像的实时匹配。

参考文献:

[1] Gongzalez R C,Woods R E.Digital Image Processing[M].2nd Edition (DIP/2e).北京:电子工业出版社,2005.

[2] 李强,张钹.一种基于图像灰度的快速匹配算法[J].软件学报,2006,17(2):216-222.

[3] Luigi Di Stefan.Stefano Mattoccia Fast template matching using bounded panial correlation[J].Machine Vision and Applications,2003(13):213-221.

[4] Bamea D I,Silverman H F.A class of algorithms for fast digital image registration[J].IEEE Trans on Computers,1972,C-21:179-186.

[5] 郑运平,陈传波.一种新的灰度图像表示算法研究[J].计算机学报,2010,33(12):2398-2406.

[6] 李健,梁琨.基于小波多分辨率分析的快速图像匹配[J].陕西科技大学学报,2006,24(6):81-84.

[7] 刘莹.基于灰度相关的图像匹配算法的改进[J].应用光学,2007,28(5):537-540.

[8] 杜杰.两种基于灰度的快速图像匹配算法[D].大连:大连海事大学,2007.

[9] 范俐捷,王岩飞.一种新的基于灰度的图像匹配方法[J].微计算机信息,2007,23(30):296-297.

[10] 范新南,朱佳媛.基于小波变换的快速图像匹配算法与实现[J].计算机工程与设计,2009,30(20):4674-4676.

第9篇

【关键词】神经网络 模式识别 指纹

一、引言

指纹自动识别技术是通过计算机实现的身份识别手段,也是当今应用最为广泛的生物特征识别技术之一。采用指纹识别技术进行身份验证是安全可靠的系统,它可以取代传统的基于密码、钥匙和证件的安全系统,而且不需记忆密码,无需携带证件,指纹就是身份证明。无数的研究单位和公司企业都积极从事自动指纹识别算法的研究和产品开发,现在国内外指纹识别大都采用基于细节特征点的指纹识别技术,即采用基于图像处理的指纹识别算法,但有些算法由于指纹图像的噪音、皮肤弹性引起的非线性形变等多方面因素,导致在识别过程中出现误差,影响识别率等。

二、研究现状

在国内,中国科学院自动化研究所人工智能实验室在指纹识别技术研究方面取得了大量成果,它们的产品“Finger pass嵌入式指纹识别系统”获国家信息产业部信息产业重人技术发明荣誉证书,“基于混合匹配的指纹识别系统与应用”曾获得国家科技进步二等奖,并在国内外重要学术刊物上发表多篇关于指纹的科研论文。

国外自动指纹识别技术的研究开发起步比国内早,到目前为止也已经取得了很多优秀成果,它们的技术和产品整体上都领先于国内。比较有代表性的“指纹研究组织”是南加利福利亚洲指纹联合会,它是一个非盈利组织,成立于1937年,目前拥有超过350个成员单位,该组织旨在推动指纹识别技术及其相应产品的研究、交流等。由国际模式识别协会组织的国际指纹识别算法竞赛“FVC2000”、“FVC2002”、“FVC2004”吸引了众多国际国内的高校、研究组织、企业等参加,这些竞赛都非常具有影响力,推动了指纹识别技术的研究和应用发展。

三、指纹预处理

在指纹识别过程中,输入的指纹图像由于各种原因的影响,是一幅含噪声较多的灰度图像,预处理的目的就是去除图像中的噪声,使图像画面清晰,边缘明显,把它变成一幅清晰的点线图,以便于提取正确的指纹特征。指纹图像预处理环节在整个指纹识别系统中具有重要的地位和作用,它的好坏直接影响着指纹识别的效果。预处理一般分为四步进行:指纹图像的规格化、指纹增强、二值化和细化。

四、指纹图像的特征

指纹图像的结构比较复杂,而且属于个人隐私,所以在一般情况下,指纹图像是用数字化的形式存储的,然而数字化存储信息量大,很难找到准确的指纹信息,因此指纹识别具有重大的意义。指纹识别算法是根据指纹图像中一些不同的特征来实现指纹的匹配,根据不同特征可以将指纹图像分为:总体特征和局部特征。

总体特征:指纹图像中存在一些清晰明了的特征,可以用肉眼直接观察到,将这一类特征称为总体特征,例如:纹型,模型区,核心点,三角点,纹数。

局部特征:指纹图像上节点的特征,而节点是指纹图像中具有某种特征的点,又称为特征点。一般来说,有些指纹会存在相同的总体特征,但绝对找不到相同的局部特征,即相同的特征点。所以在指纹识别过程中就是要寻找这些特征点,这些特征点往往出现在中断处、分叉处及转折处。

五、指纹特征匹配

人们对指纹匹配做了很多研究,提出了许多匹配算法,主要可分为两类:一类是基于图形的匹配方式,包括点模式匹配和基于图论的方法;另一类是采用人工神经网络的方法。图形匹配是针对纹线几何形状及其特征点拓扑结构的匹配方式,它的原理是基于相似变换的方法把两个特征点集中的相对应点匹配起来,这些相似变换可以是平移变换、旋转变换、伸缩变换等线性变换,可以在一定程度内允许少量伪特征点的存在、真正特征点的丢失以及轻微的特征点定位偏差,且对图像的平移和旋转也不敏感。但这种方法有两点不足:一是匹配速度比较慢;二是对指纹图像的质量要求比较高,低质量的图像匹配效果不佳。本文采用概率神经网络识别的模型进行网络拓扑。在情报不完全的情况下,对未知部分进行主观概率估计,然后用贝叶斯公式对其进行修正,最后结合期望值和修正概率做出最优决策。

六、小结

本文通过介绍混合神经网络相关知识,分析了自动指纹识别系统的研究现状和问题,按照指纹预处理、指纹特征提取和指纹特征匹配的研究过程,在现有的各种指纹处理算法的基础上,对它们进行了优化改进,研究了混合神经网络在自动指纹识别系统中的应用。

参考文献:

[1] 张莹,于宝。基于ARM9的指纹匹配算法[J]。计算机与数字工程,2013,5。

[2] 李娟。基于特征描述子的指纹算法研究[D],西安电子科技大学,2012.

[3] 王启亮。指纹图像增强算法研究[D], 太原科技大学,2013.

[4] 王行甫,覃启贤,程用远,侯成龙。一种改进的径向基神经网络预测算法[J]。计算机系统应用,2012,8。

[5]殷芳玺。嵌入式指纹识别应用系统与算法研究[D], 华中科技大学,2012.

[6]车永刚,肖春雨,雷声,孙巍。基于环形BP神经网络的指纹匹配算法[J]。长江大学学报,2013,10(1)。

[7]黄勇兴。基于小波变换的指纹识别算法研究[D],南昌航空大学,2012.

相关文章
相关期刊