时间:2024-01-14 15:56:26
引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇计算机视觉基础知识范例。如需获取更多原创内容,可随时联系我们的客服老师。
关键词:建筑工程;预决算;管理体制;控制措施
建筑工程预决算作为控制建筑工程项目投资的重要手段之一,在工程项目招标与企业经营管理水平考核中起着关键作用,也是审计机关掌握企业投资状况并监督其经营管理的重要依据。但由于多种原因造成了我国建筑工程预决算在实际工作中还存在着预决算编制质量较低,工程造假削低失控,工程投资控制不科学等问题,为了适应市场竞争,提高建筑企业的整体竞争力,建立一个规范有序的建筑市场工程造价管理体系尤为重要。
1.建筑工程预决算存在的问题
1.1建筑工程预算存在的问题。由于我国许多建筑企业由于在自身财务管理制度方面还存在着许多不完善的地方,造成在进行工程预决算中出现了预算编制误差较大,虚增工程量等问题,如果不加以控制的话,将给企业造成很大的财务损失。
1.1.1 工程预算定额不健全。许多建筑企业在进行工程预算编制的时候,常常会遇到诸如借用定额问题,例如在进行房屋建筑工程预算编制的时候参照工民建标准进行定额,这类定额的借用,因为没有考虑到地域、建筑类型、施工技术水平等因素的影响,而造成预算编制的不合理。
1.1.2 计算方法存在问题。我国许多建筑企业在进行建筑工程预算的时候,经常会产生预算不准备的现象,之所以产生这种问题的一个原因在于工程预算定额的不正确,而另外一个重要原因是其计算方法也有较大失误,特别是在工程预算中,在工程的间接费中,因为计算方法是以直接工程费为基数而导致工程造价产生失控的现象。因为在进行工程前期预算的编制过程中,仅能够对有限的几个材料的基价做出定价,而且价差是不能用于计算间接费用中,但是在工程的实际施工过程中,将会涉及到高达上百种材料,这些材料的预算价格除去规定的材料以外,都需要直接进入工程直接费用中去,材料费的增加是计算施工中间接费用的最为敏感因素,因为材料费越多的话,间接费也就越多。而且因为材料的价格收到市场供求和国家政策的影响,常常会造成材料预算价格与实际价格不符合的问题,导致间接费的准确性降低,工程造价失控。
1.1.3 人为因素对工程预算编制影响较大。我们知道,在工程预算的编制中,建筑公司对临时房屋建筑工程的投资一般是有一个固定的公式可以计算,但是,这个计算公式并不是对所有的工程都使用的,特别是在建筑工程中,由于施工新的技术和机械的应用以及管理水平的不断提高,劳动生产率也在不断提高,同样的一个施工工程,可能使用的施工人员大大减少,如果没有考虑到这种可变的因素对施工工程的影响,最后会导致工程预算失真的问题,从而导致工程投资失控现象。
1.2建筑工程决算中存在的问题
1.2.1 高套定额。我国一些建筑企业在进行工程决算的时候,常常会出现高套定额的问题,高套定额就是在进行项目工程决算的时候降低工程标准,但是却套用了高标准的定额,从而两者之间存在很大的差距。例如,许多建筑企业在进行项目施工的时候,一般是使用人工挖土方的定额来套用人工挖基坑的定额,人工挖土方的定额单价一般为每100立方米732.39元,但是人工挖基坑的定额单价却为每100立方米1150.41元,两者定额单价差距很大,如果在进行工程决算的时候,采取高套定额的话,无疑将会提高了工程造价。
1.2.2 虚增工程量。虚增工程量是一些施工企业为了增加施工成本的一种重要方法,虽然有的时候,这种虚增工程量并不是施工企业人为因素所造成的。例如,一些建筑企业在基建工程的一个分项工程中,往往会存在人为重复计算工程量的问题,这种情况在一些隐蔽的工程中经常会出现;还有一种重复计算工程量的办法就是施工单位在进行工程决算的时候,把一些在定额项目中已经列入决算的项目在其它定额项目中又列入其中,造成同样一项工程因为两次在定额在计算而被重复计费的问题。
2.控制建筑工程预决算问题的对策
随着建筑公司财务管理的不断健全,许多企业已经采取了较为成熟和完善的建筑工程预决算控制方法。
2.1建筑工程预算完善措施
2.1.1 根据实际情况编制建筑工程预算定额体系。针对建筑工程预算定额过程中的借用问题,建筑企业在进行工程预算的时候,可以考虑根据建筑工程的地域分布和类型以及施工技术水平等因素,结合实际情况,制定出一套较为完整的预算编制定额体系。在进行预算编制的时候,可以根据建筑工程的地域差异和实际施工水平,按照定额进行灵活调整,即在工程预算基础定额基础上,根据工程的施工难易程度,设置难易系数,从而最大提套施工的经济效益,创造更多的固定资产,而且也要对技术发展和工艺进步所带来的定额变化进行及时调整,不断进行补充,控制部分工程造价失控问题。
2..1.2 提高工程造价计算方法的准确度。在进行工程造价预算的时候,常常会因为计算方法的失误,导致工程施工过程中,材料的实际价格因为市场需求和国家宏观调控政策的影响,而和工程预算价格不符合,最终造成工程造价失控。针对这种状况,首先需要建筑企业在进行工程造价预算的时候,尽可能增加预算的材料种类,减少材料费,另外一方面。需要建筑企业能够利用行业协会或者管理部门的作用,更广泛手机材料的市场价格信息,针对不同的时间和区域,材料价格变动的周期性信息,制定出建筑工程调价系数。
2.1.3 准确计算施工期的人员数量。由于建安投资和临时房屋建筑工程投资之间很难通过一个简单公式就把二者联系起来,因此,在进行施工项目预算编制的时候,应该尽可能按照实际施工状况去计算施工期的人员数量,然后计算临时性房屋的建筑面积和室外的工程量,最后再以相应的定额标准计算出较为准确的工程造价,从而避免由于公式的错误而导致的工程预算计算误差。
2.2建筑工程决算完善措施
1)对于建筑工程决算中存在的高套定额的现象,我们要根据高套定额的不同,实施分类审核的方法,审核人员不仅要能够熟练掌握工程组计算的规则,而且也要掌握建筑项目施工的要求和竣工图纸,只有这样,才能达到知己知彼。
2)严格控制决算,避免重复计算。对于一些建筑工程在决算中重复计算的问题,最为根本的控制方法就是要严格控制决算中的计算方法。例如,首先要加强审计人员的工程量计算技能,并且要达到熟练掌握的程度,并且也要项目主管部门有严格的隐蔽工程现场签到和记录制度,达到有证可查。
3.结语
建筑工程预决算是决定和控制工程项目投资的重要措施和手段,是进行招投标、考核企业经营管理水平的重要依据,也是审查机关掌握投资状况,监督经济活动的重要依据。因此,建筑工程预决算必须具有高度的科学性、准确性及权威性。
参考文献
[1]熊晓花,邹娟. 关于建筑工程预决算审计问题的几点思考[J]中国管理信息化(综合版),2006(3)
[2]陈让农. 建筑工程预决算中存在的问题及对策[J]经济技术协作信息,2008(6)
“发现航程的真正之道并不在于寻找新的土地,而在于用新的眼光来看待事物。”公共预算决策模式转型建立在政府治理理念的转变基础上,推动公共预算决策模式转变的首要问题,便是实现政府治理理念的根本转型。目前,尽管相关改革从宏观上呈现出一定的方向性,但因不断摸索、总结、完善的渐进式特性所致,改革本身却显示出一定的零散性和无系统性,政府常常选择从一套假定中推论出的改革方案,同时也选择建立在完全不同甚至相互对立的假设基础上的其他改革方案。在总结发达国家政府治理经验、同时结合我国政府实际的基础上,笔者认为,我国新时期政府治理理念和模式的构建,应当围绕“以公众为中心,以结果为导向,以市场为基础”三方面内容进行。
一、建立以公众为中心的政府
建立以公众为中心理念的基础是机械论的政府观,即视“政府为一信托机构,政府管理人员是受托人,信托机构和受托人都是为人民的利益而设”(享利·克莱,1829),公共预算决策首先应该考虑的是决策在社会中的影响和如何为公众提供更直接、更全面的服务,而不是考虑在正式结构中的个人所得和个人权力。这一模式强调“公民社会的复兴”,寻求合作和个人参与来强化政府效能,官僚体制的作用是工具性的,公众可以通过一定的途径在决策中发挥更重要的作用。当政府倾听企业和人民的呼声,并在制定和实施政策时与他们保持合作关系时,政府预算决策的有效性就可以提高。如果政府缺乏倾听民众呼声的机制,那么他们就不会对公众的利益,尤其是弱势群体的利益作出有利的反应,这些阶层的公众往往很难使他们的意见传达到权力通道,如果政府不知道公众需要什么,那么即使是怀着最好意图的政府也不可能有效地满足他们的需求,作出合理的预算决策。哈贝马斯围绕这一理念提出“理想对话共同体”和“沟通理性”等概念,在他所设想的理想决策环境下,没有个人或理念上的层级限制,公开场合下所有意见都具有同样的价值,而且为了彻底实现社会公正和理性,各种观点都应当充分表达出米。显然,这种模式的决策效率会受到影响,但参与对决策民主化的促进以及这种决策方式可能带来的创新理念,会使额外的付出得到补偿。
以公众为中心意味着在公共预算决策方面为公众提供更全面的信息、更高的透明度、更多的参与渠道。不论是讨论公共资源的总体配置方式、支出优先项目的确定、设计社会援助计划、确定征地动拆迁标准,还是制定经济和社会中长期规划都应如此。因为仅凭公共部门内部的专家无法获得制定政策所需的全部信息,甚至得不到正确的信息。因此,如果排除公众对公共预算决策的参与,必然会造成决策上的失误。如果坚持公众对预算决策的最终评判权,那么知情权和偏好表达机制便非常重要。越来越多的证据表明,当政府寻求了潜在使用者的参与,当政府预算汲取了社区的社会资源潜能而不是试图与之作对时,这些预算可以取得更好的效果。其效益显示在预算的实施更平稳,可持续性更强,政府机构得到的反馈更好。
从决策过程来看,以公众为中心意味着决策更倾向于由下而上做出。也就是说,这种模式偏向于多中心分权化决策更甚于集权化的科层制,在政府部门间引入竞争机制在某种程度上可以说是对市场化模式的模仿。因此,与计划经济时代的情况不同,基层管理人员对预算决策会有相当的(但不是决定性的)影响力,而决策本身也更具针对性和代表性。技术手段的发展也为建立以公众为中心的治理模式创造了条件,互联网的发展正在转变公众与政府之间的沟通方式,构筑电子政府便是其中革命性的一步,在这种信息不受时空限制的快捷方式下,政府机构将通过安全的互联网处理业务,电子民意调查、电子投票、电子选举、电子邮件等多种方式被用于连接公众的申请并保护隐私。“这一双向性的运动重塑了民族——国家的权威,因为这一条道路可以使国家得以回应各种各样的冲击……使国家重获(对公众的)影响力。”这将大大加强公众与政府的互动,推动了公民与政府官员的直接对话,提高了民意在政府决策中的份量,培养现代公民意识,推动民主政治的发展,同时也从根本上重塑了政府回应公众需求的能力。
二、建立以结果为导向的政府
建立以结果为导向的政府,意味着不仅要重视公共资源的配置,还要重视公共项目的实施效率,即如何以最小的成本满足公众的需求。过去,这方面的焦点主要是腐败问题,但当人们逐渐转变观念,将浪费、滥用和欺诈也视为一种腐败之后,绩效变得同清廉同样重要,部分国家还通过出台法律法规使绩效和结果导向制度化(例如,1993年美国政府出台《政府绩效与结果法案》,要求每个联邦机构提供五年期战略规划和每年的绩效情况)。具体做法:一是将预算决策与绩效联系起来,包括对指定计划提交以绩效为基础的预算,使指定计划的具体绩效目标与资金水平相一致,计划负责人对目标的实现情况直接承担责任;通过立法使计划负责人对支持服务、固定资产和雇员福利承担责任;在预算和绩效衡量标准之间建立更紧密和广泛的联系等。二是取消重复和无效的计划。政府通过行政审批制度改革和“日落法则”,定期不定期重新审视现有开支项目,取消那些已完成使命的计划、无效过时的计划,重新安排资源,使必不可少的重点计划拥有更多的资金和选择余地。三是扩大以绩效为基础的合同的应用。在公共事务日趋复杂,而同时政府机构编制和人员相对有限的前提下,各机构不得不更多地依赖于外部合同单位。随着资金数额和合同种类的不断增加,建立以绩效为基础的合同体系的必要性增加,合同的重点应放在要得到的结果,而不是工作的态度或付出多少努力和成本。四是将尽可能多的政府机构转变为以绩效为基础的组织。赋予计划负责人更大、更广泛的重建工作团队的权力和手段,充分利用信息手段使组织扁平化,减少管理中间层,增加直接与公众打交道的服务提供人员,使公共部门反应更灵敏、工作更有效率。
绩效衡量是以结果为导向治理模式的核心,人们普遍希望通过项目测量(如产出量、单位成本、有效性测量、服务质量测量、公民满意度测量)和综合测量(如副作用测量、分配测量、无形测量)来建立一个根据客观结果对政府机构进行评估的系统,摒弃以往按所创立的项目或所花费的资金来证实自身合法性的传统途径。虽然绩效衡量的标准上存在诸多争议,但在一个决策民主化不断推进和科学主义盛行的时代,结果导向和绩效衡量已深入人心,具有持久的生命力。
三、建立植根在市场基础上的政府
关键词 模式分析 计算机视觉 教学改革
中图分类号:G643.2 文献标识码:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析与智能计算研究所师资团队是江苏省“青蓝工程”创新团队,主要研究领域包括智能数据分析、图像处理和机器视觉等方向,承担研究生和本科生的模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程的教学任务。以往的教学过程中虽然积累了丰富的教学经验,但当前新知识不断涌现、新技术发展迅猛,对模式分析与视觉处理课程群的知识体系、实践体系改进提出了新的挑战。
近年来,国内外高校在该类课程教学上,已涌现出众多新理念、新方法。Coursera联合创始人Andrew Ng推出的机器学习课程,开启了教育领域的MOOC时代,引领了教育教学方法的新革命。①深圳大学、②江苏科技大学③分别进行了基于CDIO工程教育理念的计算机视觉课程教学改革实践,实现多层次项目设计的教学模式改革,讲座式、讨论式、实践式教学方法的探索。国防科技大学④在计算机视觉课程中引入研讨式教学模式,通过案例教学、小组研讨的方式来替代传统的教学方式。华中科技大学⑤从教学内容国际化、教学方式国际化、教学成果国际化三个方面开展了计算机视觉课程的国际化建设。另外,也有高校进行了图像工程课程群建设,⑥基于图像分析与计算机视觉应用课程结合的项目协同创新能力培养实践。⑦
在分析上述国内外高校该类课程改革的基础上,我们重点以模式分析与视觉处理课程群的实践教学体系改革为切入点,优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
2 模式分析与视觉处理课程群特点
模式分析与视觉处理课程群涵盖了模式识别、机器学习、数据挖掘、数字图像处理、计算机视觉等多门课程。该类课程存在以下特点。
(1)该类课程属于多学科交叉,涉及的知识面既广又深。由于该方向涉及计算机科学与技术、应用数学、自动化、电子科学与技术、信息工程等多学科内容,而学生在大学本科阶段很难学习和了解如此多的知识模块,这对研究生阶段学习来说,具有相当大的挑战。同时,对于每个知识模块,所要求的数学基础较高,理论具有相当的深度,理解和掌握不容易。
(2)该类课程既重视扎实的基础理论,也强调良好的工程实践能力。该类课程的基础理论教学一直受到各高校的重视。随着近年来产业界的迅猛发展,计算机视觉应用层出不穷,对学生的工程实践也提出了更高要求,需要能够在系统层次上有整体认知,同时要能对各功能模块进行优化,提升系统的整体性能。
(3)该类课程所面向的选修学生面广。该类课程既是多学科交叉,也面向计算机应用、电子科学与技术、自动化、应用数学等不同研究方向、不同水平层次的研究生开设。这对课堂教学和实验实践也带来更大挑战。
3 模式分析与视觉处理课程群改革举措
针对上述分析的课程群特点,我们重点以实践体系改革为突破口,通过优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式等举措,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
3.1 师资队伍结构优化
为了学生能够适应模式分析与视觉处理产业的快速发展,在课程群建设过程中更强调学生的工程实践和创新能力培养。这首先对师资队伍结构提出了新的要求。
近年来,课程教学团队引进海内外具有深厚理论功底和较强工程能力的高水平师资4名,大大充实了机器学习、数据挖掘、图像处理等课程的教学力量。对于现有教师队伍,鼓励教师跟产业一线企业广泛合作,目前已与华为、中兴等企业在视频检索、智能交通视觉处理等方面开展了实质合作。这些来源于产业界的高质量课题对科研和教学起到了良好的促进作用。
与此同时,通过研究生工作站、企业短期实习等渠道,鼓励企业高级研发人员参与到学生实践能力培养环节中,将实际项目进行适当切分或提炼,实现该类课程实践环节的模块化、专题化训练。
综上,通过引培并举,优化校内师资队伍结构;通过校企合作,积极吸引企业师资参与。良好的师资队伍为该类课程的实践体系改革提供了有力支撑。
3.2 课程群知识体系梳理与授课模式改革
模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程既有一定的逻辑关系,也存在相互交叉的混杂关系。一般认为,模式识别、机器学习是模式分析与视觉处理领域的基础理论课程,数据挖掘是建立在模式识别、机器学习和数据库基础上的应用类课程,智能信息检索则是数据挖掘基础上更为具体的应用实现。数字图像处理为计算机视觉课程提供了基础支撑,计算机视觉则是在综合利用模式识别、机器学习、数字图像处理、数据挖掘等知识模块基础上面向应用的系统实现。但是,这些课程也存在着知识点的交叉或重复。例如,模式识别和机器学习中都有贝叶斯参数估计、支持向量机模型等知识点,但视角和侧重点有所不同;图像处理、计算机视觉中都有颜色模型、成像模型等知识点,也同时存在与模式识别、机器学习交叉的知识点。
我们针对来自不同研究领域的学生群体,对该课程群的知识点进行系统梳理,既避免知识点的重复讲授,也防止重要知识点的缺漏。课程教师集体讨论,形成每门课程的核心知识集,和针对不同研究领域的选讲知识集。学生在学习课程时,在掌握核心知识集的基础上,结合自己的研究方向选择相关的选讲知识集学习。
在课程教材和参考书的选择上,注重挑选国际上有影响力的教材。例如,模式识别的参考书为Richard O. Duda等人编著的Pattern Classification;机器学习的参考书为Tom M. Mitchell编著的Machine Learning和Christopher M. Bishop编著的Pattern Recognition and Machine Learning;数据挖掘的参考书为Jiawei Han等人编著的Data Mining:Concepts and Techniques;数字图像处理的参考书为K. R. Castleman编著的Digital Image Processing;计算机视觉的参考书为D. A. Foryth编著的Computer Vision: A Modern Approach和Richard Szeliski编著的Computer Vision: Alogrithms and Applications。这些教材已被国内外著名大学普遍采用。同时,每门课程都提供相关的国内外顶级会议和期刊的列表,供学生课后追踪研究领域的热点问题。
在课堂授课环节上,注意采用灵活多样的授课方式。对于核心基础知识模块,以教师讲授为主,同时提供国内外该类课程的热门MOOC网址给学生参考。对于选讲知识模块,鼓励学生事先结合各自研究方向有目的自学,在学生报告的基础上进行课堂讨论方式进行。充分发挥学生学习的主体作用,也便于教师了解学生的水平和学习状况。
除此以外,不定期邀请国内外著名学者来校做学术报告,让学生充分了解该研究领域的最新前沿动态,并就热点问题进行专题讨论。
3.3 课程群实践体系完善与考核方式改革
工程实践和创新能力的培养是该课程群改革的重要目标。我们在上述师资队伍结构优化、课程群知识体系梳理与授课模式改革的基础上,着力进行课程群实践体系的改革与完善。我们通过多层次菜单式的实验项目选择、项目牵引的创新能力训练、学生综合研究能力的全面考查等方面来实现。
首先,整合和优化课程群实践内容,实现多层次菜单式灵活选择。根据各研究领域的要求进行灵活搭配,根据学生个体的能力与水平选择适当规模和难度的实践内容,通过课程内的基础实验、课程间的综合实验、课程群的创新实验来选择和组合,如图1所示。
图1 多层次菜单式实验内容示意图
基础型实验内容主要是各课程核心知识点的实验验证,主要包括模式识别,机器学习,数据挖掘,图像处理与分析,计算机视觉等课程的实验。要求选课学生对这些基础实验必做,打下良好的研究基础。
综合探索型实验在基础型实验基础上,既有单门课程内总的综合实验,也有课程间知识的综合应用。主要分为两大块,包括模式分析与机器学习方向的综合实验,以及图像处理与机器视觉方向的综合实验。实验目的主要是针对这两大块方向重点知识的综合分析和比较,能够熟练掌握和灵活应用。例如模式分析、机器学习、数据挖掘等方向都用到的线性判别分析、支持向量机、均值聚类等内容;图像处理与机器视觉中的图像特征抽取、视觉系统选型、目标检测、特定平台的算法优化等内容。学生可根据各自研究方向有目的的选择两块综合实验的大部分内容。
在综合型实验基础上,该课程群通过若干创新型实验来检验学生理论知识掌握程度和实践方法应用能力,为后续的研究课题开展打下良好的科研素养。主要内容包括人脸识别、二维条码识别、车辆属性识别、智能视觉监控、以及企业来源的关键技术等。这些项目实践既涉及用到图像处理与机器视觉的内容,也涉及模式分析与机器学习方向的知识。并且需要学生在综合运用相关知识的基础上有创新能力。
其次,重视各类项目牵引的创新能力训练。一方面,鼓励教师从国家自然科学基金、企业合作项目等研究中提炼出问题规模和难度适中的训练项目,作为课程群的综合能力训练项目。另一方面,鼓励学生参加挑战杯、全国研究生智慧城市技术与创意设计大赛等各类具有挑战性的竞赛项目,以赛代练,提升学生的工程实践和创新能力。同时,也鼓励学生利用百度、微软等相关研究领域的企业实习机会,参与产品一线的工程实践能力训练。
再次,注重考核环节,实现科研素养和实践能力的全面考查。只有严格、公平、公正的考核,才能保证实验实践的质量和水平,才能提升学生的科研素养和实践能力。我们主要在手段、方式方法上进行了改进。在题目选择上,根据学生个体水平和研究领域要求的差异,在选题上有适当的难易区分度,让每位学生都有锻炼和提升的机会;在考核方式上,采用结题书面报告来检验学术论文的写作能力,采用程序演示检验系统的设计与实现水平,采用上台汇报的方式检验学生的表达能力,多管齐下全面检查学生的综合科研素养;在考核成绩评定上,采用现场教师和学生共同评分的方式,公平合理;最后,通过网站展示、发表学术小论文、专利、软件著作权等方式展示和公开优秀成果,激发学生的学习热情,并由此形成积累,有利于学生实验实践氛围的传承。
4 结语
本文在分析国内外高校模式分析与视觉处理类课程群改革现状的基础上,以学生国际化视野、理论联系实际、工程实践和创新能力全面提升为目标,重点开展了师资队伍结构优化、课程群知识体系梳理、课程授课模式改革、课程群实践体系完善和实践考核模式改革等工作,取得了良好的效果,并为校内其他课程群的教学改革作为示范推广。
注释
① https:///learn/machine-learning/
② 郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践.理工高教研究,2010.29(5):98-100,148.
③ 史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践.计算机教育,2013.9:40-43.
④ 陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式.当代教育理论与实践,2013.5(7):112-114.
⑤ 王岳环,桑农,高常鑫.计算机视觉课程的国际化教学模式.计算机教育,2014.19:101-103.
关键词:智能科学与技术专业;课程体系;教材建设
继2004年北京大学率先在国内建立“智能科学与技术”本科专业之后,2005年,北京邮电大学、南开大学和西安电子科技大学;2006年,首都师范大学、北京信息科技大学、武汉工程大学和西安邮电学院;2007年,北京科技大学、厦门大学和湖南大学;2008年,河北工业大学和桂林电子科技大学;2009年,重庆邮电大学和大连海事大学;2010年,中南大学和上海理工大学先后经教育部批准先后设立了“智能科学与技术”本科专业[1-2]。在中国人工智能学会教育工作委员会的指导下,自2002年起,各相关专业教师定期召开智能科学与技术教育学术研讨会,并出版教育论文专辑,大力推进了我国智能科学与技术教育的健康、快速发展,并对我国智能科学技术的人才培养和学科建设起到了极大的带动作用。
作为一个发展中的新兴专业,目前各高校仍主要结合自身基础和特点建设该专业。如南开大学以智能技术与智能工程为核心专业课程[3];北京科技大学从社会需求角度出发,以提高学生软件实践能力为切入点[4];河北工业大学根据相关专业的就业现状,以提高学生硬件实践能力为着力点[5]。为了解决南开大学、北京科技大学和河北工业大学3所高校共同面临的课程体系和教材建设等问题,三校教师分别于2010年6月16日和8月2日在南开大学、河北工业大学进行了两次研讨,现将研讨成果汇总于此。
1研讨背景
“智能科学与技术”专业自开办以来,不可避免地要回答如下3个方面的问题:
1) 来自用人单位的问题:“智能科学与技术”专业是做什么的?与其他专业相比优势何在?
2) 来自学生及家长的问题:“智能科学与技术”专业是学什么的?与其他专业相比优势何在?
3) 来自教师自身的问题:“智能科学与技术”专业应该教什么?与其他专业相比优势何在?
无论是做什么、学什么还是教什么,归根到底是课程体系和教材内容。无论是研究生课程下移(带来学生接受知识的困难),还是在其他专业教学体系基础上做简单的增、删、改(带来学生知识结构的凌乱),都是不行的,长此以往的后果将是没有优势,只有劣势。
南开大学、北京科技大学和河北工业大学3所高校的“智能科学与技术”专业建设都源于自动化专业基础,而且都具有典型的工科特色;同时3所高校分别是教育部直属“985”高校、教育部直属国家“优势学科创新平台”建设项目试点高校和河北省属“211”高校,3所高校的“智能科学与技术”专业分别于2006、2007和2008年招生。3所高校在“智能科学与技术”专业建设上的异同特点以及地域便利的条件,为优势互补、交流融合提供了机遇。
2课程体系
根据研究任务的不同,智能科学技术涵盖的内容可以划分为智能科学、智能技术、智能工程三个层次[6]。
1) 智能科学:主要任务是研究人的智慧,建立人机结合系统理论,并用其模拟人的智慧。
2) 智能技术:在智能科学的框架内创建人机结合智能系统所需要的方法、工具和技术。
3) 智能工程:利用智能科学的理念和思想,充分运用智能技术工具创建各种应用系统。它是当前新技术、新产品、新产业的重要发展方向、开发策略和显著标志。
根据上述智能科学技术的划分,智能科学与技术专业的课程体系同样划分为理论、技术与工程应用3个层次,具体框架如图1所示。
需要说明的是,由于课时、学时等因素的限制,有些课程需要包含未列入课程的部分内容。如智能科学与技术概论课程内含系统论的简要介绍;智能控制系统包含可编程序控制器、智能传感器、智能执行器等内容;智能工程包含若干典型智能系统实例。
3教材建设
经南开大学、北京科技大学和河北工业大学3所高校的讨论,一致认为工科专业应以技术和工程应用两个层次为核心,并将人工智能导论和智能信息处理两门课程的教材合并为智能技术。同时,根据南开大学侧重理论、北京科技大学侧重软件、河北工业大学侧重硬件的原则进行分工,编写对应课程的教学大纲和教材内容。
3.1智能技术
本课程包括智能计算和计算机视觉两部分,分别介绍以对人脑的物理结构进行模拟为主要特征的联接主义智能技术和以模拟人类视觉处理为主要特征的计算机视觉两部分。它是智能技术的主干内容;也是实现智能技术、组成智能系统的重要工具,属于本专业本科生的专业基础课。通过智能技术的学习,学生应能够掌握智能技术的基本原理和方法。通过课堂讲解、,并配合一定的作业练习、上机实验等环节,学生应初步具备运用智能技术和方法分析和解决问题的能力。本课程拟定90学时,其中授课54学时,实验36学时。
教材内容包括智能计算和计算机视觉两部分,智能计算部分包括神经网络、模糊理论和遗传算法/蚁群算法,计算机视觉包括计算机视觉导论、计算机视觉理论基础、图像预处理、图像分割、物体识别、图像理解、双目立体视觉、三维视觉技术、主动视觉。
神经网络讲授单个神经元(感知器)的动作原理,与实际生物神经元的对应关系;讲授BP神经网络的组成,网络的特性和对非线性函数的模拟功能;介绍BP算法的优、缺点;讲授H网络的组成结构,H网络在解决优化问题的优越性。模糊理论讲授模糊集合的概念,建立隶属度函数的概念;介绍模糊规则的建立原则,模糊规则与模糊系统收入输出量之间的关系;介绍模糊化以及模糊量精确化的几种常用方法。遗传算法和蚁群算法只作简要介绍,重点介绍这两种算法的特点和成功的应用实例,使学习者有一个感性认识,明确这种类型算法的“迭代”特点以及总体最优目标与个体行为之间的联系。
计算机视觉理论基础主要介绍Marr的视觉计算理论、图像的相关知识、傅立叶变换基础;图像预处理主要介绍像素亮度变换、几何变换、直方图修正、局部预处理、图像复原;图像分割主要介绍阈值处理方法、基于边界的分割方法、基于区域的分割方法;形状表示与描述主要介绍链码、使用片断序列描述边界、尺度空间方法、基于区域的形状表示与描述;物体识别主要介绍知识的表示、统计模式识别、神经元网络、遗传算法、模拟退火、模糊系统;图像理解主要介绍并行和串行处理控制、分层控制、非分层控制;双目立体视觉主要介绍双目立体视觉原理、精度分析、系统结构、立体成像、立体匹配、系统标定;三维视觉技术主要介绍结构光三维视觉原理、光模式投射系统、标定方法、光度立体视觉、由纹理恢复形状、激光测距法;主动视觉主要介绍从阴影恢复形状、从运动恢复结构、主动跟踪。
3.2智能控制理论与技术
本课程是“智能科学与技术”专业的一门重要专业课程,目的是使学生了解智能科学与控制理论结合所产生之智能控制理论的基本概念和应用价值;使学生熟知当前主流智能控制技术的种类,并掌握模糊控制、神经网络控制以及进化计算、群体智能的基础知识,了解智能技术与传统控制方法的结合点;加强MATLAB仿真实验的训练,以使学生更好地理解基础知识,培养学生使用高级智能控制方法解决实际控制问题的能力。本课程的学习将使学生加深对控制理论的理解,明晰智能技术在控制中的应用技巧,也为本科生继续深造打下基础。本课程拟定64学时,其中授课54学时,实验10学时。
教材内容包括智能控制概论,介绍智能控制的发展历程和应用领域,简介几种重要的智能控制方法;专家控制,简介专家系统的基本结构,讲授专家PID控制器的原理与设计方法;模糊控制,讲授模糊数学基础知识、传统的模糊控制原理和控制器设计与实现方法、模糊PID控制的两种形式,特别是PID控制参数的模糊整定技术;神经网络控制,讲授前馈神经网络和递归神经网络中几种典型的网络模型以及学习算法、基于神经网络的线性系统辨识技术、神经网络逆模控制等;进化计算与控制,讲授进化计算的概念、遗传算法的原理及其与其他智能方法的结合,介绍遗传机器人学;群体智能与控制,讲授蚁群算法的基本原理及其在控制问题中的应用,介绍群体机器人学。
3.3单片机原理与应用
本课程是“智能科学与技术”专业的一门专业课程,目的是使学生了解单片机的组成原理及常用控制算法的实现;掌握51系列单片机指令系统和一般汇编程序设计编写方法;熟悉常用的单片机硬件扩展技术;在此基础上,熟练掌握控制算法的单片机程序编写与调试。本课程拟定54学时,其中授课38学时,实验16学时。
教材内容包括单片机系统概述,介绍单片机定义、单片机发展过程及单片机硬件结构;单片机指令系统及程序设计,介绍指令系统和汇编语言程序设计;硬件资源及接口技术,介绍硬件资源和接口技术;单片机使用技术,介绍抗干扰技术、C语言应用程序设计;依次介绍PID控制器、状态反馈控制器、模糊控制器、系统辨识、卡尔曼滤波、滑模控制器、最优控制器、鲁棒控制器、自适应控制器、神经网络控制器的历史沿革、基本原理、常用形式和单片机具体实现方法。
3.4嵌入式系统
本课程以当前主流的嵌入式系统技术为背景,以嵌入式系统原理为基础,以嵌入式系统开发体系为骨架,以嵌入式控制系统开发为目标,较为全面地介绍嵌入式系统的基本概念、软硬件的基本体系结构、软硬件开发方法、相关开发工具、应用领域、热门领域的开发实例以及当前的一些前沿动态,为学生展示较为完整的嵌入式控制系统领域概况。本课程拟定64学时,其中授课48学时,实验16学时。
教材依据嵌入式控制系统的特征,将控制算法、嵌入式系统硬件、操作系统、应用程序设计及组态软件作为统一的技术平台介绍,突出嵌入式技术在控制系统中应用的特点,重点介绍嵌入式控制系统软硬件、电路、操作系统、实时性、可靠性等特性,从软件体系结构及开发的角度出发,强调实时调度、Bootloader、BSP、嵌入式实时多任务系统设计、交叉开发与仿真开发等关键技术,并特别引入了工业控制中需要的电磁兼容性设计和大量的典型嵌入式控制系统实例设计。通过本课程的学习,学生不但可以学会使用工具开发嵌入式软硬件,而且可以从总体角度选择适当的技术和方法,全面规划和设计嵌入式系统。
3.5智能工程
本课程是“智能科学与技术”专业的一门核心专业课程。面向智能技术的实际应用,着眼于解决工程应用中的技术问题,从典型系统设计案例分析出发,通过大量实验提高学生的工程实践能力。本课程拟定36学时,全部为授课学时。
教材内容包括智能工程概论,介绍智能工程现状、工程设计原则和工程实际流程;常用传感器原理,介绍传感器一般特性、光电式传感器和视觉传感器;典型智能系统设计案例,包括智能移动机器人、智能电梯群控电梯等系统。
3.6智能机器人
课程通过对一个具有代表性的仿人机器人的拆解,将知识点拆解成6个主要教学模块:1)机器人控制模块,介绍各类控制模块的原理与组成;2)机器人运动系统,介绍电机与舵机的原理与控制方法;3)机器人动作系统,介绍机器人各部件的协调控制;4)机器人视觉系统,介绍典型的超声波、影像传感器的原理与识别算法;5)机器人表现系统原理,介绍人与机器人的交互原理;6)机器人通信系统原理,介绍机器人之间的数据与信息传递方法。学生学习时,能够与基础知识相联系,并能掌握机器人这门技术,为从事机器人产品研发工作打下坚实的基础。本课程拟定54学时,其中授课44学时,实验10学时。
教材面向“智能科学与技术”专业,同时兼顾信息类专业学生编写,根据这类专业学生的知识结构和特点组织内容。从具体的机器人控制需求出发,将自动控制的基本理论和机器人控制特点相结合,讲授机器人控制系统的组成、规律、特点和设计方法。理论上反映当前的最新进展,内容上考虑初学者的需求,侧重普及性、实用性和新颖性,结构体系符合信息类和控制类专业学生的特点,力求简洁、清楚,对技术的叙述遵循目标、问题、理论依据、实现方法、实际情况、发展方向的方式。做到重点突出,符合实际,满足需要,指导性强。
3.7智能控制系统
本课程是“智能科学与技术”专业的一门专业课程,使学生了解智能控制系统的基础知识;掌握智能控制系统中最新的智能传感技术、智能控制器、智能执行能执行器及智能网络与接口技术;掌握智能控制系统中多个关键硬件装置的识别及其使用。通过学习多个智能控制系统的开发实例,学生应掌握智能控制系统的设计方法与技术,坚实地掌握最新智能控制系统知识,提高理论联系实际的能力,并为学习其他课程的打下坚实基础。本课程拟定64学时,其中授课48学时,实验16学时。
教材内容包括概述,介绍智能控制系统的基本概念、基本内容和机构及其发展趋势;智能传感系统,讲授智能数据采集技术、传感器智能化的数据处理方法、多传感器信息融合的方法、智能传感器实现方法与典型实例;智能控制器设计,讲授基于单片机的智能控制器设计及其应用、基于高性能嵌入式ARM的智能控制器设计及其应用、基于PLC的智能控制器设计及其应用;智能电动执行器,讲授智能电动执行器的硬件实现技术,软件设计技术以及典型的智能电动执行器实例及其应用;智能网络与接口技术,讲授无线传感器智能网络,工业现场总线网络以及智能传感器、智能控制器和智能执行器的网络接口实现技术;智能控制系统设计实例,综合利用前面的知识设计网络化智能压力传感器的系统设计、基于声音定位的智能机器人系统设计、基于微机电惯性传感器的汽车多路况智能防撞系统的设计、大型设备的PLC智能控制系统设计。
4结语
通过南开大学、北京科技大学和河北工业大学3所高校的研讨,我们凝练出较完整的“智能科学与技术”专业课程体系,体现出本专业的特色;提出可供3所高校共同使用的教学大纲和教材内容,体现出学生培养的工程实践导向。这些研究成果可以为开办“智能科学与技术”专业的兄弟院校进一步研讨提供蓝本,也可以为筹建该专业的高校所参考。
注:本文受到北京科技大学教学研究会第六批教学研究课题、北京科技大学教育教学研究基金青年教师教育教学研究立项项目、河北工业大学教改项目(2010-12)支持。
参考文献:
[1] 王万森,钟义信,韩力群,等. 我国智能科学技术教育的现状与思考[J]. 计算机教育,2009(11):10-14.
[2] 教育部关于公布2009年度高等学校专业设置备案或审批结果的通知[S]. 教高〔2010〕2号,2010.
[3] 方勇纯,刘景泰. 南开大学“智能科学与技术”专业教学体系与实验环境建设[J]. 计算机教育,2009(11):21-25.
[4] 石志国,刘冀伟,王志良.“智能科学与技术”本科专业软件实践类课程建设探讨[J]. 计算机教育,2009(11):93-97.
[5] 刘作军,张磊,杨鹏,等. 谈我校增设“智能科学与技术”专业的设想与措施[J]. 计算机教育,2009(11):53-56.
[6] 卢桂章. 无处不在的智能技术[J]. 计算机教育,2009(11):68-72.
A Study on the Course System and Textbook Construction for the Discipline of
Intelligence Science and Technology
YANG Peng1, ZHANG Jian-xun2, LIU Ji-wei3, ZHANG Lei1
(1. Hebei University of Technology, Tianjin 300130, China; 2.Nankai University, Tianjin 300071, China;
3. University of Science and Technology Beijing, Beijing 100083, China)
关键词:数字图像处理;教材;算法
作者简介:孙水发(1977-),男,江西黎川人,三峡大学计算机与信息学院,副教授;夏平(1967-),男,湖北麻城人,三峡大学计算机与信息学院,教授。(湖北 宜昌 443002)
基金项目:本文系2011年三峡大学教学研究项目(项目编号:J2011059)、2012年三峡大学研究生课程建设项目“数字图像处理”的研究成果。
中图分类号:G642.0 文献标识码:A 文章编号:1007-0079(2013)16-0088-02
考虑到人眼是人类获取信息的主要来源,图像信息的一目了然及现代科学技术的发展,使得图像处理的基本知识越来越重要,因此国内很多高校的诸多专业都开设了“数字图像处理”相关课程。该课程主要面向高年级本科生及研究生,其任务是介绍数字图象处理的基本理论与基本方法,并结合应用讨论具体的算法分析及实现技术。主要内容包括:图像的获取与显示、图像的表示、图像的空间操作及频域操作、彩色图像处理以及形态学操作等,具体涉及的技术包括图像增强、图像复原、图像压缩、图像分割,以及为图像分析作基础的图像表示与描述,以及基本模式识别的内容。但由于各类专业背景的差异、年级层次的不同,使得在教学上存在很大的不同。本文以笔者近年在给三峡大学(以下简称“我校”)医学影像专业、数字媒体专业以及电子信息工程和通信工程几个本科专业学生以及计算机科学与技术研究生的教学实践,探讨一些“数字图像处理”课程的教学体会。考虑到教材的权威性及普适性,我们选用了由阮秋琦等翻译,电子工业出版社2003年出版的冈萨雷斯版的《数字图像处理(第二版)》教材。
一、教材分析
冈萨雷斯版《数字图像处理(第二版)》教材是图像处理领域的经典教材,据其官网http://imageproces /显示,该教材被超过50个国家的1000多所高校采用,实际情况应该远远超过这个数据。因此该教材具有较强的普适性、权威性等,该教材的主要特点分析如下。
1.自成体系
该教材从基本的图像成像开始,到图像的矩阵、表示这些基本的图像处理概念,到后续的各个图像处理技术的讨论,都可以不用借助其他参考资料即完成内容的讲解。
2.使用面广
正如其官网显示,在具有如此众多的读者情况下,一方面表明该教材得到广大读者的认可,另一方面也为广大读者创造了一个优势,即一个公共的知识平台,使得用该教材所学知识进行交流无障碍。
3.资源丰富
该教材本身是本理论性很强的教材,但由于资源丰富,使得该教材并不显得那么枯燥。比如该教材有相应的网站,里面可以了解该教材的历史版本;教材的所有图片资料都可以在网站找到,方便做实验验证;网站有相应的论坛,可以借助网络进行共同学习。
4.与实验教学紧密结合
该教材有相应的配套实验教材《数字图像处理(MATLAB版)》,而且开发有相应的图像处理程序库DIPUM,与MATLAB版的DIP工具箱共同构成系统的图像处理仿真实验平台。而且教材中的部分效果都有相应的源程序,读者可以亲自演示,加深对知识的理解。
二、授课对象分析
在笔者近年授课对象中,既有大一下学期的“医学影像”专业的本科生,又有大三的数字媒体专业、电子信息工程和通信工程3个本科专业学生,更有研究生;由于自身研究领域是计算机视觉、生物医学图像处理,对于这些研究方向,图像处理是基础,对准备从事这方面研究的研究生其学习要求又不一样,具体分析如下。
1.医学影像学专业本科生
在该专业的培养目标中,明确提出“掌握常规放射学、CT、磁共振、超声学、介入放射、核医学等影像学基本操作技能,具有对常见病进行影像诊断和介入治疗进行操作的基本能力。”显然,了解数字图像处理基本理论与方法,是正确理解这些医学成像的基础,并且是用好这些医学影像原理的前提。但该专业毕竟是医学专业大类,具体的图像处理方法及其实现等并不是该专业核心需求。
2.数字媒体专业本科生
在该专业的培养目标中,明确提出“系统掌握数字媒体技术基本理论,具有计算机动画和计算机游戏等数字文化艺术作品的设计、制作和技术创新能力的复合性人才”。而无论是计算机动画还是游戏,都要求对图像、图形有基本的了解,包括获取、表示、描述及处理等。但该专业的核心应该是在图像、图像及三维模型的应用上,而不是底层的具体处理过程。
3.电子信息工程与通信工程专业本科生
图像处理一定程度上是二维的信号处理,因此对于系统学习过“信号与系统”、“数字信号处理”以及“随机信号分析”的高年级电子信息工程与通信工程专业的学生来说,他们更注重数字图像处理具体算法分析及实现技术。
4.计算机科学与技术专业研究生
智能信息处理是计算机科学与技术的一个重要研究方向,在智能信息处理领域,处理的对象通常是数字图像,比如指纹、人脸、虹膜、智能视频分析等等,因此掌握基本的图像处理理论与方法是从事该方向研究的必要前提。而且对于我校计算机专业的研究生,通常有两个原因使得他们对图像处理的知识了解不够深入:一种情况是其本科是计算机相关专业,没有修习这门课;另一种情况是从其他专业转到目前专业,修习过这门课程,但由于本科阶段这门课开课时间比较晚,比如大三下学期或大四上学期,学生要么准备考研,要么准备找工作,学生的学习精力不足,学习效果不好。因此有必要让学生进行系统的、深入的学习,为后续深入研究智能信息处理打下基础。
5.专门从事图像处理、计算机视觉方向的研究生
由于笔者从事医学图像处理、计算机视觉方向的研究,而这些方向的基础即是数字图像处理,因此对于自己指导的研究生,要求其对图像处理知识的掌握更加深入;而且由于学生规模小,上课方式相对较自由,因此可以探讨其他新的教学模式。
三、授课说明
冈萨雷斯版《数字图像处理(第二版)》教材虽然公式不多,但理论性较强。对于前面提到的5类学生,教学内容及方法肯定需要进行区分,具体说明如下。
对于低年级的“医学影像学”专业和高年级的“数字媒体”专业本科生,他们的共同特点是需要对图像处理的效果有较好的掌握,相反对于处理的原理他们仅仅需要了解,而很多数学的内容,比如频域图像处理仅仅需要点到即可。但由于年级及专业背景的不同,教师讲授的方法肯定也要不同。对于低年级的“医学影像学”专业学生,需要给学生介绍一些图像处理的工具软件,并进行课堂的演示,逐步把他们带入到图像处理的世界;而对于高年级的“数字媒体”专业本科生,由于他们已经具有较好的计算机基础知识,而且用过相关的图像处理软件,比如PhotoShop,因此这门课程的目的更多的是通过图像处理算法的学习,吸引他们探究相关图像处理软件功能原理的兴趣,从而达到综合、系统应用相关图像处理软件的目的。
对于高年级的“电子信息工程”和“通信工程”专业本科生,冈萨雷斯版《数字图像处理(第二版)》教材对他们来说不能算很难,但相对来说要在有限的学时(比如我校只有32个学时)讲完整本书的内容也不切实际,因此教师通常需要对课程的内容进行有针对性的裁剪。比如在我校,这两个专业都会讲授“多媒体通信”这类数据压缩相关的课程,因此原教材中的第八章可以不讲;而多尺度分析相对来说要求数学功底深,因此对于本科生点到即可。后续的第11和12章的内容显然超过了电子、通信本科生的知识范围,但可以当作课外读物推荐给学生,特别是对于有计划从事图像处理的学生,比如毕业设计选择了相关方向的学生。
对于计算机科学与技术专业的研究生,通常选这门课程的目的是要准备从事智能信息处理方面的课题研究,因此这本教材的知识面广、自成体系等上述优点得到充分的体现,甚至有学生说是他们的“宝典”。但显然,研究生教学与本科生教学有很大的区别,特别是针对各种层次、类别的研究生更是如此:比如有些研究生偏向工程应用,仅仅需要了解算法本身及其应用性能即可;但有些研究生偏向算法研究,则需要仔细推敲各个算法后面蕴含的本质。因此采用了分组的方式,每组成员先针对所涉及的研究方向开展资料查阅、讨论等过程,逐步形成一个主题鲜明的报告,并在课堂上进行汇报,教师进行点评和进一步讲解。这种方式提高了学生的参与程度,加深了学生对知识的理解。
对于笔者指导的研究生,由于涉及的研究方向为计算机视觉、生物医学图像处理等,则冈萨雷斯版《数字图像处理(第二版)》教材的内容是基础,而且学生数量少,学习方式可以很灵活。因此,为这些学生开了个读书班,以3个学生为一组,每周教师和所有研究生一起讨论教材里面涉及的每个知识点,不留死角,发现问题记录下来,讨论完后找资料,在下次讨论时再解决,通过这种方式使学生系统掌握数字图像处理基础知识、基本理论和方法,为学生今后开展相关方向的研究打下了坚实的基础。
四、总结
“数字图像处理”是高校面向本科专业及研究生专业开设的一门重要专业课程,冈萨雷斯版《数字图像处理》教材的权威性、内容的自包容性以及支撑资料全等优点,使其成为一部普适性很高的教材。本文结合笔者在不同专业、不同教学层次中的教学体会,研究基于该教材的教学方法,具有一定的理论与实践意义。该书第三版的中文版也于2011年出版,相信会对该课程的教学起到进一步的促进作用。
参考文献:
[1]冈萨雷斯.数字图像处理[M].第二版.阮秋琦,等,译.北京:电子工业出版社,2003.
[2]韩智,张振虹.“数字图像处理”实验课教学改革与实践[J].实验室研究与探索,2008,27(9):102-104.
[3]金炜,周亚训,等.“数字图像处理”课程项目驱动教学模式的实践[J].中国电力教育,2010,(7):82-83.
[4]张桂敏,汪熙.“数字图像处理”双语教学实施效果的调查与思考[J].中国电力教育,2010,(32):107-108.
[关键词]计算机工程 集成电路 无线网络
中图分类号:TP273.5 文献标识码:A 文章编号:1009-914X(2014)31-0298-01
随着现代科学技术的日益发展,越来越多的项目都需依靠计算机工程来开发、运用和完成。在飞速发展的21世纪,计算机工程所研究的内容包罗万象,其专业学科更是相当广泛。因此,计算机工程专业没有一个完全限定的范围。就目前而言,计算机工程专业主要包括:软件工程、编程原理、数据结构与算法、网络编程、微处理器和接口、软件技术与工具开发、算法设计与分析、软件系统架构。另外,计算机工程和电子工程密不可分,所以部分的电子工程专业也纳入计算机工程学的研究范围。
电子计算机工程是一个主要以电机工程学和计算机科学的部分交叉领域为内容的工程学,它的主要任务是设计及实现计算机系统的处理。计算机工程师通常受过专业的电子工程(或其他与计算机工程有关的电机工程学分支)、软件设计和软硬件集成综合技能的培训。工程师的主要课程有电学、系统分析、统计、模拟和数字电路、电子计算机辅助作图(CAD)、微处理机和微控制器、微波技术、光学技术、机械加工、数据通讯、计算机网络和技术报告写作等。基础知识包括数学、物理、计算机,逻辑思维、创造性思维、人际交流能力等。
计算机工程师的工作涉及很多计算机的硬件和软件方面的内容,其关注范围包括微处理器、个人电脑、超级计算机和电路设计(特别是集成电路的设计)等。计算机工程并不仅仅关注计算机系统本身的工作,还致力于多个计算机组成更大规模的分布式系统。涉及计算机工程的常见工作包括为嵌入式系统、微控制器、超大规模集成电路的编写设计软件代码和固件,此外还常常结合模拟的传感器、混合信号集成电路的设计,以及参与操作系统的设计。计算机工程和机器人的研究和设计也有一定的关联,特别是那些大量依靠数字系统来进行电动机、电脑辅助沟通、传感器相关系统监视、控制的机器人系统。
根据不同的研究、应用侧重,计算机工程可以分为下面这些专业领域。
一、软件代码、密码学和信息安全
主条目:信息安全
从事这一分支领域的工程师的工作包括信息的编码、解码,设计开发密码技术、网络安全、知识产权保护等。随着信息化的到来,计算机系统和互联网的安全成为一个关系到国家安全的问题,许多国家设立了专门的机构进行这一分支学科的研究。在民用领域,移动电话通信的保密也是这领域计算机工程师的工作重心之一。
二、通信和无线网络
主条目:无线网络
这一分支是电子学、通信技术和计算机科学的交叉领域,主要关注无线网络的通信质量和效率。高质量的无线网络对于军事上的远程控制至关重要,同时对于扩展民用便携设备的功能也至关重要。这一领域的工作人员需要研究信号的调制、解调,高清信号的压缩,可容错系统,以及降低信号在传输过程中出错的几率的方法。他们的研究涵盖了从基础的信号理论到实际的通信产品的广大范围。
三、计算机编译器和操作系统
主条目:编译器和操作系统
这一领域主要包括计算机编译器和操作系统的设计和开发。研究人员会设计更新的操作系统体系结构、更有的程序分析技术和提高程序可靠性。
计算科学与工程
计算科学与工程是一个较新的分支领域,和数学学科交叉较多。这一领域的工程技术人员主要考虑更优的计算方法、建模方法。他们的理论在超大规模集成电路的设计验证、半导体器件制造参数的确定、雷达系统的分析方面有着重要的应用。
四、计算机网络、移动计算和分布式系统
主条目:计算机网络和分布式计算
这个分支学科重点研究由多个计算机构成一个整体,并通过合理的方式来提高其共同工作时的效率。现代的科学技术研究、日常生活常常涉及大量数据的处理,这时,基于计算机网络的计算机集成系统(计算机集群)就能发挥其高超的计算能力,这在气象监测预报、生物科学探索等情况应用广泛。
五、计算机系统:体系结构、并行计算和可靠性
主条目:计算机体系结构和并行计算
这一领域的工程技术人员主要致力于研究提高计算机系统可靠程度、安全性和运算性能的方法。他们的工作可能包括设计用于多线程任务的微处理器等。他们也从事新的基础理论、算法和计算机工具的设计开发工作。
六、计算机视觉和机器人学
主条目:计算机视觉
通过机器“观察”外部信号的改变,并做出合适的处理,可以进一步提高计算机的能力。这一技术的前提是开发出高效的视觉传感软硬件,即能够快速捕捉周围环境的信息,并在短时间内用合适的信号来指代这些信息,然后还需要在计算机系统内部进行处理,最后让类似机器人的设备做出反应。这是人们一直希望能够实现的。当然,要研制出高性能的机器人,还需要强大的人类行为建模、图像处理以及人机界面等等。
七、嵌入式系统
主条目:嵌入式系统
这一专业领域内的工程师主要从事嵌入式系统的设计,致力于提高其速度、可靠性和工作特能。嵌入式系统存在于许多日常产品,从小型的收音机到大型的航天器中都可看到它的身影。现代的移动设备功能日渐强大,离不开高性能的网络技术和嵌入式系统。
八、集成电路设计、测试和计算机辅助设计
主条目:集成电路、超大规模集成电路和集成电路设计
计算机工程的集成电路分支主要包括电子学和电子系统的相关知识。这一领域主要致力于提高下一代超大规模集成电路及相关电子系统的速度、可靠性以及能源效率。 工程师利用有关的软件算法、硬件架构技术可以实现集成电路的低功耗设计。
九、信号、图像和语音处理
主条目:信号处理和图像处理
计算机工程的信号分支主要研究、开发与人机交互相关的内容,包括语音识别和生成、医学科技图像、通信系统等。这一领域的其他工作还包括计算机视觉开发,例如人类的脸部特征识别。
现如今的电子信息社会,计算机技术已经普及到了各行各业,人们的日常生活和办公已经离不开它了。我们要充分利用电子计算机技术,让计算机技术更好地服务于我们的生活。
参考文献
[1] 百度维基.
1.其中首要的一步,也是至关重要的一步就是确定项目.可以看出,项目的设计是整个教学的前提,项目的好坏直接影响到教学的开展.根据数字图像处理课程的内容体系,同时结合专业教师的研究方向和研究内容,确定项目“车牌识别系统”来组织整个数字图像处理课程的教学内容.车牌识别系统分为图像采集、图像预处理、图像校正、车牌定位、字符分割和字符识别等部分,并将它们作为子项目与数字图像处理的相关教学知识点建立对应关系,车牌识别项目贯穿整个教学内容的始终.整个项目教学过程见图2.从图2可以看出,数字图像处理的内容基本上可以通过车牌识别系统这一具体项目组织起来.除此之外,在实验课和实训课程中,也结合学生的兴趣以及指导教师的研究专长和所承担的课题,还设计了如人脸识别系统、计算机自动阅卷系统、图像碎片拼接系统、三维全景图的设计、计算机视觉的立体匹配及三维重建技术以及高光谱图像压缩等案例.
二、教学改革成果与分析
2013年以信息与计算科学专业11-1班为对照班,2014年以信息与计算科学专业12-1班为实验班,2个班级学生的学时数一样,学生起步几乎也是一样,讲授的数字图像处理课程主要内容相同.在11-1班中采用的是传统教学模式,讲授理论上的图像处理原理和方法;在12-1班中采用项目教学法进行教学.为了验证在数字图像处理课程中应用项目教学法的效果,对2个班级分别进行了数字图像处理理论知识测试和编写一个图像边缘提取的程序.理论知识测试结果见表1(满分100分).编程题是通过在线考试系统完成的,由计算机给出的成绩,编程题测试结果见表2(满分20分).
三、结束语
1摄像机定标
三维计算机视觉系统应能从摄像机获取的图像信息出发,计算三维环境物体的位置、形状等几何信息,并由此识别环境中的物体,图像上的每一点的亮度反映了空间物体表面某点反射光的强度,而该点在图像上的位置则与空间物体表面相应点的几何位置无关。为了定量地描述光学成像过程,我们首先定义以下三个坐标系:图像坐标系、摄像机坐标系与世界坐标系。
摄像机采集的图像以标准电视信号的形式输入计算机,经计算机中的专用模数转换板变换成数字图像。每幅数字图像在计算机内为数组,行列的图像中的每一个元素(称为象素,pixel)的数值既是图像点的亮度(或称灰度,若为彩色图像,则图像上象素的亮度将由红、绿、蓝三种颜色的亮度值来表示)。如图1-1表示,在图像上定义直角坐标系、,每一个象素的坐标分别是该象素在数组中的列数与行数。所以,是以象素为单位的图像坐标系的坐标。由于只表示象素位于数组中的列数与行数,并没有用物理单位表示出该象素在图像中的位置,因而,需要再建立以物理单位(例如毫米)表示的图像坐标系,该坐标系以图像内某一点为原点,轴与轴分别与、轴平行。摄像机成像几何关系可由图1-2表示。其中点称为摄像机光心,轴和轴与图像的轴与轴平行,轴为摄像机的光轴,它与图像平面垂直,光轴与图像平面的交点,即为图像坐标系的原点,由点与,,轴组成的直角坐标系称为摄像机坐标系。为摄像机焦距。
图1-2 摄像机坐标系与世界坐标系
摄像机坐标系与世界坐标系之间的关系可以用旋转矩阵与平移向量来描述。因此,空间中某一点在世界坐标系与摄像机坐标系下的齐次坐标如果分别是与,于是存在如下关系:
其中,为的旋转矩阵,为的平移矩阵,定义为
、、为坐标变换过程中沿轴,轴,轴三个方向的平移量。
下式是针孔模型下的透视投影变换:
从上面的的步骤我们可以得知,需要求解的参数有、、。旋转矩阵――的旋转矩阵包含了9个参数,为了运算简单起见,我们在实验中规定世界坐标系的三个轴方向与摄像机坐标系的三个轴方向平行,从而世界坐标到摄像机坐标的变换可以不做绕轴旋转,这时旋转阵为单位阵,此时,三维世界坐标系到摄像机坐标系的坐标变换方程可以简化为:
而平移矩阵包含的三个参数、、,这三个参数和摄像机的有效焦距,可以在摄像机拍摄的时候预先设定,这样就完成了摄像机标定的工作。
2人体骨架的三维重建
现在得到了摄像机参数,下一步就是从一个已知的二维关节点坐标出发,求出该点的三维坐标。
从图1-2的透视投影的针孔模型可以知道,连接摄像机光心和成像点之间有一条投影直线,该投影直线上所有的点投影到二维平面都成像于同一个点。所以可以先假设某一个基准点的三维坐标为已知,然后从该点出发,利用关节点之间骨骼的连接关系及人体骨骼长度知识依次求出其他关节点的三维坐标。而人体的骨骼近似刚体,所以假设骨骼的长度近似不变。
图1-3是本文所用的人体模型,假定第12个或第15个关节点为基准点,即人体的最低点为基准,该关节点的坐标为已知。假如已知的第15个关节点的三维坐标为,要求第14个关节点的坐标,则有如下关系:
即:
其中表示点与之间的距离。为人体模型中小腿的长度,其中已假设为已知,而坐标和是通过上一章中的跟踪得到的,这样只需求解方程就可以得到了,即可以求得第14个关节点的坐标值了。从上方程可以看出,的解将会出现以下三种可能:
1. 有两个解,说明该关节点有两种可能的位置,这种二义性是由于二维坐标向三维坐标恢复本身固有的问题,可以通过用户的交互以及人体运动的连续性原则消除这种二义性。
2. 只有一个解,此时该解就是所要求的值。
3. 无解,产生的原因有两个:一是跟踪得到的二维关节点坐标存在误差,这种情况可以通过人工交互重新跟踪来解决;另一个是作为先验知识的人体骨骼长度过短而产生的无解,这时可以适当地调整骨骼长度,然后再进行计算。
由于人体运动是连续的,所以图像序列中相邻帧之间人体关节点的三维位置是连续的,变化不大的,即相邻帧之间的人体运动中存在一些关节点,这些点的位置在一定的时间内保持稳定或者只做很小的位移。
3小结
本文在人体二维骨架的基础上,通过摄像机标定的基础知识对人体模型进行了三维重建,最终获得了整个人体的三维运动序列。本文提出的重建方法还存在一些限制和不足之处,还需要进一步的改进和完善。
参考文献:
关键词:人才培养;数字媒体技术;课程体系;游戏开发
1 背 景
江苏省政府和南京市把计算机软件产业作为优先鼓励发展的支柱产业,作为新兴战略性产业的重点发展。南京市政府特别重视计算机与信息产业的发展,提出提升规模、企业发展与创新的主要目标[1-2]。早在2011年,南京市委和市政府就提出《关于以打造一谷两园软件产业集聚区为重点高标准建设中国软件名城的意见》,提出将南京建设为中国软件名城的目标,计算机软件产业业务收入预期达到4 000亿元以上,并在2020年初步建成世界软件名城。从软件技术与专业人才培养角度来说,数字媒体技术作为计算机软件产业中的一个重要发展方向,虚拟现实技术与人工智能近年来日臻活跃,越来越显现出发展的活力与潜在的前景。数字媒体技术专业学生从总体上讲应具有较扎实的计算机和数字媒体基础知识,掌握数字媒体基础、图形图像处理、音频视频处理、流媒体、虚拟现实、游戏编程等专业基础知识;具备包括虚拟现实、多媒体编程、网络游戏、数字图像处理和计算机视觉等专业技术的能力,具有图形、图像、音频、视频处理及数字媒体应用系统开发的能力。
2 数字媒体技术专业预期形成的专业与人才特色
依据数字媒体产业中游戏行业对人才的迫切需求,以学生系统能力培养为主线,以新型应用型工程技术人才为培养目标,将当前游戏开发中的最新编程平台与先进技术引入专业课程体系,按照网络游戏与手机游戏开发工程师的知识和实践能力组织课程的设置,通过计算机图形学、三维建模、移动游戏开发编程、网络游戏开发编程、Unity3D开发引擎的游戏开发技术等专业课程的设置,突出以游戏开发工程师为培养目标的学生实践能力锻炼。数字媒体技术专业依托行业内企业多年的数字媒体产品开发经验与培训能力,进行产教融合与校企合作办学,突出以游戏开发为主的数字媒体技术方向的专业特色,更好地满足人才培养目标定位需求,并为后期工程教育认证打下基础。
3 数字媒体技术专业建设的主要内容
3.1 以游戏开发为主要特色的课程体系建设
突出以游戏开发为主要特色的数字媒体技术培养方向,主要专业基础与专业课程由以下组成:数字媒体技术基础、计算机网络、算法与数据结构、计算机图形学、三维建模、操作系统、面向对象程序设计、网络游戏开发编程、移动游戏开发编程、游戏UI设计、游戏算法、游戏开发技术、图形处理技术等。课程的总体分布与关系见表1。
我们多选用新出版的优秀教材,将教材的适用性作为教学过程控制的主要监测点。对于知识更新较快的课程,组织有经验的教师自编教材并及时修订,跟踪反映数字媒体技术产业的新技术、新成果。
3.2 实践实训基地建设
产学研结合的实践教学模式是计算机类专业办学的一大特色[3],学院始终把创建校外产学研实习基地工作放在重要位置,使得学生获得实际的研究、开发、设计的实践教学机会,全方位、系统地培养学生的技术应用能力和创新能力[4]。目前,数字媒体技术专业依托的计算机工程学院,同东软集团股份有限公司、中软国际集团有限公司、南京麦瑞克科技有限公司、江苏万和等多家大中型企业签订了《共建教育实习基地协议书》。通过校外实习基地,学生能够参与数字媒体产品开发过程,在实践中加强学生的实际工作能力[5],从而达到培养综合素质高、创新能力强、富有团队精神的应用型高级数字媒体技术专业人才的目标。学生从第6学期的专业实习、第7学期的工程项目实践与毕业实习参与到学院合作方――南京麦瑞克科技有限公司的研发项目中,专业实习与工程项目实践是数字媒体技术方向的重要教学环节。通过专业实习与工程项目实践,学生能够系统地掌握游戏开发的知识体系和整个流程,以及具体案例的开发过程,锻炼自身的实践动手能力。学生在实训中掌握了企业项目实际管理流程,提高了适应能力。学生以实践开发小组为单位完成相关系统功能与模块设计,撰写相应的策划文档以及开发规范文档,根据设计选择相应的技术进行资源优化和打包,对于系统进行集成开发与部署。开发报告应包含组员角色及分工、系统的分析和设计报告、项目开发流程管理的要点、实践总结等内容,并附有软件系统的完整开发用例源代码。指导教师根据实践的情况,包括实践小组的讲解和演示,总结实践开发的收获、创新与成果。
专业实习是综合性实践环节,通过专业实习可以让学生理解游戏系统的完整开发过程。专业实习涉及游戏UI设计、三维建模、图形处理技术等核心专业基础及专业课程。通过专业实习,学生可以在游戏开发的方法和技术、系统分析与设计、计算机软硬件的配置与管理、虚拟现实开发等方面得到锻炼。通过建模,学生可以完整地理解游戏场景系统开发的整个过程。例如在游戏场景房屋模型制作项目,通过三维建模与一些基本的操作命令,学生可以搭建常见游戏场景中的房屋模型,完成房屋模型制作的工作,为以后制作大型场景打下技术基础。
工程项目实践涉及面向对象程序设计、C#程序设计、移动游戏开发编程、游戏开发技术等核心专业课程。工程项目实践的内容包括联机火线战争、虚拟旅游、跑酷类游戏等综合性游戏开发项目,让学生对游戏的开发流程有详细的了解,熟练使用Unity游戏引擎工具,在游戏的策划―游戏的界面交互设计―游戏的开发逻辑―游戏优化―游戏―游戏上传等整个游戏开发全生命周期内进行综合性工程项目实践,同时工程项目实践有利于培养学生的书面表达能力、全面策划思考能力、自主学习能力、需求研发能力和探索创新能力。
3.3 合作办学
2016年起,金陵科技学院计算机工程学院与澳大利亚昆士兰理工学院(QUT)合作,采用“2+2”联合培养模式,共同培养数字媒体技术专业的本科人才。QUT课程体系采用CDIO工程教育思想,着重锻炼学生的综合素质和能力。自2016年开始学院在数字媒体技术专业人才培养方案中嵌入NIIT(National Institute of Information Technology,印度国家信息技术学院)课程模块,培养具备国际视野的数字媒体技术专业人才。2016年数字媒体技术专业的计划招生人数为40人,班级为正常教学班,不单独针对国外学习而组班。在新生入学教育时,鼓励学生通过雅思考试,在大学三年级申请去昆士兰理工学院深造。数字媒体技术的人才培养借鉴了澳洲高等教育教学的先进模式和成功经验,包括外方优秀的教学形式、考核方式及评估标准。合作教育将由引进外方优秀教师与中方资深教师共同完成。在大学一年级下学期做雅思考试动员,相应的英语课程引导学生进行雅思综合英语、雅思口语、雅思读写、雅思听说、英语语言和文化、学术英语课程的学习,为雅思考试做好准备。通过雅思考试的学生可以申请出国学习,国外第二阶段的专业课学习将采用全英文学习。通过国外的系统学习,学生将全面地掌握网络游戏、手机游戏、虚拟现实等数字媒体相关的基本理论与方法,能综合运用所学知识与技能去分析和解决数字媒体领域的实际问题,同时拥有专业和外语双重素质,成为富有责任心和创新能力的国际化应用型优质人才。出国的学生完成昆士兰理工学院后两年的专业课程学习,毕业时将获得双学位证书。未出国的学生按照教学计划继续完成国内的学业,毕业时将具有较强的计算机技术应用能力,能熟练使用常见游戏开发及虚拟现实软件,掌握信息检索、文献检索、资料查询的基本方法,具有独立获取知识、较强的综合分析与管理的能力及一定的科学研究能力。
昆士兰理工学院数字媒体技术专业的8门专业基础课为:Programming for Visual Design、Real-time 3D Computer Graphics、Data Structures and Algorithms、Databases、Computer Games Studies、Virtual Environments、Software Development、AI for Games。我院数字媒体技术专业大一、大二的教学计划中与之对接的课程是:视觉设计编程、实时3D计算机图形学、算法与数据结构、数据库系统原理、计算机游戏基础、三维建模、面向对象程序设计、游戏开发中的人工智能8门课。由于这8门课程基本为专业基础课,因而数字媒体技术专业大一、大二的教学计划对于国内和准备去国外学习的学生而言都通用,可以做到跟后续专业课程的无缝对接。在教学计划中,我院上述8门课程使用昆士兰理工学院的教材、课件等教学资料,按昆士兰理工学院的要求完成教学任务。视觉设计编程(Programming for Visual Design)课程以C#课程为切入点讲授数字娱乐产业涉及的编程技术;三维建模(Virtual Environments)主要讲解三维建模内容;游戏开发中的人工智能(AI for Games)以讲解游戏算法为主。将国外实时3D计算机图形学、游戏开发中的人工智能、视觉设计编程、三维建模与实时渲染技术等最新的课程逐步地引入我院数字媒体技术专业的教学体系,不断促进专业水平的提高。
4 结 语
实践证明,我校数字媒体技术的人才培养计划的实施,进一步完善了应用型工程型本科人才培养体系,国内IT企业能深度地参与本专业的人才培养,校企融合共同培养适应“长三角”地区数字媒体技术的人才;同时,通过国际合作开阔了学生的视野,为南京以及长三角的游戏产业高层次的软件开发人才培养打下基础。我校数字媒体技术专业将强调对游戏开发能力培养,注重从游戏算法的角度解决游戏开发中遇到的实际问题。今后我们将进一步精选企业课题,将课题与学生工程项目实践、毕业设计高度结合,实现学生实习到就业的无缝对接。
参考文献:
[1] 张燕, 史金芬, 沈奇. 改革教学模式培养高素质软件人才[J].金陵职业大学学报, 2003, 18(4): 18-20.
[2] 刘钰, 张燕, 沈奇, 等. 卓越工程师计划下的嵌入式软件人才培养[J]. 计算机教育, 2014(9): 48-51.
[3] 沈奇, 张燕, 罗扬. 应用型本科实践教学体系的构建及改革[J]. 实验技术与管理, 2010(12): 39-41.