时间:2022-11-23 15:09:55
引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇excel数据分析范例。如需获取更多原创内容,可随时联系我们的客服老师。
【关键词】 数据分析;描述统计;检验分析;方差分析
1 引言
excel提供了一组强大的数据分析工具,称为“分析工具库”,使用分析工具库可以在用户建立复杂统计或工程分析时节省许多操作步骤。但由于“分析工具库”中的分析工具具有很强的专业性,一般在统计学或工程学的特定领域应用得比较广泛,因此普通的Excel用户对此“分析工具库”工具都采取了一种敬而远之的态度,很少有用户使用Excel的“分析工具库”功能及其提供的内容丰富的函数。其实在Excel的“分析工具库”中包括了许多非常实用的函数,利用这些函数可以帮助我们方便地解决许多Excel实际应用中的难题。
Excel以其简便易学已为大多数研究人员所掌握,其中的“分析工具库”能做一些常用的统计处理,我们只要针对实际问题找到对应的分析工具就可以了。
鉴于Excel具有强大的数据处理与统计功能,而在药学研究中,血药浓度的计算、药动学参数的求解、给药方案的设计、数据设计及组织管理、绘制图表等,需要进行大量而繁琐的数据处理、绘制各式图形。在医学数据的处理上,数据的统计缝隙也是非常重要的。电子表格处理系统Microsoft Excel for Windows是具有强大的数据处理及管理、图表绘制和打印等功能的软件,该系统操作简单,提供数据的动态显示和报告,数据分析工作直观,图表与Word等字处理软件兼容性好,能相互切换,可以方便地用于医学和药学研究的数据处理。
2 数据分析工具的应用
2.1 描述统计 “描述统计”分析工具用于生成源数据区域中数据的单变量统计分析报表,提供有大数据趋中性和离散性的综合信息[1]。
2.1.1 示例 某医院用中药治疗青光眼的试验中一些患者眼压的变化,用“描述分析”对这组数据进行基本的统计分析。
2.1.2 操作步骤 因为改统计分析软件操作界面比较简单直观,只要按照题目的要求填写相应的数据即可得到所需的结果,这里就不再赘述了。输入界面如图1所示。图1 “描述统计”输入操作界面(略) 汇总统计结果可以包含:平均值、标准误差(相对于平均值)、中值、众数、标准偏差、方差、峰值、偏度、极差(全距)、最小值、最大值、总和、总个数、最大值(#)、最小值(#)和置信度[2]。
2.1.3 结果分析 如图2所示,输出了实验数据所需的各种统计结果,以备医务工作者分析患者的病情。 图2 描述统计分析结果(略)
2.2 t检验 实际工作中,除需要判断某种处理结果与某一已知结果间的差异外,还需比较两种处理的效果,即比较两个样本总体的统一参数的差异。本节将讨论Excel“统计分析”工具包中的t检验。适用于等方差、异方差和成对数据的情况。
2.2.1 t检验 双样本等方差假设。等方差假设这个分析工具可用来确定等方差的两个样本均值是否相等或均值差是否等于给定值。
示例:考察一组成年男女体重的数据进行检验分析。要求用t检验来验证两组体重数据的均值差是否为20。
2.2.2 操作过程 打开t检验工具的对话框,按要求填入相应的检验参数,如图3所示。 图3 t检验:双样本等方差检验(略)
2.2.3 结果分析 统计分析结果如图4所示,从中可以得出分析结果为T统计量(0.020046449)小于双尾临界值(1.972016435),也小于单尾临界值(1.652585979);而相应的双尾概率高达0.984026506,单尾概率也达到0.492013253。所以可以有把握地认为均值差等于给定值20。
2.3 方差分析 方差分析是数理统计中重要的组成部分,在统计实践中也有着广泛的应用。由于方差分析的运算量随着变量的增多呈几何级数增长,如果不使用计算机,很难完成大规模数据的方差分析。在应用统计学的几个主要领域里,方差分析也是惟一无法直接用Excel 2002中的函数完成的科目(当然,如果耐心地对每组数据逐个进行计算,也可以用函数实现,但繁重的运算会使得工作效率变得很低,错误率增大)。
方差分析主要分为单变量方差分析、无重复双变量分析和有重复双变量方差分析。Exce1 2002在“统计分析”工具包中就对应地提供了这三个工具。下面仅介绍单因素方差分析。
单因素方差分析的作用是通过对某一因素的不同水平进行多次观测,然后通过统计分析判断该因素的不同水平对考察指标的影响是否相同。从理论上讲,这实质上是在检验几个等方差正态总体的等均值假设。单因素方差分析的基本假设是各组的均值相等。
2.3.1 示例 进行某化学合成反应时,为了解催化剂对收率是否有影响,分别用5种不同的催化剂独立地在相同条件下进行试验,每种催化剂实验4次,要求用方差分析判断催化剂对收率是否有影响[3]。
这是一个典型的单因素方差分析问题,催化剂是一个因素,而不同的催化剂可以视作该因素的不同水平。
2.3.2 操作过程 将原始数据输入工作表,打开单因素方差分析对话框,按要求填写选项。
转贴于
2.3.3 结果分析 统计分析结果如图6所示,从中可以得出分析结果为
运算结果分成概要和方差分析两部分。
概要:返回每组数据(代表因素的一个水平)的样本数、合计、均值和方差。
方差分析:返回标准的单因素方差分析表,其中包括离差平方和、自由度、均方、F统计量、概率值、F临界值。
分析组内和组间离差平方和在总离差平方和中所占的比重,可以直观地看出各组数据对总体离差的贡献。将F统计量的值与F临界值比较,可以判定是否接受等均值的假设。其中F临界值是用 FINV函数计算得出的。本例中F统计量的值是10.34346,远远大于F临界值3.055568。所以,拒绝等均值假设,即认为5种催化剂的对收率差异有显著性。从显著性分析上也可以看出,概率为0.000317,远远小于0.05。因此也拒绝零假设。
3 讨论
数理统计方面的软件应该说目前为止比较流行的软件也有一些,如SPSS、SASS、STATISTICA等等,但这些软件一是专业性比较强,艰深难懂,操作起来比较麻烦,且基本上是英文版的,对于一般人来讲还使用起来会觉得不方便的,二是软件价格过于昂贵[4]。
Excel是微软公司出品的办公系列软件,是很多人非常愿意使用的软件,所以它的普及程度比较高,即使是人们没有太多的使用Excel的许多高级应用,学习起来也会比其他的专业软件得心应手一些。
Excel中的“数据分析工具”智能地同步引用了多个统计函数对样本数据进行分析,可同时返回所希望的多个分析结果甚至图表,使医药工作者在进行科学研究及实验数据处理时不再忙于繁杂的数据计算过程,而更加专注于试验设计,计算(分析)结果的编辑打印则更便于资料的存档和交流。
本文只引用了几个应用Excel“数据分析工具”进行医药数据统计的实例,其实Excel“数据分析工具”还有好多种统计分析工具,它们能够进行非常复杂的统计计算,这种计算功能非常强大,如果采用人工计算会费时费力,得不偿失,比如,回归分析,方差分析以及各种检验统计分析等等。Excel友好的界面,清晰的统计分析结果,使医药工作者在使用Excel的“数据分析软件”时会感到非常的方便快捷,灵活实用。由于论文篇幅的限制,Excel“数据分析工具”的其他应用实例就不在这里赘述了。
参考文献
1 王晓民.Excel 2002高级应用—数理统计.北京:机械工业出版社,2003,214.
2 徐秉玖.药物统计学.北京:北京医科大学出版社,1999,6-7.
当我们在Excel 2013选择数据之后,右下角会出现一个图标,这就是Excel 2013提供的快速分析工具,也可以按下“Ctrl+Q”组合键激活该工具。这里提供了格式、图表、汇总、表、迷你图等五大功能,虽然这些功能也可以在相应的选项卡获取,但查找相对麻烦。
以“格式”选项卡为例,这里提供了数据条、色阶、图标集、大于、文本包含、清除格式等功能按钮,鼠标移到“图标集”上,我们会看到不同的图标风格(如图1),预览满意之后即可应用。“图表”选项卡则可以预览不同风格的图表效果,从而帮助你快速创建相应的图表,例如使用散点图(如图2)。如果需要查看更多的图表,可以点击最右侧的“更多图表”按钮。最常用的操作当然是“汇总”下的求和、平均值、计数、汇总百分比、汇总,相信这也是绝大多数朋友接触最多的操作。在选择相应的功能之后,Excel 2013会在相应的位置上添加一行列出所得出的结果,比如平均值(如图3),点击“>”按钮还可以选择更多的汇总功能。“表”选项卡提供了表、数据透视表、其他等功能选项,可以快速创建非常美观的图表。“迷你图”的效果就不用多介绍了吧?
简而言之,借助Excel 2013的快速分析工具,我们可以在最短时间内快速实现相应的操作,而且是提供充分预览,从而提高操作效率。
午后的三点一刻是下午茶的时间,忙碌了一天,现在放下手中的工作,稍稍休息一会儿吧。
首先,我们来听一首歌,一首很适合在午后时分听的歌:《Down at the coffee shop》,这是一首甜腻腻的歌,就好像草莓味的水果糖。尾音和间隙处衔接非常紧密,她粘粘的唱,那大家就粘粘的听吧。再来一杯有着玫瑰香的泡泡水,清淡、回味。就让一个小清新的午后由此开始吧……
伴着这甜甜的音乐,我们先来看一个小故事吧。有个小男孩,有一天妈妈带着他到杂货店去买东西,老板看到这个可爱的小孩,就打开一罐糖果,要小男孩自己拿一把糖果。但是这个男孩却没有任何动作。几次邀请之后,老板亲自抓了一大把糖果放进他的口袋中。回到家中,母亲好奇地问小男孩,为什么没有自己去抓糖果而要老板抓呢?小男孩回答很妙:“因为我的手比较小呀!老板的手比较大,所以他拿的一定比我拿的多很多!”
现以学校考试成绩为例,谈谈经常需要分析的几种数据指标。例:某次考试成绩(以3个班,每个班按7名学生为例)如图(1):
问题:
1.每名学生总分班名次和年级名次;
2.各班各学科平均分;
3.各科优秀线(总人数的20)及各班优秀人数。
解答:
Step1:选中单元格O2,输入公式“=SUMPRODUCT(($D$2:$D$22=D2)*($N$2:$N$22>N2))+1”,回车,得结果3,向下填充到O22,学生总分班级名次已完成。
Step2:选中单元格P2,录入“=RANK(N2,N$2:N$22)”(不含引号,下同),回车,得结果3。用填充句柄把单元格P2向下复制到P22,学生总分年级名次已完成。结果如图(2):
说明:如果希望在数据表班无序的状态下进行按班级排名,请使用SUMPRODUCT公式:“=SUMPRODUCT(($D$2:$D$22=D2)*($N$2:$N$22>N2))+1”
RANK函数返回某数字在一列数字中相对于其他数值的大小排位。它的函数表达式是:RANK(number,ref,order)。
Step3:选中单元格E25,输入公式“=AVERAGE(IF(($D$2:$D$22=$D25)*(E$2:E$22""),E$2:E$22))”,按Ctrl+Shift+Enter结束,向右填充至N25,接着向下填充至E27:O27,结果如图(3):
说明:数组公式{=AVERAGE(IF(($D$2:$D$22=$D25)*(E$2:E$22""),E$2:E$22))},表示计算D2:D22等于D25且E2:E22不为空的数值的平均数。
Step4:选中单元格E30,录入“=PERCENTILE(E2:E22,0.8)”,回车,得结果106,填充至N30,得到各科优秀线,见图(4):
说明:PERCENTILE函数返回数组的K百分比数值点,可以使用此函数来建立接受阈值。它的函数表达式是:PERCENTILE(Array,K)。
Step5:选中单元格E33,输入“=SUM(($D$2:$D$22=$D33)*(E$2:E$22>=E$30))”按Ctrl+Shift+Enter结束,得结果3。填充至N30,再将区域E30:N30向下填充至区域E30:N35,见图(5):
注意:数组公式中的花括号是不能在编辑栏录入的,按Ctrl+Shift+Enter结束,自动生成前后花括号,表示该公式为数组公式。在数组公式中,“和”与“或”不是用 AND和OR来表示的,而是用运算符号“*”和“+”来表示“和”与“或”。逻辑值参与运算时,TRUE=1,FALSE=0。
【关键词】Excel数据分析;项目驱动教学;专业能力培养
一、概述
按照“以就业为导向,以服务为宗旨”的职业教育目标,高职院校培养的学生应当具有解决实际问题,具有自我学习、持续发展的能力,具有创新和创业的能力。其中,“解决实际问题”是高职学生能力培养的第一目标。当今社会,计算机应用能力是信息化社会发展的需要,目前许多高职院校都开设了Mi
crosoft 0ffice办公软件等方面的课程,在于培养学生较基本的计算机应用能力,解决一些日常工作的实际问题。其中,电子表格Excel是日常办公中使用最广、掌握相对较难的一个软件,它具有较强的数据处理与数据分析能力,丰富的图表功能,能够完成财会金融数据处理、人力资源管理或生产管理等等。并且Excel以其友好的操作界面和强大的数据分析功能受到了众多企业和个人的青睐,利用Excel进行管理和决策已成为办公人员日常工作的一部分。许多高职院院校开设了计算机应用基础等类似的课程,这类课程中Excel的学习更注重的是学生Excel的基本应用能力,能够制作表格、能够使用简单函数、能够掌握排序、筛选、分类汇总等Excel基本数据处理工具的使用。利用Excel对企业产品市场销售数据、生产数据等做出快速全面的预算,通过分析、比较这些数据,不断改进原有方案,使企业的生产经营活动始终处于最佳状态,这对提高企业竞争力有着非常重要的现实意义,而学生运用Excel进行数据分析作为管理和决策依据的能力却非常有限。
二、教学内容的设计
职业教育课程的内容必须以职业活动为导向,因此Excel数据分析的教学内容,都应紧紧围绕职业能力目标的实现,取材于职业岗位活动和实际工作流程。Excel作为一个工具,最终目的是为各个职业岗位服务,针对不同的专业,Excel数据分析项目的设计应贴近不同的实际岗位。同时,针对不同专业的学生,应设计不同的授课侧重点、教案,引导学生使用Excel来完成其专业课程任务,使学生在实践中体验成就感,因而产生积极的学习兴趣,达到优良的教学效果。在教学中多采用项目驱动的教学方法。项目驱动教学模式针对不同专业的学生根据课程内容选用不同的项目,这样有利于学生把Excel和专业知识相结合,再将项目分解、结合,学生通过合作讨论来分析项目、搜集资料、确定方案步骤,直到解决问题。这一过程是培养学生解决实际问题的能力的有效途径。例如,医药高职学校学生在用Excel进行医疗数据统计处理时,可采用“配对t检验”这样具体的项目,将Excel数据分析工具库的19个模块以及使用Excel进行数学分析的具体操作等融入项目中;房地产专业可设计项目“抵押物价格评估”,分小组确定不同方案对抵押物进行评估,并进行比较;财务管理专业学生的教学可通过完成“账务管理系统”这样具体的项目,结合Excel的图表数据处理功能,实现完整的财务指标体系分析,培养学生使用Excel数据分析从事财务管理工作的能力。
三、教学组织实施
下面,本文以金融专业中最常见的贷款问题为例,进行“制作适合任何利率的住房贷款分期付款计算器”项目设计与实施。(1)具体项目设计。项目设计的原则具有典型性与可操作性,并尽量贴近实际生活,便于学生的理解并能真正解决实际生活的某些问题。因此设计“制作适合任何利率的住房贷款分期付款计算器”项目。该项目情境引入如下:由于住房贷款分期付款的计算比较复杂,所以购房前的决策难度也较大。制作一款快速计算出不同房屋类型和不同付款方式下的月还款额、总还款额及利息总额的万能计算器,以辅助个人购房贷款决策,具有很强的现实意义。(2)项目的分析。将该项目执行过程按照阶段性进行任务划分,形成“政策背景”、“分期付款分析”、“贷款方式选择”共三个任务,三个任务从简单到复杂,并有密切的关联关系。任务一了解项目的行业背景知识,为项目的执行做好准备;任务二难度相对加大,利用Excel的函数完成月还款额的计算,为任务三的个人决策提供依据。(3)教师的具体引导。按照新职教理念,在教学中应充分体现“教师引导,学生为主体”这一教学模式。引导学生分析问题,进而提出解决问题的思路。教师演示和讲解注意应主要讲解解决问题的思路、整体概念和整体框架。在任何项目执行过程中,均会涉及到专业、行业知识等,因此学生收集资料,准备好项目背景知识是很重要的第一步。在任务“政策背景”中,需要了解目前我国各大银行及金融机构的住房贷款方法,如商业性个人住房贷款、公积金个人住房贷款、等额本息还款、等额本金还款等具体含义及实现的数学模型,为后续任务的具体实现作为铺垫。在该项目的“分期付款分析”任务中,财务函数作为新知识点引入,教师可做适当讲解与演示。对年金函数PMT(是基于固定利率及等额分期付款方式,返回投资或贷款的每期付款额)进行介绍,并对比年金函数PMT学生自主学习现值函数PV(即从该项投资开始计算时已经入帐的款项)、期望值函数Fv(在最后一次付款后希望得到的现金余额)、总投资期函数Nper(即该项投资的付款期总数)等等,因为这一系列函数常用于处理贷款问题,彼此之间关联度较大。在任务“贷款方式选择”中,可让学生分组讨论,得出解决方案。一般该任务学生会采用IF函数多层嵌套与窗体来实现。在学生的讨论与尝试过程中,会有普遍存在的疑问,教师可针对学生的典型问题进行引导。同时,部分学生有比较新颖的方案,可让学生将自己的实现过程与解决方案向同学做介绍,锻炼学生的语言表达能力。该项目的执行过程,充分体现学生为主体与教师的引导,起到对学生综合能力培养的作用。(4)学生考核与评价。考核是相对目标而言的。考核学生使用Excel进行数据分析的能力,解决实际问题的能力,因此应重过程考核,使用“任务”对学生进行考核。例如,该项目中,项目任务的完成进度、小组成员之间的协作情况、学生对项目展示的表达能力等等均可作为考核的内容。
四、主要问题的思考
(1)项目设计的关键性。在学生Excel数据分析能力的培养中,项目的设计是最关键的一步。能力的培养必须在教学中进行,教学时间的分配必须合理,项目过大、过难均会影响到教学时间的掌控,从而影响教学的效果。并且,由于教学的对象是未接触实际项目的学生,因此项目应容易理解并尽量贴近实际生活,能解决实际生活的问题,才能真正体现Excel数据的分析是为管理和决策起指导意义。(2)对教师能力的更高要求。Excel教学的教师一般都是计算机基础课的教师,而在教学过程中要求项目与专业相结合,将Excel作为学生专业学习的工具,这就要求计算机教师能认真了解该专业的基本知识,主动了解该专业的最新动态与技术,关心该专业学生的就业动向与行业规则。对教师的行业知识提出了更高的要求。
五、结语
Excel电子表格,作为基本的工具软件应用越来越广,当Excel与专业相结合时发挥出了巨大优势。因此,高职院校学生能力培养的改革过程中,应遵照“以就业为导向,以服务为宗旨”的职业教育目标,重视学生运用Excel进行数据分析作为管理和决策依据的能力培养。
参 考 文 献
摘 要: 目的:编写并验证基于Excel的药动学数据分析通用程序。 方法:利用Excel的内置函数、规划求解工具和VBA语言编制包括静注1房室、静注2房室、静注3房室、非脉管1室、非脉管1室(有时滞)、非脉管2室、非脉管2室(有时滞)、非房室模型分析、生物等效性分析以及缓控释制剂体内外相关分析共10个药动学数据分析模块,结合文献数据对比利用该程序以及3P87和WinNonlin软件处理得到的结果。 结果:成功编制简明药动学数据处理程序――PKSolver 1.0,该程序与3P87和WinNonlin软件相比,所有药动学参数求算结果和模型选择判据结果基本一致。 结论:该程序可参考用于常见药动学数据分析,更多的药动学数据分析模块尚待进一步开发。
关键词: 药动学; 数据分析; Excel; PKSolver 1.0
目前在药动学数据处理方面有很多专业软件可供选择,如使用最为广泛的WinNonlin和3P87/97程序等,使用这些功能强大的专业软件,即使是常规的药动学数据处理,也要进行复杂的操作,而大部分新药研究部门的科研人员往往畏惧于学习专业软件的操作和设置。Excel是使用最为广泛的统计软件,具有界面明晰、操作方便的优点,本研究在充分挖掘Excel的VBA编程语言的基础上,完全以Excel为平台,编制了药动学数据分析程序――PKSolver 1.0。同时,参照国内外权威药动学数据处理程序的结果,对本程序的药动学数据计算能力进行了评价,程序操作极其简单。程序的编制扩展了Excel在药动学数据处理中的应用,对于扩大药动学基础理论的实际应用,提高基层药动学研究水平具有一定的参考意义。PKSolver 1.0程序目前共包括10个模块,分别为静注1室、静注2室、静注3室、非脉管1室、非脉管1室(有时滞)、非脉管2室、非脉管2室(有时滞)、非房室模型分析、生物等效性分析(双交叉)以及缓控释制剂体内外相关分析。限于篇幅,本研究以静注2房室模块为例,简要介绍本程序的设计思想及编写过程。
1 材料
11 软件 Microsoft Excel 2002(Microsoft Corporation); 3P87(The Chinese Society of Mathematical Pharmacology); WinNonlin 4.1(Pharsight Corporation).
12 数据选自文献[1]中某药物静脉推注给药后在不同时间点测得的血药浓度时间数据。
2 方法
21 程序的编制
211 操作运行界面的设计 本程序运行界面主要包括4个部分,分别为数据输入区、结果输出区、操作设置区以及图表输出区。以静注2房室模块为例,程序运行界面如图1所示。其中数据输入区、结果输出区以及图表输出区的设置较简单,分别利用Excel程序的内置函数和图表向导即可完成,不再赘述;操作设置区是控制程序的主要部位,通过在Excel中添加按钮、按钮选项、组合框、文本框等控件,利用这些控件可以方便的进行药动学参数的选择和设置,并调用后台程序进行数据处理和结果输出。
212 前台数据的计算 利用Excel的内置函数和单元格引用,可以在操作界面上直接计算出很多中间参数,如“ln(实测浓度)”、“预测浓度”、“ln(预测浓度)”、“残差”以及“权重”等,程序可以在后台直接调用这些中间参数,运用VBA程序进行模型的拟合和优化,大大提高程序的运行效率,这种“前后结合”的数据处理方式可部分提高程序的运行效率。
213 优化过程的VBA程序编写 利用VBA语言编写大部分优化计算过程是本程序的一个特点,尽管各个模块的数据处理过程各不相同,但总的来说,每个模块的后台数据处理都大概分为以下几部分内容:①输入数据的基本合法性验证。主要包括有输入时间点的顺序是否合法、药物浓度时间点的个数是否足够用于相应房室模型分析、药物浓度时间数据是否配对、是否出现不符合实际情况的数值(如负值或者非数字型字符)等等;②待拟合参数的初始值计算及初始值的合理性验证。参数拟合结果除与优化方法有关,更重要的是拟合参数初始值的选取,选取恰当的初始值不仅仅能够加快拟合速度,还能够避免拟合过程中的溢出现象。为获得相对准确的初始值,本程序的编制过程中进行了大量的尝试和改进,除运用最为经典的残数法估算初始值外,在非脉管给药房室模型分析模块中还采用了一些经验设置,能够较快地获得非脉管给药模型参数的初始值。同时,本程序还对计算得到的初试值进行合理性验证,并根据验证结果进行参数拟合或者针对数据特征向使用者提出建议,进一步提高模型拟合的成功率;③参数拟合优化。该部分是程序参数求解的核心部分,以计算的初始值为基础,Excel自带的SOLVER加载宏为主要工具,基于GaussNewton迭代的寻优法为核心算法,进行参数的优化求解,为避免出现拟合结果数学上最优,但实际药动学上不合理的情况(如负值参数的出现)。在拟合过程中,对所有参数的结果以及参数间的相应关系进行了相应的规范和限制,从而保证拟合出符合实际情况且数学上最优的结果,最后对优化结果进行合理性验证;④二级参数及模型判据的求解。根据输入的药动学参数、设置的参数单位以及拟合得到的一级参数,求算出15个二级参数,其单位设置和计算公式参见文献[2],9个模型判据按文献[3]公式计算,分别为r、SS、WSS、R2、WR2、Rsq、S、AIC、SC,所有二级参数和模型判据均在程序后台调用Excel内置函数计算。
图1 PKsolver 1.0药动学数据分析程序运行界面 略
214 输出报告的程序编制 好的程序应具有友好的操作界面和简单的使用方法,利用本程序求得所有参数后,只要在运行界面上点击“报告输出”按钮,即可通过后台启动Microsoft Word应用程序,新建Word文件,并自动生成完整的数据分析报告,报告生成速度快且操作简便。
215 其他模块的编制 本程序中7个药动学房室模型分析模块的编制思路基本一致,非房室模型分析、生物等效性分析以及缓释制剂体内外相关性分析模块则根据相应内容进行编制,限于篇幅不再详细介绍。
22 程序的验证由于程序的模块较多,仅选取其中的代表模块,列出其计算结果进行评价,选取文献[1]中某药物静脉推注496mg给药后在不同时间点测得的血药浓度时间数据,分别用3P87、WinNonlin和本程序采用2室模型以1、1/C、1/C^2为权重进行模型拟合,所得结果用于评价本程序计算的二级参数。另外,用三种软件对此数据分别进行静注1室、2室、3室模型3种权重进行模型拟合,计算AIC值,用于评价本程序计算所得房室模型判据。用PKSolver程序进行模型拟合和参数求解时,仅需输入“时间血药浓度”原始数据,在操作设置区中设置好相应参数,点击“参数求解”按钮即可完成所有参数的自动求算,再点击“报告输出”按钮即可以生成完整的报告文件。
3 结果
对文献[1]数据分别采用3P87、WinNonlin和本程序进行房室模型分析的所有结果见表1和表2,三种程序对数据的拟合结果显示该程序在房室模型参数求算和模型判别上均和权威药动学软件非常接近,所求参数基本一致,应用本程序进行简单的药动学数据分析具有一定的可靠性,分析结果基本准确。利用VBA语言编程能够省去大量的繁琐操作,用计算机代替手工操作,将VBA语言编程应用到药学数据处理方面的报道甚少[4],本研究尝试将VBA语言编程应用于药动学数据处理,取得了预期的效果。
表1 3P87、 WinNonlin、 PKSolver对文献[1]数据按静注二室模型拟合结果的全面比较 略
表2 3P87、 WinNonlin、 PKSolver对文献[1]数据按不同模型拟合AIC判据的全面比较 略
4 讨论
41 程序的核心原理和优点利用本程序进行药动学数据分析的核心是首先通过前台界面输入数据并进行自动初步计算,然后在后台对数据进行一系列合理性验证、参数优化求解、计算二级参数、输出最终结果并自动生成报告文件,所有操作仅需点击两个按钮即可完成,操作非常简便。本程序完全基于Excel程序内置的VBA语言编制,利用Excel强大的数据处理能力和自动作图功能,将Excel应用于药动学数据分析,取得了较好的结果。如表3所示,与国内外常用的药动学数据处理程序相比,本程序具有界面友好、体积小巧、操作简单、结果输出直观方便等特点。特别是本程序充分挖掘了Excel编制宏程序的自动操作潜力,代替手工操作分析数据,将一系列药动学数据处理步骤全部集中在一个按钮上由计算机一步完成,不仅极大的提高了使用方便性,还能避免由于手工处理数据可能带来的错误,这在生物等效性分析和缓释制剂体内外相关性分析模块中表现尤为突出,这也是本程序优于一般药动学处理程序之处。
表3 国内外主要药动学数据处理软件部分功能特点的比较 略
42 程序的改进本程序在模型参数的优化时仅能使用GaussNewton迭代寻优法和共轭法两种方法,运用直观简洁的Simplex法或者Marquardt法[5]进行参数优化的VBA程序正在开发之中。另外,PKSolver 1.0目前的版本仅包括最常用的10个模块,更多的药动学数据分析模块正在开发之中,相信通过进一步优化算法、增加模块有望使本程序的数据分析能力不断完善,从而为药学工作者提供一个操作简单的智能化药动学数据处理程序。致谢: 感谢美国Pharsight Corporation提供药动学软件WinNonlin 4.1试用版!本论文在软件试用期内完成,我们正考虑通过申请PAL (Pharsight Academic License)计划获得软件注册。
参 考 文 献
1 Gabrielsson J, Weiner D. Pharmacokinetic and pharmacodynamic data analysis:concepts and applications. Stockholm, Sweden: Swedish Pharmaceutical Press, 1994,129.
2 Gibaldi M, Perrier D. Pharmacokinetics, 2nd edn. New York: Marcel Dekker, 1982,2~108.
3 Pharsight Corporation. WinNonlin User's Guide. California: Pharsight Corporation, 2003,247~265.
关键词:Excel;数据汇总;数据分析
中图分类号: TP317.1 文献标识码:A 文章编号:1009-3044(2013)04-0802-03
The Analysis of Variety of Data Aggregation Methods in Excel
LI Hua
(Computer and Network Center, Communication University of China, Beijing 100024, China)
Abstract: Excel provides a variety of data aggregation methods to summarize and analyze large amounts of data. The valuable information can be extracted by these methods to help make decision. This paper introduced several general applications of data aggregation method by detail examples and pointed out the characteristics of each method. It can help users analyze data more efficient in working practice.
Key words: Excel; data aggregation; data analysis
Excel软件已广泛应用于各个行业,无论是哪一个行业,只要和数据打交道,Excel几乎是首选的工具。数据分析是Excel提供的主要功能之一,而数据汇总又是主要的数据分析工具,可以对数据进行由粗到细、由多到少的处理,为管理人员做好决策提供有用的参考信息。Excel提供了多种数据汇总方法,常用的汇总方法有“分类汇总”、“数据透视表”、“合并分析”、“模拟运算表”等。
1 分类汇总
分类汇总是将数据按照某个关键词段分类,并对关键词段值相同的记录进行汇总的方法。以下面图1“考勤应扣款计算表”为例子,用分类汇总计算每个部门的基本工资的总和以及扣款合计的总和。
操作如下:先按部门排序(和排序次序无关,可以升序排序也可以降序排序),然后单击“数据”选项卡的“分类汇总”命令,在“分类汇总”对话框中选择分类字段为部门,汇总方式为求和,汇总项为基本工资和扣款合计,将得到所需要的汇总结果。
分类汇总的特点:
1)以三级结构的形式显示出汇总结果和明细数据,既可只显示汇总数据,也可以根据需要显示明细数据。
2)不适合进行多级汇总分析。当分类字段增加或对某一个被汇总字段进行多种不同的汇总时,需要完成多级分类汇总,而分级结构的层数增加使得表的结构复杂。如在“考勤应扣款计算表”中计算不同部门、不同职位的基本工资的最大值时或计算不同部门基本工资的最大值和最小值时,需要做多级分类汇总。
3)不能直接“剥离”汇总结果。若要复制汇总结果,简单的操作方式是单击分级显示符号数字2后,选择汇总结果,在“定位条件”对话框中选择“可见单元格”,进行复制粘贴到目标区域。
4)当数据源需要更新时,只能在“分类汇总”对话框中选择“删除分类汇总”,重新完成分类汇总。
2 数据透视表
数据透视表是Excel提供的可用来快速汇总大量数据的工具,可交互式地进行数据的分析,被公认为是Excel最强大的数据分析工具。
操作如下:单击目标单元格,选择“插入”选项卡的“数据透视表”命令,在“创建数据透视表”命令中选择数据源和数据透视表的位置,在“数据透视表字段列表”窗格中设置筛选字段、行标签字段、列标签字段、数字字段以及汇总方式。
数据透视表的特点:
1)运算速度快,与函数相比,计算速度提升很快,可以认为是Excel计算速度最快的功能。
2)布局结构非常灵活,修改非常方便。可以用不同的角度对数据进行汇总,可以对多个汇总字段进行汇总,也可以对同一个被汇总字段设置不同的汇总方式,还可以增加计算字段或计算项。
3)数据透视表的数据源可以是数据列表,也可以是数据库等外部数据源,也就是说可以直接根据外部数据源创建数据透视表,这是其他汇总方式所没有的特点。
4)数据透视表不能自动更新,当需要更新时,需单击数据透视表工具中的“刷新”按钮。
数据透视表功能非常强大,是用户首选的汇总工具,但使用时也有一些缺陷。如:
1)Excel 2007开始,数据透视表创建时不能以多重合并计算数据区域为数据源。若需要使用此项功能,只能自定义功能区,自行添加“数据透视表和数据透视图向导”按钮,并单击此按钮创建数据透视表。
2)数据透视表对数据透视图的格式有一定的限制。如数据透视图的图表类型不能是XY散点图、股价图及气泡图等,当对数据透视表进行筛选或刷新时,数据透视图的有些自定义格式会受到影响。
3 合并计算
合并计算是大家不太熟悉的一个汇总工具。以图1为数据源,利用合并计算工具计算每个部门的基本工资的总和以及扣款合计项目的总和。
操作如下:先用鼠标单击目标单元格,再单击“数据”选项卡的“合并计算”按钮,在“合并计算”对话框中设置参数,如图2所示,得到的合并计算的结果如图3所示。
合并计算的特点:
1)选中“创建指向源数据的链接”复选框,结果以二级分级结构的形式显示出汇总结果和明细结果,且计算结果随着数据源的改变自动更新。若没有选中此复选框,结果将以二维表格的形式显示,不能显示明细数据,结果也不能随着数据源的改变自动更新。
2)合并计算效果有一点类似于一级分类汇总,但合并计算比分类汇总方便,不需要排序,且汇总结果和数据源是分开的。
3)适合于汇总多个独立的数据列表,可计算同一工作簿不同工作表或不同工作簿不同工作表中的数据,前提条件是这些数据所在数据列表具有相同标签,而且合并计算前工作簿文件需要打开。如汇总12个月每个部门基本工资的总和以及扣款合计的总和,而每个月的明细数据在不同的工作表内。操作时,选择目标单元格,在“合并计算”对话框中将每一张工作表的数据区域添加到引用区域中,标签位置选择“首行”和“最左列”。
操作时注意,当创建链接时,存放合并计算结果的区域不能位于数据源所在的工作表中。
4 模拟运算表(也称数据表)
模拟运算表是Excel提供的假设分析的数据分析工具,可以分析模型中参数值的改变对结果的影响。如果要考察一个参数值的改变对结果的影响,则可以使用单变量模拟运算表。如果考察两个参数值的改变对结果的影响,则可以使用双变量模拟运算表。在实践中,也可以用模拟运算表进行数据汇总。
下面以图1为数据源,用双变量模拟运算表汇总不同部门、不同职位的人数。这时部门可能的值和职位可能的值就是两个可变的参数值,公式中用数据库函数计算某一个部门某一个职位的人数。
操作如下:在数据列表区域外,创建数据库函数的条件区域。设条件区域为A18:B19,其中作为条件值的A19单元格和B19单元格的值各自输入某一部门和某一职位的值,这两个单元格在模拟运算表中是两个变量参数。选择某一目标单元格A22,输入数据库函数=DCOUNT(A2:F16, “基本工资”,A18:B19),并以A22为交叉点,在连续的行区域和列区域中输入部门和职位可能的值,在“模拟运算表”对话框的“输入引用行的单元格”中输入$B$19,“输入引用列的单元格”中输入$A$19,如图4所示。
若只需汇总每个部门的基本工资的总和以及扣款合计的总和,则可以利用单变量模拟运算表计算,公式中可以使用SUMIF函数或DSUM函数。
模拟运算表的特点:1)模拟运算表需自行设计,公式和参数的位置以及公式的内容等。结果区域为数组,不可以单独修改某一个汇总数据。2)布局上不如数据透视表灵活,但可以用来描述和分析被汇总字段的值随着汇总参考字段也就是分类字段的值变化的函数关系。当使用数据库函数进行分类统计时,不需要建立多个不同的条件区域,只需要一个条件区域即可。3)数据源改变时,结果也会自动更新。
5 结论
本文介绍的Excel数据汇总方法,各自有不同的特点,适合于不同的情况。即使是数据透视表工具也不是万能的,也有局限性。因此,在实践中用户应从实际需求出发,综合考虑运算速度、布局、数据更新、数据的图形表示等方面的因素,合理选择最适合的工具,才能达到最好的效果。
参考文献:
[1] 陈景惠. 对Excel数据汇总教学方法的探讨[J]. 硅谷,2009(4):166:167.
一、教学前期准备
本案例是北京市海淀区实验教材《信息技术》初中上册中的第二单元―电子表格的起始课。本单元要求学生能够应用电子表格进行数据分析和评估,从确定主题―采集数据―建立表格―数据分析―到得出结论。本课主要任务是了解电子表格的特点,掌握创建表格的方法。
1.学生情况分析
本案例是初一年级第二学期的内容,学生经过中小学合计4年半的课堂学习和课后练习,已经熟练掌握了办公软件中的Word和PPT的基本操作,对Microsoft Office软件环境较为熟悉,并且初步具备了一定的自主学习能力和小组合作学习能力,乐于探索,乐于实践,这些都是课堂教学顺利高效进行的有利因素;但是学生此时也同样具有缺乏耐心、急于求成的特点,这对学生通过探究进行自主学习是个不利因素。根据以往的经验,学生从图像处理单元过渡到电子表格单元时有一定的心理落差,往往学习兴趣不高。
(分析:教师首先分析学生的知识储备,学生已经掌握了办公软件中Word和PPT的基本操作对新软件的学习有正迁移作用,所以教师确立了自主学习的教学模式,让学生能够主动探究和构建知识体系。并且根据学生的心理特点,把如何激发学生学习兴趣确定为本课的基点,从兴趣出发教师设计了一系列的任务案例,使得学生在完成任务的过程中掌握知识与技能。由此可见,教学设计应该在分析教材、学生的基础上,了解并尊重学生的需要,从“学生的需要”出发,确定教学目标,设计教学案例。)
2.教学目标
针对学生情况和本课的教学内容要求,确定如下教学目标:
知识与技能:学会从搜集的素材中,分析、整理、提取有效数据;掌握使用Excel创建表格的方法,合理设置表格标题、表头项目。
过程与方法:在整理从实际生活得到的数据的过程中,体会分析数据关系、提取有效数据的方法;在尝试交流过程中,提升自主学习和小组学习的能力。
情感态度价值观:通过创设“节水视频”的情境,引发关注全球水资源短缺的问题,建立“世界有我,节水由我”的节约环保观念。
教学重点:从搜集的素材中,分析、整理、提取有效数据;根据实际需要创建表格,合理设置表格标题和表头项目。
教学难点:分析整理数据,设置表格标题和表头项目。
(分析:教学目标处于核心地位,教学中的诸多因素都是围绕教学目标,为教学目标服务。在教学中,教师所要做的第一步就是从学生的需要出发,在把握教材的基础上,设定教学目标,明确教学重、难点,使教学活动围绕教学目标展开。
本节课教学目标遵循了新课程标准的三维目标,描述清晰、全面而又富有学科特点。首先,教学目标的表述是以学生为主体,并且阐述了通过整理实际生活中的数据的过程,掌握分析数据关系、提取有效数据的方法。其次,在教学目标的描述上合理运用行为动词,如学会、体会等,便于操作,同时对行为动词的使用条件进行了界定,便于实施和测量,为后期教学策略以及教学评价的选择提供了依据。
由于学生已经掌握了Word和PPT的基本操作,对Excel的基本界面不会陌生,所以本课的教学重点为学会从搜集的素材中,分析整理提取有效数据,以及根据数据合理设置表格标题和表头项目,更注重让学生体验数据处理的过程。)
二、教学过程设计
本案例从世界水资源危机导入,让学生面对一个个问题,在解决问题的过程中学会方法。本案例的教学流程如图1所示:
1.创设情境,引出课题
教师播放有关“水资源危机”的视频文件,并提出问题:在此短片中,引用了大量的什么资料给你留下深刻的印象?使用这种资料来说明水资源危机的好处是什么?
学生观看视频文件,思考何种信息起到了加深印象的作用,并尝试归纳数据的作用。
教师引出课题从这节课开始,我们将学习第三单元――数据处理与分析初步,使用的软件是专门处理数据的,这个软件的名字是Excel,并提出问题Excel作为Office家族中的一员,它的界面和Word有什么相似之处和不同之处?
(分析:教师精心准备了“水资源危机”的视频文件,使学生关注全球水资源短缺的问题,同时也感受到数据更能清楚地表明水资源的现状,激发学生深入研究数据的兴趣。同时借助与Word软件的对比,利用学生已有的知识结构,同化新知识,构建知识体系。)
2.提出问题,合作探究
教师引导学生打开“课堂练习”文件,提示学生使用“工作表导航按钮”(学生可以参考演示文稿上的图示)浏览工作簿中的各张工作表,并给出小组思考题:此文件(工作簿)当中有多少张工作表?这些工作表之间有什么共同之处吗?修改单元格中的数据,图表会有变化吗?
学生打开课堂练习文件,尝试探索“工作表导航按钮”的用法,打开工作簿中包含的各张工作表,初步认识工作簿和工作表,思考教师提出的问题。并且修改数据,观察结果,体会Excel“牵一发动全身”的含义。
教师在学生小组讨论的基础上,适时进行总结:Excel和Word与PPT软件都是Office办公软件,它们界面相似,都用来展示、呈现信息,但是Excel更重要的用途就是能够对数据进行加工、处理和分析(用途)。
(分析:由于大部分学生第一次接触Excel软件,当看到修改数据后,相应的图表发生变化时,会激起学生进一步探究的兴趣。最终学生在操作实例的过程中,逐步熟悉Excel的界面,自主探究Excel的操作方法。学生在尝试探究的过程中,重新构建对Excel的认识,并且通过小组交流、师生互动,得出结论:Excel分析数据、制作图表不仅仅是为了展示和呈现信息,更重要的用途是能对数据进行加工、处理、分析。教师设计的小组交流环节,既鼓励学生大胆尝试,又培养了学生乐于分享的意识,为今后的合作学习打下基础。)
教师进一步提出问题:观察课堂练习中两张工作表,找出共性,如图2所示。思考是否可以在Word中完成?
学生经过组内梳理、交流,逐步清楚找出工作表的共性:都有标题、表头、数据。在Word中尝试后发现,在Word中制表最大的问题是修改数据,图表不会产生相应的变化。
(分析:通过引导学生观察分析两张工作表的共同之处,培养学生仔细认真地学习态度,并且为后续创建表格打基础。通过与Word中制作表格的对比,使学生感受到电子表格的特点和作用。)
3.教师引领,创建表格
教师提出新的问题:既然Excel具有强大的数据处理与分析功能,那么数据从哪里来?学生根据以往经验提出各种数据来源,师生共同归纳总结数据来源:直接或者间接途径:直接途径,第一手资料,例如做些社会调查,直接从社会中了解情况、收集资料和数据。或者从其他途径获得第二手资料。(例如上网查找资料,从新闻、报纸、杂志、文献等渠道获取数据)。这两种方法,大部分情况下是要综合使用的。
(分析:数据的来源非常重要,这直接影响数据分析得出的结论是否真实、准确,关注数据来源对于后续的研究专题的顺利开展来说是个保证。培养学生做学问认真的态度。)
具体案例:前面观看的视频中存在大量的数据,分别从不同方面描述了水资源短缺的现状,方便在一张表中呈现吗?有些我们需要的数据还不完整,怎么办?
教师引领学生从视频中,提取出需要的数据,分析数据之间的关系,确定表格标题,并且按照数据的共性特点设计出表头名称,将标题和表头分别填写到合适的单元格中,如图3所示。
(分析:从素材中分析整理提取有效数据,合理设计标题和表头是本课的重点,但是学生以往这方面经验较少,不足以支撑自主探究。因此教师通过具体实例分析,引领学生学习获取数据、处理数据的方法。)
4.小组合作,自主学习
教师布置探究任务,每个小组根据自己的情况,选择完成一个关于用水情况的电子表格,并分析数据,得出结论,如图4所示。
(分析:由于学生程度参差不齐,教师在安排综合任务时要考虑分层教学。①知识的分层―根据对教材的把握,哪些知识是每个学生需要掌握的保底知识,哪些是提供给有一定能力的学生学习的提高、拓展知识,本课美化工作表就属于提高任务;②学生的分层―根据学生的认知水平和接受能力进行分层,对不同层次学生要求不同。这两个不同方面的分层结合在一起融入到连贯统一的教学情境中,为处于不同能力水平的孩子提供不同的发展空间。)
5.交流小结,评价反馈
本案例的最后一个环节是作品展示交流和评价反馈。教师根据巡视记录的结果,选择2~3组有代表性的作品进行评价和总结。对共性问题做出说明,建议学生翻阅教材解决或者等待教师在后续课程中给予解决。并组织学生利用网络提交表单的形式开展自评和互评,评价表如图5所示。
(分析:设计的评价方式注重将新课改提出的形成性评价与终结性评价相结合、自我评价与他人评价相结合的评价方式;实现了多元化的评价主体,如师评、自评与互评;以及评价内容多样化,教师不仅对学生的任务完成情况以及最终作品进行了评价,而且关注了学生在学习过程中所表现出来的学习态度等方面。并且基于网络提交表单方式的评价方法非常客观、准确、快捷,不仅便于学生再次梳理强化知识,而且帮助教师更加准确客观了解学生学习情况,从整体上看到每个问题的选项情况,从而了解整个班级、整个年级的学习情况,对教师在后续课程中进行有针对性的调整提供了第一手数据资料。)
三、结束语
本案例从学生的需要出发,在分析学生情况和教学内容的基础上制定教学的目标,确定教学的起点,引导学生利用已有的知识、经验,探究新软件的使用方法。在探究学习过程中,使学生经历了提出问题、分析问题、解决问题的过程,掌握解决问题的方法、形成技能,帮助学生把新旧知识经验构建成整体一贯的知识体系,体现了信息素养的培养。
参考文献
[1] 中华人民共和国教育部.关于印发《基础教育课程 改革纲要(试行)》的通知[S].教基[2001]17号
[关键词] Excel; SQL;数据透视表;管理;教学
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 16. 083
[中图分类号] G64 [文献标识码] A [文章编号] 1673 - 0194(2014)16- 0140- 06
教学管理中,经常要对大量的数据进行分析、汇总,由此也产生了大量的管理软件,但是,软件再多,毕竟无法解决层出不穷的新问题。因此,管理人员掌握常用的数据库软件的使用,可以及时、较好地解决实际工作中的各种问题,提升工作效率。在众多的数据库软件中,Excel作为普及度最高的软件,拥有着强大的数据管理分析功能,而且随着软件的升级,加入了更多、更强大的功能,掌握好Excel的使用、充分运用其功能,将成为解决实际问题的“利刃”。本文以多次考试成绩的汇总、分析为例,提出应用Excel解决类似问题的思路,并详细讲解实际操作方法。还要指出,本问题的解决,还可应用于公司销售业绩、进出货物管理等多种情形,因此具有相当的普适性。
1 提出问题
大量来自不同地区的人员参加考试,每次组织综合科目和不同的专业科目考试,同时通过综合科目和某一专业科目才能取得该专业执业证书,没通过相关科目的人员可能再参加后面批次的考试,要求汇总分析每一次考试和几次考试的人员通过情况和地区通过情况,整理出几次考试后可取得执业注册证书的人员名单,分析每一考试科目的总体通过情况。
2 思路分析
解决该问题的难点在于整理执业证书人员名单时,必须通过综合和专业考试科目,而这两个科目不一定是在一次考试通过,而且考试的专业比较多。
在分析问题时,也应当看到,结果并不要求对每次考试的具体成绩进行层次分析,这样即可简化我们解题思路,即将通过、不通过定义为1、0即可,而不需要分析具体的考试分数(当然也可通过其他办法来进行考试成绩的定量分析)。
基于以上两个主要方面的分析,我们可以得出,利用Excel的数据透视表来解决这一问题是一个比较适当的方法。因为数据透视表是用来从Excel数据列表、关系数据库文件或OLAP多维数据集等数据源的特定字段中总比信息的分析工具。它是一种交互性报表,可以快速分类汇总比较大量的数据,并可以随时选择其中页、行和列中的不同元素,以达到快速查看数据源的不同统计结果,同时还可以随意显示和打印出用户感兴趣的区域和明细数据。数据透视表有机地综合了数据排序、筛选和分类汇总等数据分析方法的优点,可以方便地调整分类汇总的方式,灵活地以多种不同方式展示数据的特征。
3 实际操作
在本节中,以分析解决问题为主线,穿插了Excel数据处理中的常用方法。考虑到Excel 2010在数据透视表方面显著的功能升级和强化,本文以Excel 2010版本为平台进行操作。
3.1 整理数据源
准确、规范的数据源是高效分析、正确结果的基础,因此,这项基础工作应当引起足够重视。根据实际问题,将每一次考试数据放在一个Excel文件(工作簿)中,其中的多个工作表分别容纳这次考试中某一考试科目的数据,然后将几次考试的数据(几个Excel文件)放在同一个文件夹内。为方便操作和表达,这里几个文件放在“D:\成绩分析”文件夹中。
关键词:GRA分析;原始数据;Excel
中图分类号:TP301 文献标识码:A 文章编号:1009-3044(2013)28-6441-05
GRA分析也称为灰色关联分析,是多因素统计分析方法的一种。常被用来分析各相关因素之间的发展相关趋势,并以各因素的参照样本为依据用灰色关联度来表示比较因素间相关关系的强弱和大小。如果因素之间的变化趋势是近似的或者变化较为同步,则可认为因素间的关联程度大;反之,则认为关联程度小[1-3]。与其他的多因素统计分析方法相比,GRA分析对数据的要求不高,能广泛应用于各种领域。但是在GRA分析原始数据处理方法选择上由于方法多,且不同方法得出关联度差异较大,难以快速得出可信度较高的关联度。为此,该文通过实例实现用Excel建设GRA分析公式计算及原始数据处理方法的优选,以得出更为可靠的关联序列。
1 GRA分析算法
设参照数据列为[x0],比较数据列[x1]。则:
[x0={x0(k)k=1,2,…,n}=(x0(1),x0(2),…x0(n))][xi={xi(k)k=1,2,…,n}=(xi(1),xi((2),…xi(n))]
为了保证分析结果的准确性,需要对原始数据进行无量纲化处理,让其数据消除量纲并具有可比性[4]。
1.1 原始数据处理
对各数列的原始数据无量纲化处理方法通常有以下6种[5]:
1) 中心化处理:[yi(k)=xi(k)-xiσi]
2) 初值化处理:[yi(k)=xi(k)x1(k)][yi(k)=xi(k)x1(k)]
3) 百分化处理:[yi(k)=xi(k)maxkxi(k)]
4) 最大值处理:[yi(k)=xi(k)-minkxi(k)maxkxi(k)]
5) 均值化处理:[yi(k)=xi(k)xi][yi(k)=xi(k)xi]
6) 极差化处理:[yi(k)=xi(k)-minkxi(k)maxkxi(k)-minkxi(k)]
1.2 计算灰色关联度
原始数据经过无量纲化处理变换之后,则[y0]与[yi]([i]=0,1,2,...,n)在[k]点的关联系数为:
[ξi(k)=minsminty0(t)-yi(t)+ρmaxsmaxty0(t)-yi(t)y0(k)-yi(k)+ρmaxsmaxty0(t)-yi(t)]
式中,[minsmintx0(t)-xi(t)]、[maxsmaxtx0(t)-xi(t)]分别为[x0]数列与[xi]数列的最小差值和最大差值,[ρ]为分辨系数,[ρ∈(0,1]],通常情况下,分辨系数[ρ]越大,分辨率越大,反之越小,可根据实际设定,一般取[ρ=0.5]。
由于每个点(k)都存在一个关联数,因此结果比较分散,不易做出比较,确定最终关联度为[ξi(k)]总和的平均数,即[ri=1ni=1nξi(k)]。
2 原始数据处理方法的优选
灰色关联度是通过比较各分析因素的关联度大小,从整体上体现出各分析因素对系统行
为的影响,以实现对比较序列各因素进行分类或排序的目的。显然,比较序列之间的差异程度越明显越好。不同的原始数据处理方法会得出不同的关联度和排序。在采用上述6种无量纲化方法得出的关联度[riq]之后,q=1,2,...,6,确定最佳关联度时需要遵循以下条件[6]:
3 应用Excel优选GRA分析原始数据处理方法
由于GRA分析在选择最为合适的原始数据处理方法时计算量很大,操作重复性强。所
以,可以应用Excel2010为数据分析平台,就能很好的解决这些问题[7]。解决问题思路是利用Excel能够定位的特点,把需要分析的数据输入到各单元格,在利用Excel内置的函数把这些单元格与GRA分析计算公式定位链接在一起,建立起能够一次性运算的灰色关联度计算模板[8,9],并从中找出不同数据处理方法的最优方法,使GRA分析计算出的结果更为精确、更加具有说服力。
本文以焦作市2006-2010年国民经济统计数据为例,选用6种数据处理方法分析工业生产总值、建筑业生产总值和第三产业总值三者与焦作市地区生产总值的灰色关联度,并从中优选出数据处理最适方法及对应最佳关联度。
3.1 数据准备
打开Excel2010,把采集到的原始数据输入单元格(图1)。
为让运算过程清晰有序,在F2:F6区域依次输入“平均值:”、“标准差:”、“初值:”、“最大值:”和“最小值:”。在G2单元格输入平均值函数“=AVERAGE(B2:B6)”,即可得出焦作市2006-2010年地区生产总值(B2:B6区域)的平均值,然后鼠标单击F2选中此单元格,并把鼠标移动到F2单元格的右下角,当鼠标变成黑色+形状时,向右拉至J2单元格处,即可依次得到比较序列工业生产总值、建筑生产总值和第三产业总值的平均值。在G3单元格输入标准差函数 “=STDEVP(B2:B6)”、在G4单元格输入“=B2”、在G5单元格输入最大值函数 “=MAX(B2:B6)”、在G6单元格输入最小值函数“=MIN(B2:B6)”,并分别向右拉至J列得出其余3比较序列的相应的值(图2)。
3.2 原始数据处理
由于篇幅限制,该文只列出第一种数据处理方法(中心化处理)的完整步骤,其余方法由于步骤重复性,只在不同处做简要说明。
步骤一
为了能让原始数据之间具有比较性,首先对各序列进行无量纲化处理。
根据中心化处理的公式 [yi(k)=xi(k)-xiσi], 在B10单元格输入“=(B2-G$2)/G$3”,其中$为固定行或列符号,下同。通过向下、向右拉动鼠标即可得出所有原始数据无量纲化处理之后得到的数据(图3)。
步骤二
原始数据经过处理后,再采用公式[x0(t)-xi(t)]计算比较序列与参照序列在各点上的变化态势的强弱,即计算比较序列与参照序列在每一时点上差的绝对值。
在F10单元格输入绝对值函数“=ABS($B10-C10)”,通过向右和向下拉可以得出所有比较序列所有时点与对应参照序列差的绝对值(图4)。
步骤三
在上个步骤得出区域(F10:H14)分别选出最小值,[minsmintx0(t)-xi(t)]、和最大值,[maxsmaxtx0(t)-xi(t)]。在E15单元格中输入最小值函数“=MIN(F10:H14)”,在I15单元格中输入最大值函数“=MAX(F10:H14)”即可得出相应区域的最小值和最大值。具体见图5。
步骤四
根据公式 [minsminty0(t)-yi(t)+ρmaxsmaxty0(t)-yi(t)y0(k)-yi(k)+ρmaxsmaxty0(t)-yi(t)] 求取 [ξi(k)] ,其中[ρ]在本例中取0.5,实际应用时可根据实际赋值。
在C16单元格中根据公式输入“=($E$15+0.5*$I$15)/(F10+0.5*$I$15)”,通过鼠标拉动可以得出比较序列在各个时点的灰色关联度。具体数值见图6。
最后把得出的[Δq]、[σq]相加得出数据处理方法是否最优的一个比较数据。在H19单元格中输入求和函数“=SUM(H17:H18)”即可得出。判断准则[Δq]+[σq] 以及Excel完整计算过程见图8。
3.3 其余方法计算步骤说明
对于第二种数据处理方法,初值化处理,只需将2.2章节中步骤(1)中的B10单元格输入变成“=B2/G$4”,其余步骤均相同,不必改变。同理,第三种方法百分化处理、第四种方法最大值处理、第五种方法均值化处理和第六种方法极值化处理只需分别在B10单元格输入变成“=B2/G$5”、“=(B2-G$6)/G$5”、“=B2/G$2”、“=(B2-G$6)/(G$5-G$6)”即可,其余步骤均相同。
3.4 GRA结果分析
通过才用Excel实现6中数据处理方法后,得出每种方法关联度、关联序以及判断准则,具体见表1。
根据章节1.3中关于确定最佳关联度时需要遵循的条件的说明,从上表中可以看出原始数据采用中心化处理方法得出的判断准则[Δq]+[σq]的值最大,因此在此例中,第一种原始数据处理方法中心化处理为最优方法,其得出的关联度[r1]=0.88、[r2]=0.52、[r3]=0.63,关联序[r1]>[r3]>[r2]最为严谨可靠。
4 结论
本文通过GRA分析并借助Excel计算得出焦作市2006-2010年工业生产总值、建筑业生产总值、第三产业生产总值三者与地区生产总值的灰色关联度及关联序,并能快速从多种原始数据处理方法中选择最佳方法,从而得出更加准确的结果。说明用Excel在对GRA分析以及原始数据处理方法的选择上,是一种快速、准确、可行的方法,具有一定的使用价值和实际意义。
参考文献:
[1] 王百合,黄建国,张群飞.基于改进灰色关联分析的目标威胁评估模型研究[J.计算机工程与应用,2008,44(4):212-213.
[2] 邓聚龙.灰理论基础[M].武汉:华中科技大学出版社,2002:6-28.
[3] 张学甫,陈述云,胡希龄.统计分析方法及其应用[M].重庆:重庆大学出版社,1995:1-87.
[4] 李荣平,李剑玲. 多指标统计综合评价方法研究[J].河北科技大学学报,2004(1):85-87.
[5] 刘思峰,郭天榜,党耀国,等.灰色系统理论及其应用[M].北京:科学出版社,1999:105-146.
[6] 李炳军,朱春阳,周杰.原始数据无量纲化处理对灰色关联序的影响[J].河南农业大学学报,2002,36(2):200-201.
[7] 邬万江,张连富,卢伟.用Excel建立灰色数列预测模型的研究[J].佳木斯大学学报,2005(7):378-381.