时间:2023-06-11 09:07:42
引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇规则的作用和意义范例。如需获取更多原创内容,可随时联系我们的客服老师。
俗话说,"不以规矩,不能成方圆",它道出了规则的重要性。遵纪守法,遵守社会规则,是公民意识和文明水平的体现。规则意识的培养,是品德教育的重要内容。本文以《品德与社会》里《规矩与方圆》主题单元中"校园'红绿灯'"(五年级上期)一课的教学经历,谈谈"规则"教育的几点体会。
1.趣味游戏,感知规则作用
由于规则对人有约束、制约作用,是用来"管束"人的,因此,"规则"不是人人都乐于接受的,规则教育也不能只是简单的说教,只有设法让学生真切地感受到规则在生活中的重要作用,他们才会自觉地去遵守。
为了让本课教学收到良好的效果,我针对小学生喜欢活动、游戏的年龄特点,利用课前午会时间,先带领学生进行了一次班级"两人三脚走"分组比赛。活动前,我有意不提细致的比赛规则和要求,只强调安全、快速、有序,目的是为了让学生在活动中感知规则的缺失对活动的影响,以便于在活动小结时凸显出规则的作用。
在活动总结时,同学们发现各组人数有不一样的,各组男女生的数量也有不一样的;有两个组各单着一个人,其中一组为了陪单着的同学游戏,有一位同学走了两次,另一组里单着的同学没有参加比赛;还有一个组在老师还没有发起跑口令前就先跑了一点,这些对评判各组名次、输赢都有影响。通过总结、讨论,学生初步体会到了规则的作用,并讨论制定了较完善的游戏规则。
2.事例分析,理解规则意义
本课的主题故事为《玩不成的游戏――谁来摇绳》。有了班级比赛活动的启发,学生很快明白了游戏不能正常进行的原因,不仅很快为故事中的小伙伴想出了解决问题的办法,还在讨论过程中理解了主题提示语"开展集体活动时,有了明确的规则,并且大家都能自觉遵守,这样才能保障活动顺利进行"这句话,理解了规则的作用和意义。
教科书里还有"下象棋不能飞象过河""起跑时脚不能踩线""听报告时要保持安静"等情景对话,分别从公共秩序、公共安全等角度对"规则"概念进行拓展延伸,帮助学生去探寻和发现无处不在的规则。教学时,引导学生探究制定这些规则的原因,能使学生更深入地理解规则的作用和意义。
3.榜样引领,深化规则意识
教科书还编排了"名人与规则"的故事《规则伴我成长》来深化规则意识。故事讲一位记者采访一位荣获诺贝尔奖的科学家,问他"你是在哪所大学学到了您认为最重要的东西?"这位科学家认为,他学到的最重要的东西,是在幼儿园学会的规则,比如"把自己的东西分一半给小伙伴;不是自己的东西不能拿;东西要放整齐;吃饭前要洗手,午饭后要休息;做错事要表示歉意;要仔细观察大自然"等。
科学家列举的都是些生活小事,然而正是这些生活小事构成了社会生活的方方面面。遵守这些人们普遍认同、约定俗成的习惯,就是遵守社会规则。这位科学家的故事告诉我们,大科学家与普通人没有什么两样,所不同的是他们从小养成了遵守规则的好习惯。当学生明白了这些道理以后,他们对规则的作用与意义有了更深入的认识和体会。
4.整合教学案例,强化规则意识
教科书提供的"小资料"是"校园踩踏事故",讲的是某省一所小学的同学在第二节课下课后,争先恐后地奔向楼梯,因为推搡、拥挤,导致当场压死、踩死24人,压伤几十人的惨剧。为了强化规则意识,教学时,我将教科书下一课里某人违章驾驶农用车搭载80人,造成20人死亡、53人受伤的特大交通事故提前运用。
一个个血淋淋的真实案例,让学生看到了不遵守规则的可怕,从心底里明白了"没有红灯的约束,就没有绿灯的自由。""我们遵守规则,也享受着规则带来的好处。""如果没有规则的制约,社会秩序就会变得混乱。""不遵守规则的人最终只会给自己的生活带来不便,甚至酿成惨祸,危及他人,危害社会"这些主题提示语的含义,深刻地体会到规则的巨大作用和重要意义,强化了规则意识。
5.总结提升,内化规则意识
教科书在每一部分内容后面,都有总结性的主题提示语对所讲内容进行归纳、总结和提升。"校园'红绿灯'"这课的主题提示语还有"规则意识来自责任感,它的最高体现是自律,是自己管住自己。""在人生路上,我们要不断学习自省,学习自我约束,学习对自己的行为负责。"等。
关键词:语法 规则 语法意识
中图分类号: G642 文献标识码: A 文章编号:1672-1578(2012)01-0076-01
语法教学是二语习得中不可忽略的部分,掌握英语语法规则对于提高学习效率具有重要意义。然而在现实的英语语法教学中,常常由于对语法认识上的误区,导致语法教学的失误,最终影响了英语的学习效果。笔者试图对此进行以下分析:
1 英语语法教学的误区
英语语法教学脱离不了语法规则的学习,然而语法规则的作用常常被夸大,将语法视为对语言使用的绝对规定和权威规则。在语法教学实践中,往往将语法规则僵死化,规定化和模式化处理,用语法绝对的规定论抹杀了语言学习的生动性和活泼性。当面及学生对语法规则追根溯源时,教师常常冠以“语法的规定”来解释,并要求学生死记硬背规则的条条框框。基于这种认识,语法教学成了“僵死的”“权威的”规则教学,英语学习以学生掌握语法规则为中心,尤其以“偏,难,怪”等语法知识点传授为重点,视这些语法点为高深的“学问”和“知识”,而忽视了对一些基本语法规则的教学,这是语法教学的本末倒置。语法绝对的规定论夸大了语法在语言学习中的作用,将语言学习模式化,最终不利于语言习得。
2 英语教学中语法的含义
在英语教学中,通常在语法学意义上理解语法,语法学是描述、解释、总结或是研究语法结构规律的科学,它以语法事实为基础,是对客观存在的语法事实的系统性认识和说明。语法教学是有意识有目的的传授语言规则的实践。语法来源于语言使用者的使用,经过语法学家的总结,形成了语法学,成为我们教学中的内容。从根源上讲,语言现象和事实决定了语法规则,语法教学只是对现实生活中语法现象和事实的说明和总结概括的呈现。因此,语言学家和语法学家研究的语法是语言现象和事实的总结而不是“谁的规定”,只有语言使用者或者说大多数语言使用者对语法具有绝对的支配权。至此,我们可以看到语法作为规则不是绝对的,而是相对的,这将引导我们走出语法绝对规定论的误区,避免对语法规则产生绝对的权威的崇拜,从而认识到语言的生动性和鲜活性。
3 语法规则的局限性
语法规则的总结和概括总是有限性,有限的语法规则不可能对无限的语言现象进行全面的概括和总结。首先,英语中的一些固定搭配,习语和谚语等是用语法知识无法解释的。例如:to have no time for 在美式英语中表示的“dislike”意思;It is a wise father that knows his own child根据语法分析意思是“只有聪明的父亲才能了解自己的孩子”,但在英语中已成为一句谚语“即使聪明的父亲也不一定了解自己的孩子”。其次,不是所有合乎语法的句子都是有意义的,例如Colorful red ideas合乎语法规则但是没有意义的。第三,即使合乎语法又有意义的句子,也不一定都是正确的,因为语言很大程度上讲是约定俗成的,是一种使用习惯。“有些句子合乎语法也有意义,却是错句,例如:He is impossible to finish the job in three days. 因为它不合习惯”(王福祯)第四,有些句子合乎语法也有意义,也能算正确的,但不地道。John Pinkham 在《中式英语之鉴》中对这类现象做了深入的分析。例如“The prolongation of the existence of this temple is due to the solidity of its construction”应该为“This temple has endured because it was solidly built.”更为地道。虽然第一个句子符合语法也有意义还算正确,但第二个句子用动词主宰更富有生气,更符合英语语言的习惯,更为地道。我们既要认识语法规则对于英语学习的意义,更要认识它的局限性,这对于我们树立正确的语法教学观具有重要意义。
4 树立正确的英语语法教学观
我国著名语法学家章振邦先生对语法有精辟的论述:“语法规则是从大量的,实际使用的口头语和书面语中抽象出来的,而不是少数语法学家和修辞学家主观规定的;它是不断发展变化的语言现象的科学概括 ,而不是停滞不前,脱离实际的僵死条文。研究语法必须从语言实际出发并用以指导实践,以提高对语言的分析理解和运用水平。”摒弃语法绝对规定论这一错误的认识,是树立正确语法教学观的前提。
应当树立怎样的语法教学观呢?首先应当认识到,语法教学不是以掌握僵死的语言规则为宗旨,而是以这些基本语法规则的学习为手段,理解句子,并加深对同一类语言现象的理解,举一反三,更有效地学习语言。其次,语法规则的归纳是不完全的归纳,语法规则之外还有很多特例现象,在语法教学实践中,要摒弃那些“偏,难,怪”等语法概念和现象,回归到普遍的共性的规则的教学。第三,在教授语法规则之后要通过大量的句子练习来培养语法应用能力,例如运用情境创设法,角色扮演法等让学生在真实的语言环境中运用语法。语法教学评价不能考查学生对规则的识记,应当检测学生能否正确的表达。第四,唤起学生的语法意识,是当代语法教学的追求。摈弃绝对规定论的语法观,要求我们将语法教“活”起来,使学生在平时的英语学习中,有意识地注意目的语的形式特征,并实现内化,最终达到自如地正确使用语言,这也是语法教学的最终归宿。
参考文献:
[1]王福祯.英语惯用法色奥秘 [M].北京:中国国际广播出版社,2005.2.
[2](美)平卡姆(PInkham,J).中式英语之鉴[M]北京:外语教学与研究出版社,1998.12.
关键词:数据挖掘;数据库;多数据库;模式评价
中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)19-30021-02
Data Mining Pattern Valuation in Multi-database and Single-database
MI Jie, LI Ke
(Henan Institute of Engineering, Zhengzhou 450007, China)
Abstract: Some measures of pattern evaluation are analyzed from both the objective and subjective point of view respectively. Also two objective measures to evaluate patterns in multi-database are proposed.
Key words: data mining; database; multi-database; pattern evaluation
1 引言
数据挖掘(DM),又称为数据库中的知识发现(KDD)。根据目前比较公认、完整、深刻和全面的数据挖掘定义――德国Fayyadz等人在1996年发表的论文《From Data Mining to Knowledge Discovery》中提出:数据挖掘是从大量的数据中提取出有效的、新颖的、有潜在价值的、可信的、并能最终被人理解的模式的非平凡的处理过程。从该定义可以看出,数据挖掘得到的模式,评价其度量标准主要包括有效性、新颖性、潜在有用性和最终可理解性[1]。对它们进行综合度量的标准称为模式或规则的感兴趣度,它分为客观感兴趣度和主观感兴趣度。前者的主要根据是模式或规则的形式和数据库中的数据,属于数据驱动;而后者还要考虑用户的参与等人为因素的影响,属于用户驱动。在评价过程中应该综合使用这两种度量标准,比较合理的方法是首先用客观感兴趣度作为第一级过滤器,选出潜在感兴趣的模式,然后再用主观感兴趣度来对它们进行第二级筛选,得到用户真正感兴趣的知识。
2 对单数据库挖掘模式的评价
2.1 客观评价
目前,感兴趣度的研究主要针对规则的客观感兴趣度[2],客观度量是对用户兴趣的估计。有趣性的客观评价是指规则的有趣性是由规则的具体结构和在数据挖掘过程中所依赖的数据决定的,这种方法主要是在这些规则上应用统计学方法,用定量的数值来判定规则的有趣性,从而避免了人为的主观意见,因此从这个意义上讲,规则有趣性的客观评价是可靠的、有说服力的。
一般的,影响规则感兴趣度的数据方面的因素共有三个(假设规则为A=>B):
(1)覆盖度(Coverage):指前件A出现的概率P(A);
(2)完全性(Completeness):指两者(A与B)同时出现的概率与B出现的概率之比,即P P(A∧B)/P(B);
(3)可信度(Confidence Factor):指两者(A与B)同时出现的概率与A出现的概率之比,即P(A∧B)/P(A)。
Piatetsky-Shapiro提出的规则感兴趣性RI(Rule Interestingness)度量的三个准则为:
(1)如果P(A∧B)=P(A)P(B),那么RI=0;
(2)当其它参数固定时,RI随着P(A∧B)的增加单调递增;
(3)当其它参数固定时,RI随着P(A)或P(B)的增加单调递减。
Magor和Mangano提出了第四个准则:
(4)当给定的可信度大于允许的可信度时,RI随着P(A)的增加单调递增。
另一个通用的评价规则质量的是规则简洁度。它是用来衡量规则的最终可理解程度的指标。它表现在两个方面:一方面是在规则项的个数上,如果规则项数很多将不利于对这条规则的理解。因此,规则的项数是一个衡量规则简洁性的逆向指标,即规则的项数越多,规则的简洁性越差;另一方面是在规则所包含的抽象层次上,层次越高,它对数据的解释能力越强,也越容易理解;相反则它对数据的解释能力越差,因此也越不容易理解。
Symth利用如下函数对规则A=>B的简洁性和包含的信息量进行综合度量,考虑了规则的前件A和后件B的概率分布的相似程度,以及用A的出现概率作为前件的简洁性的度量,但是,忽略了P(B)的作用。
■
以关联规则为例,支持度和可信度度量是评价关联规则的两个常用客观性指标,支持度度量反映了规则的实用性,而可信度度量反映了规则的有效性。很多传统的关联规则挖掘算法就是基于这种模型来进行关联规则挖掘的,也就是找出所有的强关联规则。但是强关联规则并不一定是有趣的,有时甚至是有错误的。
因此,有人提出了各种新的规则评价标准,并将其加入到挖掘算法中,对关联规则的产生加以限制和约束,以得到更加新颖、更加有效的关联规则。有人提出了兴趣度(lift)度量方法。对于一条规则A=>B,兴趣度定义为:
■
兴趣度反映了交易A和交易B之间的关系,当兴趣度等于1时,表明两项交易同时出现属于概率事件,不具有特别意义,即A和B是独立的,称该规则为不相关规则;兴趣度小于1时表明其中一个项集的出现降低了另一个项集出现的可能性,称为负相关规则;兴趣度大于1时表明一个项集的出现会增加另一个项集出现的可能性,称为正相关规则。一般情况下,挖掘出正相关的关联规则更具现实意义,但有时负相关规则的出现也会为用户带来新的知识。
我们可以将兴趣度同支持度和可信度一起作为规则的客观度量标准,以提高所挖掘规则的有效性。
2.2 主观评价
规则有趣性的客观评价只是基于数据本身的结构来展开的[3],规则的产生完全基于事实数据,并没有考虑规则之间的联系和用户对规则的认同程度。但是一个规则是否有趣最终要取决于用户的感觉。只有用户可以决定规则的有效性和可行性。我们应该将用户的需求和挖掘系统结合起来才能挖掘出更加有效的规则。因此,判断规则的有趣性必须考虑到主观层面上的意义。仅根据客观感兴趣度选取用户所关注的模式,难以获得用户真正感兴趣的模式,还需要人为的参与。从主观的角度讲,能使用户对发现的模式产生兴趣的原因主要有两个:意外性和实用性。
这两者是紧密相关的。以关联规则为例,有趣性的主观评价是指关联规则的有趣性不仅由规则的具体结构和在数据挖掘过程所依赖的数据决定,而还应与使用规则的用户感觉有关。而高支持度和高可信度的规则对用户来讲并不一定有意义,从用户的主观角度看,规则的非预期性(指所挖掘的规则对用户来讲是超乎想象的、没曾见过的)和可行性(指依据所挖掘出来的规则进行决策)应该是用户更感兴趣的。
与主观评价有关的指标有新颖度、用户感兴趣度等,本文认为,规则的新颖度是其中一个很重要的评价指标。
模式的新颖性主要表现在发现模式与知识库中模式的差异程度上。对模式的新颖性评价是针对于原有的模式而言的,这可能会包括两个部分的内容:
首先,所挖掘出来的模式与已有的模式有差异,产生这种情况的原因可能是:
(1)所挖掘的数据对象有问题,则该模式是错误的;
(2)新挖掘出来的模式是对原有模式的一个补充或具有更高的抽象层次;
(3)新挖掘出来的模式了原有的模式。这说明原有的模式可能失效,应删除原有的模式。
其次,所挖掘出来的模式与用户的期望模式有差异,用户在进行模式挖掘的过程中,往往期望得到一些自己感兴趣的模式。然而,实际的挖掘过程中可能会出现用户意想不到的新模式。这些可能有助于用户修正原有的期望模式,同时可以通过对新模式的进一步分析,从而得到更具新颖性的。
用户对规则是否感兴趣的重要指标是新颖性,它是针对于原有知识而言的,这些知识包括两个部分:一是以往得到的准确性很高的规则,与当前所得到的规则相悖;二是与用户所期望的知识相悖。因此,衡量新颖性主要是从形式上进行的,即分别用与规则的前件和后件的相悖程度来衡量,也可以用与原有知识的相悖的项数来衡量。我们可以通过模板匹配的方法来评价模式的新颖度,首先由用户给出他所期望的模式作为模板,然后我们将挖掘得到的模式与模板对前件和后件分别进行匹配。匹配的结果可以将挖掘得到的模式分成四类:前件后件都匹配、前件匹配后件不匹配、后件匹配前件不匹配及前件后件都不匹配。前件后件都匹配的模式与用户的期望一致,达到了用户预想的目的,但是它对用户的期望不具有新颖性。其他三类模式均与用户的期望有差异,也即具有新颖性,这时用户便可以对这些模式进行更深层次的分析,从而发现问题或作出更加有利的决策。
3 多数据库中的模式的评价
目前,专门针对多数据库中的模式的评价尚不多见。本文认为从主观方面,对多数据库中的模式的评价与单数据库中的模式评价方法类似,但从客观方面应有不同,因为多数据库在数据方面与单数据库有着很大差别,需要考虑许多单数据库不需要考虑的因素,比如说应考虑多数据库中每个数据库的权重等。对于多数据库中模式的客观度量主要考虑以下两方面:
3.1 模式的支持度
假设模式为A,我们定义模式A的支持度为多数据库中模式A的支持程度,记为support(A),计算方法如下:
■
其中,num(A)表示多数据库中支持模式A的数据库个数,n为总的数据库个数。
模式的支持度反映了模式在多数据库中的实用性或普遍性。支持模式的数据库个数越多,则模式的支持度也越高,该模式在多数据库中就越普遍,也即实用性也越高。
3.2 模式的重要度
我们定义多数据库中模式的重要度为模式对整个多数据库系统的重要程度,记为importance(A)。 计算方法如下:
其中,k为支持模式A的数据库个数,即num(A);Wi为支持模式A的第i个数据库的权重,这里我们对如何为数据库赋权值不作讨论,只在我们假设多数据库中各个数据库具有相同地位时将其权重默认为1;sup(Ai)为模式A在支持它的第i个数据库中的支持度;min supi为支持模式A的第i个数据库中用户给定的最小支持度阈值;max supi为支持模式A的第i个数据库中所有模式的最大支持度。
重要度的计算中我们主要考虑到三个因素:模式的支持度、支持模式的数据库的权重及模式在支持它的数据库中的相对支持度。模式的支持度反映了模式的实用性或普遍性;每个数据库所在的分支对总公司的贡献是不同的,因此对不同的数据库应赋予不同的权重;每个数据库有不同的数据信息,模式在支持它的不同数据库中的支持度有着不同的标准,因此要计算模式在支持它的各个数据库中的相对支持度,即公式中的■。
模式的重要度越大,我们认为模式对整个多数据库系统越重要。
4 小结
在知识发现过程中,通过挖掘算法产生大量的模式,但是大多数用户对此并不感兴趣。如何对它们进行评价,选取出用户感兴趣的和有用的知识是至关重要的,故对知识评价的研究具有重要的意义。
现有的各种评价方法都存在一定的缺陷,目前还没有一种非常有效的评价方法能适应所有的数据或不同的用户需求。这方面的研究工作还有待我们继续进行。
参考文献:
[1] 綦艳霞,杨炳儒.KDD中知识评价的研究综述[J].计算机应用研究,2001(12):1-4.
[2] 娄兰芳,蒋志芳,田世壮.影响关联规则挖掘的有趣性因素[J].计算机工程与应用,2003(6):190-191.
一、家园协同培养幼儿规则意识的重要性
研究表明,良好的习惯是建构在幼儿良好的规则意识和执行规则的能力之上的,幼儿教育工作者应与家长携起手来共同探究一些行之有效的培养幼儿规则意识的途径与方法,积极地引导、点拨幼儿努力提升自己的规则意识,让幼儿成为规则的主人。
幼儿规则意识的形成离不开家庭,家庭是幼儿规则意识形成的自然的“生态环境”,不可否认任何一个幼儿都能从自己的家庭生活中获得不同于其他人的经验,形成自己的独特行为习惯、发展待人处事的技能等。家长是幼儿规则意识形成的重要“力量源”。幼儿园与家庭共同协同是培养幼儿规则意识的必由之路,幼儿园与家庭共同担负着培养幼儿规则意识的任务。幼儿形成了规则意识,对幼儿的全面可持续发展有着积极的意义。
二、培养幼儿规则意识的有效策略
现代幼儿教育研究表明规则绝非是冰冷冷的条条框框,而应该是与幼儿的情感世界有密切联系的,让幼儿共同认同的,让幼儿共同参与制定的,让幼儿能够自觉遵守的,幼儿理应成为规则的小主人。
(1)幼儿应当成为规则的发现者。在幼儿生活中规则无处不在。在生活中,处处有规则,幼儿教育工作者如果能适时抓住幼儿感兴趣的话题与幼儿展开谈话,就可以恰当地了解幼儿们对生活中“规则”的掌握情况。如爸爸妈妈常常带领幼儿逛商场、超市、书店,带幼儿乘坐地铁、公交等,在这些场所人们应当遵守什么规则?此时此刻,成人特别是家长的“榜样”作用会给幼儿留下深刻的印象,会对幼儿发生潜移默化的影响,幼儿会自主发现取放物品要做到从哪里拿还放回哪里的规则;发现到超市付款、乘地铁、乘公交应该排队等候的规则……在大人特别是家长的榜样与监督下,幼儿们会逐步明白这些规则的意义并能自觉地遵守诸如此类的规则。又如幼儿们会自然地发现在幼儿园区域游戏活动时对活动材料要归类摆放,并应当与同伴一起合作分享等。幼儿教育工作者应善于做规则的引导者,启发、点拨幼儿发现生活中的规则,让幼儿触类旁通、举一反三,真正成为规则的发现者。
(2)幼儿应当成为规则的制定者。幼儿规则习惯的养成应以幼儿自身为主体,幼儿规则的制定应以幼儿为本,要发挥幼儿的主体性、主动性,制定规则、实施规则应尊重幼儿,幼儿教育工作者应把握好适当的“度”,只能起主导作用而不是主体作用,不可喧宾夺主。什么样的规则是幼儿们愿意并自觉遵守的,他们最有发言权、自,幼儿教育工作者应大胆放手,让幼儿大胆地、无拘无束地去感受规则、去体验规则、去比较规则、去建构规则,在平等与尊重的基础上让幼儿充当规则的主动制定者,进而发展为规则的自觉执行者。
(3)幼儿应当成为规则的管理者。幼儿心理学研究认为幼儿仍是一个处于成长发展中的尚欠成熟的独特生命个体,幼儿自身的主体自觉性尚不够,规则制定后要想能够得到充分的落实,幼儿还需要别人,尤其是幼儿教育工作者与家长的协同督促。规则离不开幼儿不断的练习与强化,有时幼儿尚且在思想上接受了规则,知道规则的存在,但往往很难形成自觉的行为,以至于不能很好地去遵守规则。幼儿教育工作者可以引导幼儿们自主选举一些监督员作为规则的管理者,以培养幼儿的规则意识,提升幼儿的管理能力,让幼儿相互督促、相互帮助,共同维护并遵守规则,形成良好的行为习惯。
关键词: 数据挖掘; 关联规则; 确定因素法; 序列模式
中图分类号: TN911?34; TM417 文献标识码: A 文章编号: 1004?373X(2016)13?0145?04
Abstract: According to the educational data mining (EDM) technology, the minimum association rule of students course selection and student temporary interest learning pattern are mined respectively by means of definite factor method and sequence pattern mining in association rules mining to analyze the student behavior. The definite factors (DF) method in minimum association rule mining is used to mine the minimum association rules of students course selection in the courses database. And then, the temporary interest sequence pattern (TIPS) technique is used to find out the short?term learning behavior pattern in learning activity sequences. The experimental verification results show this algorithm has a practical significance.
Keywords: data mining; association rule; definite factor method; sequence pattern
近些年,围绕着大数据可被用于造福教育与学习科学这一共同利益,两个方面的技术逐渐得到了发展,这两个方面就是教育数据挖掘(EDM) 以及学习分析[1]。随着教育数据挖掘的快速发展,数据挖掘中的各项技术,诸如关联规则挖掘,序列模式挖掘等技术都相继得到了应用,这也进一步促进了教育数据挖掘技术的发展。同时,通过教育数据挖掘对教育数据进行的数据挖掘而得到的潜在信息或是关联规则也得到了更多的应用,通过这些潜在信息和关联规则,管理者可以更好地制定管理策略和教学策略,这对提高学校的管理和教学有着非常重要的意义[2]。
1 学生课程选择的最小关联规则的挖掘
学生的课程选择是大学生日常学习生活中必须接触到的,并且会直接影响到学生在校学习,所以课程选择显然是一种重要的学生行为[3]。因此,采用确定因素法,从课程数据库中挖掘学生课程可以采用最小关联规则挖掘技术。
1.1 关联规则
(1) 关联规则的挖掘
关联关系可以采用置信度、支持度、期望置信度、作用度四个标量进行表述。通常来说,置信度就是关联规则下准确度的衡量标准,而支持度则体现了重要性标准。支持度越大,说明这个关联规则就更加重要。如果在数据挖掘中,存在关联规则的置信度较高,但是支持度却相对较低,那么这种规则的实际应用效果就很难保障[4]。
(2) 关联规则挖掘的过程
关联规则的挖掘需要通过两个阶段来实现:第一个阶段就是从现有的数据集合中找到高频项目组,并进行整合;第二个阶段就是通过这些高频项目组构建关联规则。
在第一个阶段中涉及到的高频项目组中的高频内涵指的是其中某一个具体的项目组出现的频率,只有这个项目组在记录中出现的频率达到了某一个水平,那么就叫做高频项目组。而且一个项目组出现的频率实际上就是支持度。比如以包含了物品集合和物品集合的项目为例,通过式(1)就能够获得的项目支持度。
通过式(1)计算出来的支持度如果大于设定的最小支持度,那么{A,B}这个项目组就可以称作高频项目组。比如某个项目组K?满足了这个最小支持度,就说明这个项目组K?是高频项目组,可以使用Large k表示这种高频项目组。然后关联算法就从Large k中进行延伸,从而产生Large k+1,直到找到了所有的高频项目组。
关联规则的第二个阶段自然就是找到关联规则。实际上很多高频项目组就是产生关联规则的摇篮。利用第一个过程中的项目组K?获得关联规则。在设置最小置信度的门槛下,如果每一个关联规则超过了这个置信度,那么这个规则就能够作为有意义的关联规则进行评估和可视化。
1.2 教育数据挖掘中的最小关联规则
教育类数据是挖掘明显的最小关联规则中的一种潜在资源,这些规则对于协助高校的管理者或是高校的教师在做出正确的决策和制定完善的教学方案时有着非常好的作用。这一研究的重要性在于,它能够发现所选的课程中不寻常的关联[5]。进一步而言,它还可以反映在大学的课程问题上频繁和最低规则的结合中可能存在的规则。这一研究的结果可以让学校老师给某一类的学生提供合适的课程作出指导。事实上,它可以帮助大学政策制定者理解和提高目前的教学水平,整体提升管理流程水平[6]。
采用确定因素(Definite Factors,DF)法检测学生已选择的大学课程之间的不寻常关系。事实上,确定因素法可以考虑到大学课程之间的频繁和最低的结合因素,用以生成想要的最低管理规则。在生成这些规则之前采用LP?3和LP?增长算法。
1.3 确定因素法
设指的是一系列称为常数值的项目,指的是一系列非负实数称为权重的项目,指的是业务中的数据集,而业务中的是一系列特别的项目,每个业务可以由一个特殊的识别码TID进行识别。
(1) 定义
针对本文中所使用的算法,为了使其易于理解,在这里,先给出一些定义。
定义1 设为一个项目集,该项目集合为项目K?,称为项目集K?。
定义2 该项目集的支持值是即supp(X)被定义为一项包括了业务的项目数据。
定义3 设为一个项目集,和之间的关联规则是在的情况下,其中,和分别表示原因和结果。
定义4 关联规则支持值即supp则定义为包括了业务中的数据。
定义5 关联规则的置信区间,即conf,定义为包含的业务中的数据的一种概率。所以,conf的计算公式如下:
定义6 确定因素是在不同的项目集里,通过一个项目集的频繁程度与基准频率进行对比,开发支持值的公式。项目集的基准频率应假设为统计上是独立的。
确定因素,即DF,且:
(2) 最低关联规则的构造定义
若一个规则符合以下两个条件归类为最小相关规则定义(SLAR) 。一是,相关规则的DF必须大于预设的最低DF。最小DF是在0~1之间。二是,相关规则的因果条件必须既不是最低项目也不是频繁项目[7]。每个相关规则DF的计算都应该采用定义6的方法确定。DLAR算法构建的完整过程如下:
1.4 实验结果
用确定因素方法取得实验文本,所有关联规则的权重都会根据这一方法进行分配。在此,学生可以在原始图表中根据固定定位选择8个课程。每个课程的实际定位是根据固定课程进行设置的。在某大学里,共计为某届学生提供822个本科课程。根据这些数据,160名学生选择了342个本科课程,可以归类为47个类型领域。从中抽出了5个课程列在表1中。同时,在实验中还用到了确定因素法中的LP?树和LP?成长算法。
经过实验,共有4 177个相关规则被成功提取出来,如图1所示,学生一共选择了一些(或没有选择) 相关的计算机课程,大约有32%的学生没有申请计算机科学课程,大约有36%的学生选择了4门计算机课程。如图2所示为采用不同支持范围的相关规则的总数。较高的相关规则数支持值低于1%,而最低值相关规则的支持范围应为2%~3%,进一步分析表明,专注于支持值大于3%的规则。3%的最小支持值相当于在本项目中必须至少出现五次的项目集。表2列举了前十位最小值为3%的相关规则。
表3给出了根据表2的相关规则的意义。由于课程领域的矛盾,第一个规则到第五个规则是比较奇怪的。第六个规则就非常真实,因为在基础要求上两个项目有着相似之处。第六到第十个规则,解释起来则比较难比较复杂,因为这些课程中并无相关的兴趣。据此,可以看到,学生们在选择大学课程的过程中混淆了他们的几种兴趣。总之,在大学选课数据库中现存的相关规则是有例外的。这一信息对全面了解学生的兴趣以及如何引导他们选择更合适的大学课程是非常有意义的。
2 挖掘具有临时兴趣的学习行为模式
2.1 识别临时兴趣模式
在这一环节里,使用序列技术展现临时兴趣序列模式(TIPS) 技术并使其与兴趣方法相符,从而辨识出学生行为中最具临时兴趣的部分,然后对其进行视觉化处理[8]。每名学生的一系列不同行为都具有与其相关的序列,TIPS技术主要由四个基础步骤组成:
(1) 通过在学生的学习活动序列中应用序列模式挖掘法并生成候选模式(频率底线为50%) ;
(2) 通过把每个候选模式映射到它在活动序列中发生的位置,算出其临时覆盖区域;
(3) 使用一种被应用于每种模式的临时覆盖范围中的理论兴趣方法来提供候选模式的排名;
(4) 对于那些排名较高的模式,使用热量地图对其临时覆盖范围做出视觉化处理,从而更轻易地获取其用法趋势和峰值。
为了定义TIPS技术的信息增益应用表现出了两个重要观点:
(1) 当使两种模式的总发生几率相同时,更具时间特异性(即特定时间域内具有更多独特活动)的模式则会具有更高的排名;
(2) 当使两种模式在相临时域内总发生几率相同时,总计频度更高的模式则会具有更高的排名。
2.2 Betty的大脑数据
在“Betty的大脑”这款软件中,学生的学习和教导任务主要围绕以下7种展开:阅读相关材料获取信息;在因果联系图中添加或移除联系以组织联系,然后把这些信息教授给Betty;询问Betty对基于因果联系图域的看法;让Betty参加由导师制作出的小测验以检验其对于当前图中各种联系的正误理解;让Betty说明她会使用哪种关系来回答小测验中的问题;记下笔记以供日后参考;标注出联系以记录下通过测试与阅读环节决定的正确性。
2.3 实验结果
关键词:原产地规则;原产地规则协定;原产地规则委员会
中图分类号:DF4 文献标志码:A 文章编号:1673-291X(2013)23-0297-02
一、原产地规则的含义及意义
原产地规则的产生,起源于一国在国际贸易中对贸易统计的需要。货物的“原产地”通常指货物的“原产国”(包括国家、国家集团、地区)。 所谓货物的“原产国”是指为了国际贸易的目的,依据一定的标准所确定的生产或制造货物的国家。原产地规则应定义为:一个国家或地区为确定货物的原产地而实施的普遍适用的法律、法则和行政决定。①
原产地规则在国际贸易中的基本作用主要体现在以下三个方面:
1.确立产品享受关税待遇的依据。在货物的进出口贸易过程中,各国海关均依据进口货物的原产地,确定给予的相应的“多栏制”差别关税待遇。
2.实施非关税措施的依据。在WTO 中,反倾销措施、反补贴措施、保障措施、关税配额等等都离不开原产地规则。如反倾销诉讼案中货物的原产地就涉及到国内价格的确定。
3.进行贸易统计的依据,即用于联合国、世界贸易组织等国际机构及各国的国别贸易统计和分析。
二、原产地规则的协调进程
(一)协调原产地规则的历史进程
1.GATT时代
在GATT之前有关原产地规则的国际协调行动几乎无迹可寻,哈瓦那的筹备委员会曾认为,原产地的认定属于各国的自力,因此应该按照各国法律为适用最惠国待遇规定的目的决定和货品来源。但可以肯定的是1947年制定GATT前国际社会已经意识到各行其是的各国原产地规则对国际贸易的消极影响,所以于GATT中对原产地有所定义,但GATT1947本身并无原产地规则的具体规定,仅由委员会建议了以下原产地规则,即“货物系完全由一个国家的原料与劳力所制造者,系属该国产品,即该产品系在该国收获、由土地上取得、制造或用其他方法造成。一货品系由两个以上国家的原料及劳力所制造,其原产地的认定,应以此一货品最终实质转型时所属国家决定。由于加工的结果而给予货品新的特性时,被认为有本质上的改变。”乌拉圭回合签订的原产地协定仍然是以这个定义为基础而发展出来的。
GATT体系中,在乌拉圭回合之前,仅由东京回合时所制定的《政府采购协定》对原产地规则有所提及。该协定第四条第一项规定,缔约国就政府采购所适用的原产地规则必须与产品及服务通常贸易过程所适用的原产地规则相同。但是,政府采购协定本身没有对原产地规则的内容进行任何说明。
2.关税合作理事会的“京都公约”
在GATT的体系之外,关税合作理事会于1973年赞助签订并于1974年生效的《关税程序的简化及统一化国际公约》(简称“京都公约”)附件D.1.有较详细的规定。“京都公约”也是乌拉圭回合之前国际上唯一有关原产地规则的多边协定。该公约附件D.1.将原产地的认定分为两类不同的情形:一是仅涉及一个国家的情况,即此产品系完全在一国生产者,该国家为产品的原产地。二是产品的制造过程涉及两个以上的情形,“京都公约”以产品最终实质转型地点为原产地。
“京都公约”生效之后,由于其签约国不多,且该公约对签约国除强制性规定“完全在一国生产”的情形限于公约所列10种情况外,并未强制要求采取什么方式认定“实质转型”,所以各国所采用的原产地规则自有不同。 京都公约只规定了供成员国自由造择或参照的标准条款和建议条款,原产地规则的协调进程并没有因为“京都公约”而有质的飞跃。
(二)WTO的原产地规则法律制度框架
1.WTO《原产地规则协定》
在乌拉圭回合中,应美国、日本等国的要求,乌拉圭回合多边贸易谈判的非关税措施谈判组将原产地规则问题列为重点谈判议题。在谈判过程中,日本就原产地认定基准的程序、基本的规则框架、通报、协商及争端解决的程序提出一个方案,美国也提出了方案,其后美日两国在关税合作理事会的配合之下,提出要制定包括特惠贸易的原产地规则。但是,欧共体主张在关税合作理事会主持之下,制定不包括特惠贸易的原产地规则。1990年12月的布鲁塞尔部长会议最后达成妥协,同意把特惠贸易的规则作为原产地规则的附件,最终通过了原产地规则协定。《原产地规则协定》 ( Agreement of Rules of Origin )是WTO体系下唯一有关原产地规则的生效的国际协定。
《原产地规则协定》除了前言,由第1部分“定义与适用范围”,第2部分“关于实施原产地规则的规定”,第3部分“通知,审查和争端解决的程序安排”,第4部分“原产地规则的协调”,以及附录1“原产地规则技术委员会”,附件2“关于优惠性原产地规则的共同宣言”,这样4个部分2个附录所组成。
《原产地规则协定》将原产地规则定义为:“任何成员为确定货物原产地而实施的普遍适用的法律、法规和行政裁决,”①“包括用于非优惠商业政策工具的所有原产地规则”,“还应包括用于政府采购和贸易统计的原产地规则”。②这表明《原产地规则协定》将原产地规则定位于非优惠原产地规则。
第二部分规定了过渡期内和过渡期后的纪律。③第三部分涉及通知、审议、磋商和争端解决的程序安排。第四部分是该协定的核心内容,对原产地规则的协调目的、原则、工作计划、实施期限及其联系方式作了安排。在世界贸易组织协定生效后,立即开始原产地规则的国际协调工作,要求在3年之内完成。由世界海关组织提供详尽的数据,技术委员会按照既定原则对有关协调工作提供解释和意见。在技术委员会根据HS协调编码制度目录各章节所列产品类型的基础上,完成协调工作计划。
《原产地规则协定》的两个附件具有与文本同样的法律效能。一是《原产地规则技术委员会》;二是《关于优惠原产地规则的共同宣言》。前者主要明确和规定了技术委员会的职责、工作要求和代表的产生等事宜;后者的定义不同于本协议正文中所述的非优惠原产地规则,它是指一成员方为确认货物能否享受关税减免优惠的规则,适用自制的贸易体制而实施的有关原产地规则的法律、法规以及行政决定。世界各发达国家给发展中国家的关税优惠待遇G.S.P.普惠制方案中的原产地规则一般都应遵循这个《宣言》制订。
2.WTO《非优惠原产地协调规则》
乌拉圭回合一览子协议中的《原产地规则协议》规定,世界海关组织(WCO)框架下成立的原产地规则技术委员会负责制定协调非优惠原产地规则的技术性工作。在世界贸易组织框架下成立的原产地规则委员会负责审议技术委员会无法达成一致的疑难问题和政策性问题。从1995年开始至1999年2月,技术委员会共召开了18次会议,基本完成了技术级的工作。等WTO原产地规则委员会将尚余的未决问题解决后,由WTO部长级会议通过《非优惠原产地协调规则》(简称协调规则)的文本后,即对各成员国具有法律约束力。
国际协调是充分考虑在HS协调编码制度的框架结构的前提下,对乌拉圭回合贸易谈判形成的《原产地规则协议》进行细化,逐个商品讨论其在HS某一数级(如6位、8位数等)归类的改变是否构成实质性改变,以及必要时应参考附加的辅助标准的周密考虑后形成的。协调规则的基本框架结构主要由定义、总规则、主规则、补遗规则、附录一、附录二组成。
协调规则以“完全获得”和“实质性改变”作为原产地规则的基本标准,并规定“实质性改变”的判定标准应尽可能以国际通用的《商品名称及编码协调制度》目录中归类改变为基础,必要采用“从价百分比”标准时,必须列明计算这一百分率的方法;采用制造或加工工序标准时,必须准确地列明能授予有关产品原产地资格的制造或加工工序。
这里需要进一步说明的是,协调规则是建立在协调编码制度的基础上,二者是相互依存的关系。实质性改变的首选标准是税则归类的改变。协调制度发生改变,协调规则也要进行重新审议。
协调规则所附的“附录一”、“附录二”是判定货品原产地的标准。“附录一”确定了完全获得的货品的定义和适用范围,以及对某些微小加工或处理的限定。“附录二”是产品特定的原产地规则,其适用范围是指那些当按照“附录一”不能确定货品是在一个国家完成时,采用“附录二”规定的标准判定的货品。
协调规则至今仍未发生法律效力,而仍由协调项目工作组主持对核心政策问题进行磋商,到2004年7月为止,已经经过了4次修改。协调项目工作组的主席向相关成员国提交了涉及94项核心政策问题的一揽子建议。按照第4次修改的协调规则的规定,基于操作的原因,协调规则将于2007年正式生效。这表明协调规则工作组认为协调规则还将进行再次修改。
三、原产地规则协调化的前景分析
原产地规则应该有统一的、合理的标准已经成为各国的共识,但由于原产地规则关系到各国的重大利益和敏感利益,原产地规则的协调进程还有很长的一段路才能达到完美的境界。区域经济一体化的势头使原产地规则的协调分成了两条相互平行、相互作用的主线。一是在世界贸易组织主持下的非优惠原产地规则的全球性协调行动,另一条是各个区域经济集团内部的优惠性原产地规则协调行动。
关键词:商业判断规则 董事
经济学的意义上的公司是一种盈利主体,在追求利益最大化的同时,还需要承担经营失败的风险。而法律意义上的公司,在某些情况下,即使董事出于善意而且充分履行了注意义务,依然可能出现失误或是错误从而导致公司的损失。但是经济学上的经营管理失误并不会当然导致公司法上的失误。为了平衡公司利益和董事权利,美国法院通过长期的司法实践,逐步形成了“商业判断规则”,主要存在于判例法中,成文法并没有相关规定。通过商业判断规则区分法律上的经营过失责任和一般的经营失误。根据该规则,公司董事在作出一项商业决策时,要求其满足主观和客观的要求。即要求主观上出于善意,并且客观上依据其所获得的合理信息尽到了合理的注意义务,那么即使最后事实证明该董事的决策是错误的,董事可以依据商业判断规则而免于承担法律上的责任。商业判断规则是从本质上是将公司董事的责任加以限制,把责任限制在一个合理的范围内。
商业判断规则也被译为业务判断规则、经营判断规则,是美国判例法和公司法中的一个重要原则,是建立在董事尽到合理注意义务的前提下的规则,所以与董事的合理注意义务相联系。研究商业判断规则不仅仅对规范公司董事业务行为有积极的作用,对我国董事责任制度的完善,也有积极的意义。
商业判断规则包含以下两个方面的内容:
第一,董事在从事公司授权范围内的交易时,只要没有存在个人厉害关系,法院就不能因为董事在执行职务未达到应有标准而禁止或取消该交易,董事也不必承担因此而产生的损失。
第二,商业判断规则既是一种举证的分配机制,也是一种实体法上的规则。作为举证责任分配机制的商业判断规则,其存在的前提是假设董事作出决策时是出于主观善意,并且也尽到了合理的注意义务。因此,主张董事违反了勤勉义务时,原告需要证明董事的主观存在重大过失等非善意的因素。商业判断规则作为实体法上的规则时,董事在作出决策时符合善意且合理注意,即使事后证明了董事的行为是错误的,公司因此遭受的损失,但是董事不负赔偿责任。
商业判断规则需要以下几个的适用条件:
适用条件之一是要求有实施了经验判断的事实(A Business Decision)。因为商业判断规则只保护商业上的决策。根据商业判断规则的条件和标准,判断董事是否受到该原则的保护。不存在经营判断事项时,直接适用美国判例法或者是成文法上关于董事勤勉义务的法律规定,然后根据法律规定的标准来衡量董事是否尽到了合理的注意义务。
适用条件之二是董事和该经营判断没有任何利害关系(Disinterestedness)。董事对于公司应负有忠实义务和勤勉义务。忠实义务要求董事不得将其个人利益凌驾于公司的整体利益之上。因为,如果有权做出某事项董事和该决定直接存在着某些利害关系,就很难期待董事在这种情况下做出的决定是为了公司的最佳利益,而不存在任何私心,所以在有利害关系这种情况下,要排除商业判断规则的适用。
适用条件之三要求公司董事尽到了合理的注意(Due Care)。这是判断商业判断规则的先决条件中最核心的问题。合理注意是针对董事或者高管在做出决策前所做的准备工作,并不是针对商业决策本身。决策人需要在决策过程中做出怎样的行为,才能是符合当时的客观情况下的“合理注意”呢?有一般要求和程序要求两个方面。
合理注意的一般要求的内容是董事应当具有“普通谨慎之人,处于类似职位,并且在相似的环境中,能做到的注意”。这一标准要求公司董事在做出决策前,已经掌握了在类似情况下,作为一个普通谨慎之人认为应该掌握的所有重要信息。
注意义务在程序方面的要求是指公司董事在做出决策前,所进行的调查和咨询应符合该决策的要求,这是注意义务一般要求的逻辑延伸。法院在审理相关案件时,判断董事在决策前是否尽到“合理注意义务”主要通过董事的调查工作是否充分,当然充分与否的标准取决于具体决策的性质还有做出决策的时间判断。
适用条件之四要求公司董事在做出经营判断时出于善意(in good faith)。所谓善意是指:合理相信董事做出商业决策是为了公司的最佳利益。这是对董事主观善意的判断标准,也是其主观善意的内容。
总体来说,商业判断规则就是董事所作之决策与其本身不存在利害关系,是为了公司的最佳利益,并且为了该决策进行了与决策性质相适应的调查和咨询,满足以上几个条件,董事对该决策实施后带来的风险免除法律上的责任。但是商业判断规则本质仍是属于一种“可的假设”。即在一定的情况下可以排除商业判断规则在具体案件的适用。在适用商业判断规则之前,需要先审查董事的行为方式和决策过程,公司董事作出决策时未出于善意,或者是董事在客观上没有尽到合理的注意义务,或者对于董事与其所作决策存在利害关系并且因此作出了不符合公司利益的决定,原告一方对以上三种情况负有举证责任,从而排除商业判断规则的适用,使董事承担相应的赔偿责任,保护股东的利益。
关键词: 数据挖掘;负关联规则;相关系数; 最小兴趣度
中图分类号:TP 181
文献标志码:A文章编号:1672-8513(2011)04-0301-04
An Effective Method for Mining Negative Association Rules
ZHANG Yafen, WANG Xin
(School of Mathematics and Computer Science, Yunnan University of Nationalities, Kunming 650500, China)
Abstract: Negative association rules are always hidden in the huge infrequent items, but they also have strong correlation and contain important information. This paper presents an effective method based on the correlation and coefficient to estimate NAR and a proposal. The experiment results show that this algorithm is effective in improving the mining efficiency.
Key words: data mining; negative association rules; correlation coefficient; minimum interestingness
1 问题概述
传统的关联规则挖掘算法是依赖于支持度和置信度来挖掘的,它最初是由Agrawal 等于1993年提出来的[1-2],经典的Apriori算法也被同时提出.关联规则的任务就是挖掘出同时满足支持度和置信度最小阈值的规则.
下面来看一个例子[3-4],希望分析爱喝咖啡和爱喝茶的人之间的关系.收集一组人关于饮料偏爱的信息,并汇总在表1中.
根据表中所给的信息来评估关联规则:茶咖啡.根据传统的关联规则挖掘算法,通过计算支持度和置信度的方法除去无意义的规则.下面计算该条规则的支持度和置信度:
支持度s=喝茶同时喝咖啡的人数/总人数=150/1000=15%,置信度c=喝茶同时喝咖啡的人数/喝茶的人数=150/200=75%.发现该条规则的支持度和置信度都很高,似乎喜欢喝茶的人也喜欢喝咖啡.但是再仔细观察表中的数据可以发现,不管他是否喝茶,喝咖啡的人的比例为800/1000=80%,而喝咖啡的饮茶者却只占75%.这说明一个人如果喝茶,则他喝咖啡的可能性由80%下降到75%.从该实例中可以发现置信度的缺陷在于该度量忽略了规则后件中项集的支持度.更奇怪的是喝咖啡的饮茶者所占的比例75%实际少于所有喝咖啡的人所占的比例80%,这表明饮茶者和喝咖啡的人之间存在着一种逆关系,这也是种关联规则,只是它是一种负相关[4] ,称之为负关联规则,与之相对的传统关联规则即为正关联规则.
在上述实例中发现基于这种框架的关联规则挖掘存在一定的缺陷和局限性,在挖掘过程中,将会丢失许多有价值的信息,从而给决策者带来一定的误导.因此在挖掘过程中,需要重视负关联规则的挖掘.例如在购物篮分析中,负关联规则表明顾客购买某些商品有可能就不购买某些商品,这对决策者设计商店布局有一定的导向性;在投资、营销或者广告策划等诸多领域的决策过程中,负关联规则同样有着不容忽视的作用.
对于负关联规则的研究,最初是由Brin等在文献[5]中提出2个频繁项集间的负相关;Savasere 等在文献[6]中研究了强负关联规则问题;WU Xindong等[7]提出一种PR模型.之后许多学者研究关于负关联规则算法以及改进,如文献[8-9].本文提出了一种结合相关系数和最小兴趣度2个度量的负关联规则算法,其中相关系数用以识别关联规则是正规则还是负规则,比较方便简单,避免了对决策者的误导;最小兴趣度保证了所挖掘产生的负关联规则的有效性,避免了大量冗余的规则产生,给决策者带来一定的导向性.并且通过实验证明该算法是有效的.
2 负关联规则的相关知识
负关联规则指的是在2个项集之间的互斥或否定关系,其形如AB,AB,AB,其中A,B分别表示交易中不含有A,B.如在商场中A表示购买茶叶,B表示购买咖啡,则A表示不购买茶叶,B表示不购买咖啡,因此AB表示顾客购买茶叶则不会购买咖啡的相关规则,此即为一条负关联规则.下面给出负关联规则的相关定义,其中min_sup为最小支持度阈值,min_conf为最小置信度阈值:
算法中步骤2)通过计算相关系数,并且如果满足最小兴趣度的值,此时才产生规则,并且产生的规则是用户感兴趣的.包括①计算相关系数;②满足相关系数条件和最小兴趣度的值,输出形如AB,AB,AB的有趣的负关联规则;步骤3)返回结果INAR,结束整个算法.
5 实验
为了证明算法的有效性,考虑如表2所示的小型事务交易表[7],其中包括10条交易数据和6个项.表中TID表示每条交易的标识符号,分别用T1,T2,…,T10表示;表中的A,B,…,F等分别表示每条交易所包含的对象.若以购物篮事务为例,如A,B,D表示的是顾客购买的商品的集合.具体的实验是基于Matlab的仿真效果.一般设min_sup=0.2,min_conf=0.40.表3中列出了本文算法与经典的Apriori算法的实验结果进行比较.
从表3中可以发现,经典Apriori算法得到正关联规则数是24,但无法发现负关联规则的存在;而通过本文的算法可以直接得到负关联规则数,正关联规则在运行中不出现,从而节省了一定的存储空间.同时根据表中所显示的当min_interest取0和0.05时,负关联规则数由39减少到12,被删除的负关联规则数明显增多,这说明提高最小兴趣度能够减少一些无意义的规则出现,删除了一些无意义的负关联规则数目,使得剩余的规则数目减少了,便于用户从中选择有意义的规则,从而保证了挖掘出来的负关联规则是用户感兴趣的,提高了负关联规则的挖掘的效率,因此此算法是有效的.
6 结语
本文通过实例引出传统的关联规则挖掘算法在挖掘过程中存在的问题,将兴趣度和相关系数两者进行结合,从一定程度上减少了大量无趣的负关联规则的产生.但是此种方法在一定程度上还存在一定的局限性,后将作进一步完善.
参考文献:
[1]AGRAWAL R. Mining association rules between sets of items in large database[C]//Proceeding of the 1993 ACM SIGM OD International Conference on Management of Data. New York: ACM Press,1993:207-216.
[2]AGRAWAL R, SRIKANT R. Fast algorithms for mining association rules[C]//Proceeding of the 20th VLDB Conference. Santiago: Morgan Kaufmann,1994:487-499.
[3]CORNELIS C,YAN Peng,ZHANG Xing,et al.Minning postive and negative association rules from large databases[C]// 2006 IEEE Conference on CIS.Bangkol:IEEE,2006:613-618.
[4]TAN Pangning, STEINBACH M, KUMAR V.数据挖掘导论[M]. 范明,范宏建,译.北京:人民邮电出版社,2006.
[5]BRIN S,MOTWANI R,SILVERSTEIN C.Beyond market baskets:Generalizing association rules to correlations[C]// Processing of the ACM SIGMOD Conference. New York:ACM,1997:265-276.
[6]SAVASERE A,OMIECINSKI E,NAVATHE S.Mining for strong negative association in a large database of customer transation[C]//In:Proceedings of the 1998 International Conference on Data Engineering.Orlando:IEEE, 1998:494-502.
[7]WU Xindong,ZHANG C,ZHANG S.Mining both positive and negative associations rules[C]//Proceedings of the 19th ICML.New York:Springer Verlag,2002:658-665.
[8]张倩,王治和,张国治.基于相关系数的正、负关联规则挖掘算法[J].陕西理工学院学报,2005,21(4):35-38.
[9]董祥军,宋瀚涛,姜合.基于最小兴趣度的正、负关联规则挖掘[J].计算机工程与应用,2004,24(2):24-27.
[10]汪际和,陈平,王新.一种基于信息表的关联规则挖掘方法[J].云南民族大学学报:自然科学版,2010,19(6):432-434.
关键词: 贸易规则; 区域一体化; 诸边协定; 多边体系
DOI:10.13939/ki.zgsc.2015.05. 073
危机往往不可阻挡的扮演着国际新规则催化剂的角色。发端于2008年的全球金融危机在冲击世界经济的同时,也促使全球贸易的新规则不断的酝酿和发展,呈现了新的发展趋势和动向。整体上,国际贸易新规则正从几个方面逐步发展。第一,跨太平洋伙伴关系协定(Tans-Pacific Partnership,简称TPP)和跨大西洋贸易和投资伙伴协定(Tans-Atlantic Trade and Investment Partnership,简称TTIP)等区域经济一体化的发展很可能会在未来形成富有影响力的新规则和新体系;第二,世界贸易组织(World Trade Organization,简称WTO)框架体系内的诸边协定谈判会在具体领域形成新的规则和制度;第三,WTO多边贸易体系随着“巴厘协定”的达成,未来也可能会形成新的国际贸易规则。
一、TPP和TTIP等区域一体化的发展与贸易规则的变化
全球金融危机之后,新一轮区域经济一体化风起云涌,并且重点关注非关税壁垒的削减以及国际贸易新规则的构建。尤其是跨太平洋伙伴关系协定(TPP)和跨大西洋贸易和投资伙伴关系协定(TTIP)。
TPP是2010年正式发起、由美国主导的旨在进一步推动亚太地区经济自由化的高水平多边自由贸易安排,参与的国家目前有13个。2013年8月日本正式成为TPP的谈判成员,9月韩国宣布加入TPP谈判。TPP预计很可能会在2014年达成协定。根据TPP发展的规划,将在2015年之前实现13个成员的目标,即韩国加入TPP;而终极的目标是要建成亚太地区所有国家参与的高标准区域一体化安排。
TPP涵盖了亚太地区的12个重要国家,包括了主要的发达经济体和不少发展中国家。建成之后,将成为现有最大的自由贸易区或区域一体化组织。TPP成员的贸易总额约占世界贸易份额的25%以上,出口总额占世界份额的约23%,而进口总额占世界份额的约28%。TPP总体上占据了世界贸易的约1/4,这样的区域一体化组织对于全球贸易和经济的影响不言而喻。
TTIP是2013年2月13日由美国总统奥巴马、欧洲理事会主席范龙佩、以及欧盟委员会主席巴罗佐联合发起的自贸区安排。2013年3月12日,欧盟委员会通过了与美国进行自由贸易协定谈判的授权书,2013年6月14日欧盟各成员国通过了欧盟委员会开启TTIP谈判的决议。2013年7月8日~12日,美国和欧盟在华盛顿启动了TTIP的第一轮谈判,初步确定了谈判框架;截至目前已进行了七轮谈判。
TTIP如若建成,将是世界第一大超级自由贸易区。同时,美国和欧盟是世界最主要的服务贸易大国,双边相互投资额巨大,在服务贸易和相互投资上的合作空间很大。显然,TTIP对于世界经贸的影响将是巨大的。
TPP和TTIP关注的内容和议题反映了重建国际贸易规则的诉求。TPP涉及的议题包括知识产权保护、劳工标准、环境标准、促进中小企业发展、金融监管、竞争政策、国有企业条款、经济立法、市场透明、反贪等[3]。TTIP包括农业和工业产品市场准入、政府采购、投资、服务、能源和原材料、监管议题、知识产权、中小企业、国有企业等20项议题。这些议题主要关乎新的规则。正如TTIP谈判中的美欧联合申明所述:“通过谈判,美国与欧盟将不仅有机会促进大西洋两岸的贸易与投资,也可能会成为全球贸易规则的制定者和主导者,进而改变现有的多边贸易体系”,这充分说明了TTIP的目标在于重塑全球贸易新规则[2]。
近年来TPP和TTIP等主要区域一体化安排与以往相比具有差异,特点显著。第一,重点在非关税壁垒的削减和新规则、新制度的建设。无论是跨太平洋伙伴关系协定还是跨大西洋贸易和投资伙伴关系协定,都无一例外的关注非关税壁垒的减让和新规则的制定与事实。第二,似乎有意避开并游离于WTO体系之外。TPP和TTIP都是WTO体系之外的区域一体化安排。第三,以发达经济体为核心,撇开发展中经济体。TPP由美国主导,日本参与;TTIP由美国和欧盟共同主导和参与。第四,美国和发达经济体推动一体化的意愿高度强烈,发展进程“出乎意料”的迅速。无论是TPP还是TTIP,都设定了密集的谈判议程,预定达成协议的时间安排非常紧迫,反映了发达经济体的迫切心态。可见,区域一体化构建全球贸易新规则的主导和推动力量主要是美国和欧盟等发达国家。
TPP和TTIP已经囊括了大多数的发达经济体,如果建成了高标准的区域一体化组织,吸纳越来越多的国家参与,很容易形成事实上的全球主导型贸易规则,最终TPP和TTIP取代现有的WTO多边贸易体系而发挥作用,或者回到多边体系框架下成为名正言顺的全球贸易规则。无论何种发展结果,TPP和TTIP都是潜在的国际贸易新规则形成路径。
二、WTO框架下的诸边协定谈判与贸易规则的变化
WTO框架下的诸边谈判是在世贸组织框架下,部分成员采取自愿的方式参与的涉及具体领域的协定谈判。目前比较有影响的谈判主要有全球服务贸易协定(Trade in Service Agreement,简称TISA)、信息技术协定(Information and Technology Agreement,简称ITA)和政府采购协定(Government Procurement Agreement,简称GPA),分别体现了服务贸易、信息技术贸易和政府采购上国际贸易新规则的谈判和发展。
《全球服务贸易协定》(TISA)是世界贸易组织框架下的诸边谈判,美国和欧盟等国家认为20年前达成的《服务贸易总协定》(GATS)已经落后于时代,主张使用“负面清单”谈判模式推动达成更高标准的服务贸易协定。TISA阵营目前已有48个国家,覆盖了全球70%的服务贸易[2]。
《信息技术协定》(ITA)是世贸组织项下1997年生效的诸边协定,成员涵盖全球97%的IT产品出口,旨在分阶段将信息技术产品的关税削减至零。中国在加入WTO谈判中承诺加入协定,并成为成员。
《政府采购协议》(GPA)是世界贸易组织(WTO)框架下的一项诸边协议,目标是促进成员方开放政府采购市场,扩大国际贸易。GPA由WTO成员自愿签署,目前有美国、欧盟等14个参加方,共41个国家和地区签署了协议。
WTO框架内的诸边协定谈判基于自愿的基础,并且主要包括的都是利益攸关方,部分成员参与的谈判不仅更加容易达成协定,同时参与的成员本身就说明存在参与协定的愿望。由此,WTO框架内的诸边协定谈判将比多边谈判容易的多。从目前进展看,信息技术协定和政府采购协定已经达成,全球服务贸易协定仍在谈判中,中国2013年已经宣布参与全球服务贸易谈判。
诸边协定谈判同样主要由发达经济体主导,在世贸组织的多边体系框架内开展谈判,并且通常主要聚焦某一个领域,一旦协定达成,将会形成在某些特定领域新的国际贸易规则。如TISA谈判一旦达成,由于汇聚了主要的服务贸易大国,将会形成服务贸易新的规则,成为事实上的主要通行规则,未来很容易上升为全球性的国际贸易规则。因而,WTO框架内的诸边协定谈判同样是重要的全球规则变动主要路径之一。
三、后巴厘时代的多边贸易体系与贸易规则的变化
WTO多边贸易谈判一直是国际贸易新规则和新体制形成的主要机制。但世贸组织新一轮的多哈回合历经10多年的谈判一直毫无结果,发达国家成员和发展中国家成员很难在一些核心议题上达成一致。但随着区域经济一体化发展形成的压力,推动多哈回合在2013年底达成了“巴厘一揽子协定”,宣告了多边体系下仍然可以达成协议,具有重要意义。
从“巴厘协定”的内容看,主要包括贸易便利化、给发展中国家在粮食安全上更多选择权、协助欠发达国家发展贸易等三个方面。这些内容具有重要的价值和意义,贸易便利化有利于降低贸易成本,促进贸易发展,尤其有利于全球价值链贸易的发展。但“巴厘协定”的内容仍然没有涉及贸易一体化和自由化的核心议题,没有涉及非关税减让,没有形成核心的国际贸易规则。可以说,在国际贸易规则的形成上,基本没有实质的推动和贡献。
“巴厘协定”对新贸易规则的意义主要在于:第一,增强了未来在多边框架下谈判贸易规则和贸易自由化的信心,具有重要的象征意义;第二,贸易便利化是贸易自由化的一方面,在贸易便利化上形成的规则和措施,同样也是国际贸易规则的一部分;第三,“巴厘协定”为后巴厘时代的贸易规则谈判提供了榜样和效仿效应,有利于未来的谈判。
总体上,多边体系下的国际贸易新规则谈判并不容易,遇到的问题和困难很多,预计很难有较大的进展。
四、全球贸易规则变化的新动向
全球贸易新规则形成的三种路径选择中,正倚赖和快速发展的是区域一体化实现路径和WTO框架下的诸边协定路径,但“巴厘协定”似乎点亮了WTO多边框架的“星星之火”。目前,国际贸易新规则的发展呈现了新的动向,TPP可能会在不远的未来可以达成协定,WTO体系下的诸边谈判达成的可能性很大,发达国家似乎希望形成WTO体系内外相互补充的规则体系,未来TPP等区域一体化可能会纳入WTO体系。
(一)TPP谈判已经进入最后阶段,可能年内达成
TPP原定计划在2013年底完成谈判,但由于各位诉求的差异未能达成。但预计,TPP能够在不远的未来很可能会达成协定,初步建成一个高标准的区域一体化组织。TTIP目前已经进行了七轮谈判,从目前的进展看,双方达成协议的意愿较强,但谈判中存在的矛盾很多,预计短期内较难达成。
(二)诸边协定谈判成功的概率较高
WTO框架内的诸边协定谈判基于自愿的基础,并且主要包括的都是相关利益攸关方,部分成员参与的谈判不仅更加容易达成协定,同时参与的成员本身就说明存在参与协定的愿望。由此,WTO框架内的诸边协定谈判将比多边谈判容易的多。
从目前进展看,信息技术协定和政府采购协定已经达成,全球服务贸易协定仍在谈判中。预计诸边协定谈判都能够在不远的未来达成协议。
(三)WTO后巴厘时代的多边体系较难推动贸易新规则的发展
“巴厘协定”证明了多哈回合的多边体系是可以达成新的协议和新的规则,但从2013年底达成的“巴厘一揽子协定”的内容看,主要包括贸易便利化、给发展中国家在粮食安全上更多选择权、协助欠发达国家发展贸易等三个方面。这些内容虽然具有着重要的价值和意义,但还没有触及国际贸易新规则的主体,也没有体现发达经济体和发展中经济体的核心诉求与期望。虽然多数成员国,尤其是发展中经济体都希望推动WTO多边协定并借以重塑全球贸易规则,但心有余而力不足。WTO多边体系似乎较难在国际贸易新规则上取得突破和发展。
事实上,TPP和TTIP等区域一体化的发展有利于倒逼WTO多边体系的推进。WTO巴厘一揽子协定的达成,很大程度上是发展中经济体受到了区域一体化发展的压力,希望回归WTO谈判促进贸易自由化发展而形成的结果。因而,后巴厘时代的多边体系也可能有在区域一体化的压力下推动发展全球贸易新规则。
(四)发达国家或希望形成WTO体系内外相互补充的规则体系
全球贸易新规则的发展和推进途径显示了WTO体系内外相互补充和强化的特点。体系内的诸边协定谈判和体系外的区域一体化谈判相互补充,诸边协定主要关注具体领域而区域一体化关注整体方面,相互补充且里应外合推行新的全球贸易规则。
(五)未来区域一体化的发展可能会纳入WTO议题
近期以来,不少的研究倡议将区域一体化的发展纳入WTO议题,在WTO体系中讨论区域一体化,并促成与多边体系的协调发展,同时提高区域一体化发展的信息共享和透明度。这一新的趋势意味着,未来通过TPP和TTIP等区域一体化建立的贸易新规则很可能会回到多边体系框架内,逐步形成多边的全球贸易规则。
五、对中国的影响及应对策略
中国是全球第二大经济体,第一大贸易国,全球贸易规则的变动对中国的潜在影响毋庸置疑。整体上的影响是“有近忧而无远虑”;即虽然在短期内会带来负面冲击,但长远与中国的利益诉求一致。
(一)对中国的影响
短期内的冲击和影响主要包括以下四个方面。
第一,TPP和TTIP等区域一体化的发展会冲击中国的出口贸易和对外投资。美国的重要贸易伙伴是美国和欧盟,而两国都在TPP或TTIP的体系内。
第二,新规则的形成将迫使中国等新兴市场国家进一步开放市场,而一步到位的市场开放对中国经济的短期冲击是无法避免的。
第三,会削弱中国等新兴经济体的影响力和话语权。发达经济体重建全球贸易规则的行动安排中,中国等发展中经济体基本没有参与或者被排除在外。
第四,中国基本被排除在新贸易规则的形成体系之外,很难在新规则形成中提出自己的诉求,不利于贸易的发展。但中长期之内,发达国家倡导全球贸易新规则的主要目的是要推动全球贸易自由化的发展,开放更多的市场,这也是符合中国利益的。故而长期内与中国的利益一致,并不需要过分担忧。
(二)应对策略
中国的应对策略上,面对美国重塑全球贸易规则的发展,应有的选择包括以下五个方面。
第一,密切关注全球贸易规则的发展动向。掌握最新的进展并准确评估可能存在的影响效应,及时根据发展动向制定相应的对策策略。
第二,积极参与全球贸易规则的重建。参与的方式包括加入这些新的区域、诸边和多边协定的谈判中。积极参与的好处包括:首先,及时了解和影响新规则的制定朝着有利于中国的方向发展;其次,早参与比晚加入能够获得先发优势;再次,以开放促进国内的改革;最后,实践证明,进一步开放市场可能对中国更加有利。
第三,强化中国在WTO体系中的作用。WTO体系具有无法替代的优势,贸易新规则最终预计都需要回归或者上升到WTO的多边体系中,才能够成为全球规则。增强在WTO体系中的话语权对中国来说非常重要。中国也应该积极倡导在WTO多边体系中推动全球贸易新规则。
第四,中国也应积极主导和推动全球贸易规则发展。中国作为全球第一大贸易国,也应该积极主导和推动全球贸易规则,制定有利于中国贸易发展的规则体系。
第五,团结和凝聚其他发展中大国,集体行动影响全球贸易规则的形成,努力构建有利于中国和发展中国家利益的全球贸易和投资规则,促进多边贸易体系的指针朝着发展中国家的方向偏移。
参考文献:
[1] 陈淑梅,全毅. TPP、RCEP谈判与亚太经济一体化进程 [J]. 亚太经济,2013(2).
[2] 巩胜利. 21世纪:美国新战略“三大”规则 [J]. 国际金融,2013(5).
[3]李春顶,夏枫林.中美需求结构比较与中国未来的需求结构优化[J] .中国市场,2014(3).
[4]李春顶,夏枫林.需求结构对宏观调控的影响及中国政策抉择[J] .中国市场,2014(7).
[5]李春顶, 赵美英,彭冠军.美国三大需求结构演变及其对中国的启示[J] .中国市场,2014(19).