时间:2022-03-07 04:40:21
引言:易发表网凭借丰富的文秘实践,为您精心挑选了九篇大数据平台解决方案范例。如需获取更多原创内容,可随时联系我们的客服老师。
EMC Isilon:横向扩展 性能突出
大数据存储不是一类单独的产品,它有很多实现方式。EMC Isilon存储事业部总经理杨兰江概括说,大数据存储应该具有以下一些特性:海量数据存储能力,可轻松管理PB级乃至数十PB的存储容量;具有全局命名空间,所有应用可以看到统一的文件系统视图;支持标准接口,应用无需修改可直接运行,并提供API接口进行面向对象的管理;读写性能优异,聚合带宽高达数GB乃至数十GB;易于管理维护,无需中断业务即可轻松实现动态扩展;基于开放架构,可以运行于任何开放架构的硬件之上;具有多级数据冗余,支持硬件与软件冗余保护,数据具有高可靠性;采用多级存储备份,可灵活支持SSD、SAS、SATA和磁带库的统一管理。
通过与中国用户的接触,杨兰江认为,当前中国用户最迫切需要了解的是大数据存储有哪些分类,而在大数据应用方面面临的最大障碍就是如何在众多平台中找到适合自己的解决方案。
EMC针对不同的应用需求可以提供不同的解决方案:对于能源、媒体、生命科学、医疗影像、GIS、视频监控、HPC应用、某些归档应用等,EMC会首推以Isilon存储为核心的大数据存储解决方案;对于虚拟化以及具有很多小文件的应用,EMC将首推以VNX、XtremIO为核心的大数据存储解决方案;对于大数据分析一类的应用需求,EMC会综合考虑客户的具体需求,推荐Pivotal、Isilon等一体化的解决方案。在此,具体介绍一下EMC用于大数据的横向扩展NAS解决方案——EMC Isilon,其设计目标是简化对大数据存储基础架构的管理,为大数据提供灵活的可扩展平台,进一步提高大数据存储的效率,降低成本。
EMC Isilon存储解决方案主要包括三部分:EMC Isilon平台节点和加速器,可从单个文件系统进行大数据存储,从而服务于 I/O 密集型应用程序、存储和近线归档;EMC Isilon基础架构软件是一个强大的工具,可帮助用户在大数据环境中保护数据、控制成本并优化存储资源和系统性能;EMC Isilon OneFS操作系统可在集群中跨节点智能地整合文件系统、卷管理器和数据保护功能。
杨兰江表示,企业用户选择EMC Isilon的理由可以归纳为以下几点。第一,简化管理,增强易用性。与传统NAS相比,无论未来存储容量、性能增加到何种程度,EMC Isilon的安装、管理和扩展都会保持其简单性。第二,强大的可扩展性。EMC Isilon可以满足非结构化数据的存储和分析需求,单个文件系统和卷中每个集群的容量为18TB~15PB。第三,更高的处理效率,更低的成本。EMC Isilon在单个共享存储池中的利用率超过80%,而EMC Isilon SmartPools软件可进一步优化资源,提供自动存储分层,保证存储的高性能、经济性。第四,灵活的互操作性。EMC Isilon支持众多行业标准,简化工作流。它还提供了API可以向客户和ISV提供OneFS控制接口,提供Isilon集群的自动化、协调和资源调配能力。
EMC Isilon大数据存储解决方案已经在医疗、制造、高校和科研机构中有了许多成功应用。
方案点评
EMC Isilon是一个强大但简单的横向扩展NAS方案,适用于希望投资数据管理而不是单纯存储的企业。当初,EMC将收购来的分布式数据仓库软件厂商Greenplum的软件与Isilon存储组合成了EMC最早的大数据解决方案。用户既可以分开选择Greenplum软件或Isilon存储,也可以选择由Greenplum软件和Isilon存储组成的一体机解决方案。现在,Greenplum软件虽然已归Pivotal公司,但EMC是Pivotal的经销商与合作伙伴,Greenplum与Isilon存储的组合方案并不会因此受到影响。
HDS UCP:统一平台 应用优化
HDS中国区解决方案与专业服务事业部总监陈戈认为,大数据存储应该是一个解决方案:“大数据解决方案是由基础架构的各部件组成的,包含数据存储、计算和分析,而存储是此架构中的一部分。”
大数据的存储类型与传统的存储类型有一定区别:在大数据存储中,更多的应用是一次写、多次读,读得更多是大数据存储的一个特点,而在传统的数据存储中,读写是随机的,由于每个应用不同,其读写的比例也是随机的;大数据存储需要具有横向的可扩展性,并可支持多种接口、多种数据访问协议,便于不同数据进入这个大数据平台。
谈到中国用户在大数据存储应用中最迫切的需求是什么,陈戈认为,中国用户最迫切的需求是如何逐步实现大数据应用,即用户从现有的模式如何过渡到大数据,如何更好地利用大数据进行经营分析。
大数据的经典定义可以归纳为四个“V”,但企业不可能一步到位实现四个“V”,这需要一个循序渐进的过程。海量的、多种类型的数据是一次性全部载入到大数据中,还是通过现有的平台进行数据初选,再导入到大数据平台中,是两种不同的实现途径。“先通过现有平台进行数据初选,再导入到大数据平台,这种方式更适合于客户逐渐实现大数据,可以缩短用户实现大数据应用的时间。”陈戈表示,“大数据主要是非结构化数据。用户可以使用基于对象数据存储的HCP,利用其独特的元数据采集和智能工具,对非结构化文件数据进行管理,实现智能的自动化,这有助于对数据进行深度分析,帮助客户从单一系统中存储、共享、同步、保护、保存、分析和检索文件数据,减少垃圾数据,进而为大数据分析建立一个良好的基础。”
谈到用户在大数据应用中遇到的主要障碍,陈戈表示,一方面,应用软件本身的智能程度是否能满足行业应用需求,应用软件是否已经成型,大数据人才是否具备等,是让大数据应用落地的关键;另一方面,如何抽取数据,放在大数据平台中进行相应的计算是另一个关键问题。
HDS可为所有数据提供单一、可扩展的虚拟化集成平台。HDS推出了“三步”云战略,从基础架构、内容和信息三个层面帮助客户解决目前所遇到的问题。具体来看,通过“基础架构云”,HDS可以帮助客户进行虚拟化和集成管理,实现数据中心的整合;在第二层的“内容云”当中,HDS可以按需提供内容,更可以不受应用限制地进行数据搜索和集成;在第三层的“信息云”中,针对所有数据类型,HDS在其存储平台中融入了分析功能,使客户可以从数据信息中获取洞察力。
HDS提供的UCP for SAP HANA集成了基于大量数据集的创新和内存分析技术,并提供实时的洞察力,从而使当前的信息驱动型企业可以加快其商业决策的速度。陈戈介绍说,UCP for SAP HANA解决方案结合了HDS刀片服务器技术、企业级存储系统和业内领先的网络组件,在这样一个集成的、高性能的硬件平台上可以快速交付SAP下一代内存计算技术。全球已有超过200家客户在使用HDS和SAP的大数据解决方案。
方案点评
其实,HDS的“三步”云战略也可以看成是其大数据战略。HDS借助以UCP为核心的大数据平台,可以帮助企业用户构建从基础架构到内容归档和搜索,直至信息提取和分析的全面、高效的大数据解决方案。HDS的“信息云”直接与大数据相关。UCP是一个集成了计算、存储与网络的一体化平台,它既可以提供像一体机一样的整合性、简单性,又可以提供灵活的选择,连接第三方的设备组件。HDS还通过与包括SAP在内的众多大数据分析类的合作伙伴合作,针对行业定制优质的大数据解决方案。
HP StoreAll :快速部署 极速搜索
中国惠普有限公司企业集团存储产品部存储架构师张楠向记者表示,大数据存储是一套解决方案,应该能够对大数据的Volume、Velocity、Variety和Value四个方面提供全面的支持。
第一,大数据存储要支持海量级的数据存储,比如具有PB级的存储能力。第二,大数据存储要支持更高的存储速度,支持10Gb甚至更高的网络连接。第三,大数据存储要支持数据的多样性,如图片、文本、视频、音频等。第四,大数据最重要的是价值的体现,而为了实现这一点,存储本身应该具备快速、智能的数据检索能力。“在存储的最底层提供最直接、快捷的数据检索。这一过程简单说就是,将上层的数据挖掘工作下移,充分利用存储强大的处理能力和数据识别能力。”张楠举例说,“比如,在秒级的单位内对数据进行极速的搜索, 从几千万甚至上亿个文件中找到目标数据。”
另外,模糊查询能力也是大数据存储不可缺少的功能。智能的模糊查询将为大数据平台提供更加便捷的存储服务能力,使得存储更像一台智能的高速计算设备。
目前,很多中国用户在存储厂商的引导下,片面追求存储的大容量和高性能,而忽略了大数据存储本身应该提供的其他额外属性。中国用户在实施大数据的过程中经常遇到的障碍有以下两方面:第一,无法将存储与大数据平台进行对接;第二,无法充分利用大数据存储的价值,也很难将其运用到实际的业务中。张楠表示,究其原因,主要在于有些大数据存储产品没有开放的接口协议,或没有针对用户的大数据场景进行特别优化,也没有用户容易接受的易用的管理方式等。
惠普在大数据方面可以提供软硬结合的解决方案。惠普在收购Autonomy公司之后,将其软件与惠普的硬件平台进行了整合, 形成了一套完整的大数据解决方案。张楠介绍说,在存储方面,惠普拥有像StoreAll这样的大数据存储平台。借助HP StoreAll硬件平台,用户除了可以实现海量数据的存储和高速数据访问以外,还能实现高级的数据检索功能,对特殊文件进行快速定位。同时,结合HP Autonomy软件的特性,惠普还引入了模糊查询、智能语义库等概念,可以帮助企业用户通过存储底层为上层业务带来所需的大数据业务价值。
如今,闪存不仅在大数据领域,而且在Tier 1存储市场同样占据着十分重要的地位。对于大数据平台来说,闪存可用来提升存储的存取速度,降低I/O的响应时间等。针对那些I/O压力十分明确的大数据平台, SSD可以发挥其效果, 提升存储的整体性能。但是,SSD并不是万能的。因为大部分的数据都是非结构化的,而非结构化数据对I/O的响应要求远远没有对带宽的需求大,所以,让用户花数倍的价格购买SSD存储在目前来看还是比较困难的。从目前情况看,引入闪存的大数据解决方案还不是很普遍。
方案点评
惠普在大数据方面收购了两个软件公司Vertica与Autonomy,然后将它们的软件与原有的硬件平台进行整合,针对结构化和非结构化的数据都可以提供针对性的解决方案。惠普在将大数据软件与存储硬件结合上也进行了尝试,其中一个成功的例子就是HP StoreAll大数据存储平台。HP StoreAll具有以下特点:横向扩展,最大可以扩展到16TB;集成HP Autonomy搜索引擎,可以快速搜索,实现实时大数据的价值;内置对OpenStack的支持,可快速部署;支持文件和对象类型的数据存储。
NetApp:统一架构 无限扩展
如今,企业若想获得成功,就必须想方设法应对具有前所未有的复杂性、高性能的海量数据,并尽可能地管理这些数据,从中发掘更大的商业价值。
对于国内用户来说,无论企业的规模和数据量大小如何,运用大数据的关键在于,企业是否把大数据作为一个真正的工具,去体现企业的差异化,从而提升竞争力。随着越来越智慧的企业信息化的发展,IT不再是束缚企业发展的瓶颈,而是真正地融入了企业自身的业务中。越来越多的公司将大数据成功地运用于企业的商业模式。例如,在欧美,很多企业已经着手将大量资源投放在大数据领域。反观国内,在金融领域,有为数不少的企业通过大数据的分析工具来分析金融的走势,实现风险管理,进行信用卡的追踪等。此外,像零售、制造、电信等行业也已在尝试利用大数据分析工具为企业营销和决策提供支撑。
无论企业现在是否正在使用大数据工具,企业都应全面地考虑自身未来发展的需求,选择一个厂家的平台与之共同发展,这可以有效避免因数据和应用迁移带来的麻烦。
在大数据方面,NetApp能够帮助企业实现数据管理,应对业务挑战的极限,将以数据为导向的洞察转化为有效行动。若想将数据转化为商机,仅仅提升管理能力是不够的,需要彻底转变数据和业务之间的联系模式。NetApp可以帮助企业用户持续管理数据,迅速把握意料之外的新商机,永久保存所有数据,并在灵活、开放的存储平台之上打造属于企业自己的大数据解决方案。
NetApp提供了可高效处理、分析、管理和访问大规模数据的大数据解决方案。NetApp的解决方案组合可划分为分析、带宽和内容三个主要用例,这被称之为大数据的“ABC”基本要素。
具体来看,分析(Analysis)是指针对极大数据集的高效分析。NetApp分析解决方案就是帮助用户深入了解和利用数字世界,将数据转化为高质量的信息,以及提供关于业务的更深入见解,从而帮助企业做出更好的决策。
带宽(Bandwidth)是指适用于数据密集型工作负载的性能。此类解决方案着重于为速度非常快的工作负载提供更高的性能。高带宽应用包括高性能计算(能以极快的速度执行复杂的分析)、用于监控和任务规划的高性能视频流、媒体和娱乐领域中的视频剪辑和播放。
内容(Content)是指无限的安全数据存储。此类解决方案着重于满足可扩展的安全数据存储需求。内容解决方案必须支持存储的无限扩展能力,以便企业可以根据需要存储任意多的数据,并能在需要时找到所需的数据。
NetApp致力于通过一系列解决方案来提供高性能的运算和大数据的应用。2013年11月,NetApp再次更新了E系列家族产品,推出E2700和E5500。该系列产品采用可轻松扩展的设计,适用于要求99.999%的可靠性且稳定、高性能的工作负载。
用户在采购大数据存储产品时,需要注意以下五个方面的问题:大数据存储必须具有向上扩展与向外扩展的能力;架构必须是针对工作负载进行优化的,具有实时处理能力;具有整合的数据保护功能;保证7×24小时运行不中断,可在线进行容量扩展,实施数据迁移等;可以实现服务的自动化。
方案点评
NetApp的技术优势集中体现在其统一存储平台上,从入门级产品到企业级产品,全部基于同一个体系架构和操作系统,不仅部署和使用方便,而且升级和扩展非常简单。当初,NetApp收购LSI Engenio,其中一个重要的原因就是为了大数据。2013年,NetApp不断更新E系列产品线,推出E2700和E5500等。E5500可以支持高IOPS混合工作负载和数据库、高性能文件系统和带宽密集型流等应用,可确保数据的高可用性、完整性和安全性。
曙光XData:高度集成 贴近行业
关于大数据存储,目前业界没有一个通用的定义。曙光信息产业股份有限公司总裁助理兼存储产品线产品总监惠润海从曙光大数据平台和解决方案角度,概括出大数据存储的主要特征。
首先,大数据存储必须支持全类型数据, 包括结构化、半结构化和非结构数据,实现统一数据支持。
其次,存储性能上,一方面,大数据存储要支持海量数据,并且要在保证数据可靠性的基础之上,实现容量与性能的线性扩展;另一方面,为了实现大数据的价值,批处理和实时处理两种措施都需要高性能的数据访问获取能力。
最后,在系统达到一定规模之后,系统的易用性和可管理性也是不可或缺的。
从应用角度来说,目前中国用户在大数据存储应用中最迫切的需求,是如何真正实现用户数据的价值,如何驱动业务发展,实现决策和运营。“从系统构建层面说,要实现数据高性价比的存储和管理,同时满足数据服务的相关需求。”惠润海表示。
针对用户对大数据存储的需求, 曙光推出了像大数据一体机这样的全类型数据分析型产品,同时还基于该产品构建了基于行业的解决方案,以帮助用户实现大数据落地。
“除此之外, 我们还提供了大数据统一数据中心解决方案, 涵盖了像主攻事物处理的DS900、DS800,以及针对文件存储的Parastor等存储产品。我们基于这些存储产品构建了大数据运营管理平台。”惠润海介绍说,“曙光的优势不仅在于可以提供全面的产品支撑,更重要的是能够提供数据生命周期过程服务支持。目前,我们提供的免费维保期限为5年。”
曙光开发了针对不同行业和应用场景的大数据存储解决方案。以金融行业为例,目前国内四大行的应用系统每年产生的非结构化数据量已达到PB级,结构化数据也以百TB计。面对如此大量的数据,如何存储、管理、利用和盘活它们呢?惠润海认为,只有通过商业智能和高级分析应用解决方案才能将数据的价值最大程度地发挥出来。
针对金融行业用户的需求,曙光开发的XData大数据解决方案利用优化的大数据处理技术,对文件管理、历史数据查询和数据分析类应用等进行深入研究,为数据爆炸式增长带来的海量数据存储及分析应用提供高可靠的解决方案。
曙光金融行业XData大数据解决方案采用曙光自主研发的SN-MPP并行数据库,同时结合大数据处理事实标准Hadoop,并充分考虑了多方面的数据收集,加入ETL工具和连接驱动器,提供了类SQL的接口,还和现有金融业务系统进行对接。
针对金融行业历史数据,XData大数据解决方案在方案设计上主要考虑了数据的安全性、历史数据高效导入、快速访问与分析报表。曙光金融行业大数据解决方案立足于基础平台建设,同时切实贴合金融行业用户需求,提供了优质的软硬一体化解决方案,为用户一揽子解决了部署、业务移植开发等技术难题,帮助用户跨过应用门槛。
满足用户的个性化需求
中桥咨询的一份大数据调查报告显示,大部分中国用户还处于“系统整合”阶段,需要对来自企业内外部的大量数据进行收集和整理。
“为什么现在用户对大数据解决方案求贤若渴?”高国辉自问自答,“因为传统的技术和解决方案已经无法解决用户当前遇到的诸多应用难题,比如实时交易数据的处理和分析等。金融行业提出‘小核心、大’,电信运营商积极构建双活的数据中心都是从各自的实际需求出发,以应对大数据带来的新挑战。美国的某电信运营商就采用戴尔的SharePlex技术构建了双活的数据中心。”
其实,无论企业的数据量有多大,数据是结构化还是非结构化,戴尔都可以提供具有针对性的解决方案。Spansion是一家知名的制造企业,它希望通过升级现有的数据库来更好地支持其关键统计流程,从而达到提升业绩的目标。为此,它采用了戴尔的SharePlex技术对原有的Oracle数据库进行升级,不仅安全地完成了数据库的迁移,而且节省了大量资金。
“诸如此类的例子还有许多。”高国辉介绍说,“不同的用户,在大数据方面的需求不同,而且对价格的敏感度不同,这就决定了用户在选择大数据解决方案时有其‘个性化’的需求。比如,许多互联网企业十分热衷采用基于Hadoop的解决方案,就是考虑到经济性的问题。戴尔的优势就在于,可以为不同的用户提供适合其需求的大数据解决方案。”
戴尔软件事业部已成为戴尔企业级端到端解决方案的核心组成部分。具体到软件解决方案本身,戴尔也强调端到端,比如戴尔软件可以提供从移动办公管理到信息数据管理再到数据中心和云计算的全面软件解决方案。其中,信息数据管理软件就与大数据直接相关,它包括数据库管理、应用系统及数据集成,以及大数据分析等产品。
全面的软件解决方案
上文提到的SharePlex以及Boomi等就是用户比较喜欢的戴尔软件产品。高国辉举例说,无论是结构化数据还是非结构化数据,无论数据在本地还是云端,通过Booming都可以实现整合和统一管理。“在大数据方面,我们强调的是如何帮助客户实现简化。比如,通过戴尔Toad软件,可以连接不同类型的数据库,借助Boomi还可以将本地的数据库与云中的数据相结合,然后通过戴尔的商业智能套件进行分析和展示,甚至还可以基于戴尔Kitenga软件进行深度数据挖掘。”高国辉补充说。
Dell XPS One 2710 创新产品奖
HP Z1工作站 影响力产品奖
联想ThinkStation D30 创新产品奖
联想 ThinkServer RD630 服务器 最具竞争力产品奖
联想 ThinkCentre M9201z 商用一体台式机 创新产品奖
联想 昭阳K29商用笔记本电脑 最具竞争力产品奖
联想 ThinkCentre M4350q 商用台式机 创新产品奖
IBM Power750 最具竞争力产品奖
IBM zEnterprise114 影响力产品奖
IBM System x3650 M4 创新产品奖
IBM PureFlex System 最具竞争力产品奖
HP Proliant BL660C Gen8服务器 创新产品奖
Dell PowerEdge M620 创新产品奖
华为E9000服务器 创新产品奖
曙光TC4600刀片服务器 年度影响力产品
曙光CloudVIEW操作系统 优秀云计算产品
天作 e-Cube 年度优秀多功能服务器
网络存储
华为OceanStor N8500集群NAS 创新产品奖
Dell Compellent FS8600 NAS 创新产品奖
爱数TxCloud一体化备份容灾云柜 创新产品奖
HP 3PAR StoreServ 7000 创新产品奖
Hitachi UCP融合基础架构解决方案 最佳云计算管理平台
NetApp Data ONTAP 8.1 创新产品奖
IBM Storwize V3700 创新产品奖
融合网络
华为CloudEngine 12800系列高性能核心交换机 最具竞争力产品奖
华为eSpace U29XX系列统一网关 最具竞争力产品奖
华为全景智真TP3206 最具竞争力产品奖
H3C新一代数据中心解决方案 年度最具创新解决方案奖
H3C CR16000 核心路由器 最具竞争力产品奖
华信联创波迅?誖BXO2050n-2室外智能基站 年度最具创新无线网络产品
华信联创波迅?誖BXI智能基站应急通信解决方案 年度最具创新无线通信解决方案
迈普Imedia智能传媒解决方案 年度影响力方案
帝联科技ACA全内容加速解决方案 年度影响力方案
泛达物理层基础设施解决方案 年度影响力方案
西蒙绿色数据中心布线解决方案 年度影响力方案
康普imVision解决方案 年度创新产品奖
TE安普布线MPOptimate光纤布线系统 年度影响力方案
Compuware APM应用性能管理整体解决方案 年度最佳IT管理解决方案
摩托罗拉模块化AP 8132无线接入点 创新产品奖
机房设施
艾默生网络能源APL系列UPS 创新产品奖
台达Ultron EH系列UPS 创新产品奖
施耐德StruxureWare数据中心管理平台 创新产品奖
威图TS IT机柜 创新产品奖
计算平台
第三代智能英特尔酷睿博锐处理器家族 最佳商用管理技术奖
英特尔至强处理器E5-2600产品家族 最佳计算基础设施奖
AMD皓龙TM 6300系列服务器处理器 最具竞争力产品奖
打印设备
理光Aficio MP C3002 GWNX炫睿系列A3数码复合机 年度影响力产品奖
理光MDS文档管理服务 年度影响力方案奖
OKI C530dn A4彩色LED打印机 最具竞争力产品奖
HP Hotspot LaserJet Pro M1218nfs MFP多功能激光一体机 创新产品奖
爱普生WF-7521 A3+彩色商务复印一体机 最具竞争力产品奖
富士施乐DocuCentre S1810黑白一体机 影响力产品奖
富士施乐文件管理解决方案 影响力方案奖
佳能iC MF5930dn黑白激光多功能一体机 最佳应用奖
佳能腾彩PIXMA PRO-1 EOS影像级专业喷墨照片打印机 影响力产品奖
航天信息Aisino SK-820II财税高清票据打印机 影响力产品奖
富士通DPK750窄行票据打印机 最佳应用奖
软件
微软Windows 8 年度最具创新产品奖
天作e-HR管理软件 年度优秀HR软件奖
IBM智慧商务解决方案 年度行业创新方案奖
IBM社交商务解决方案 年度最佳企业级协同应用方案奖
IBM智慧城市之镇江案例 年度最佳智慧城市案例奖
IBM BigInsights 创新产品奖
IBM SPSS 最佳应用奖
IBM移动开发平台 最佳应用奖
文雅科SVF Essential Suite 年度最具创新产品奖
金蝶政务信息资源共享交换平台 影响力方案奖
北京航星永志档案信息化管理平台 年度影响力产品奖
Aspect Workforce Optimization 年度最佳应用解决方案奖
航天信息税务会计软件 年度创新产品
航天信息食品药品安全监管系统 年度影响力方案
达梦DM7.0 年度创新产品
盈世 iCoremail 年度最佳应用产品
用友NC6大型企业管理与电子商务平台 年度创新产品
信息安全
安恒明御运维审计与风险控制系统 影响力产品奖
深信服下一代防火墙(NGAF) 创新产品奖
东软NetEye下一代应用防火墙 创新产品奖
Blue Coat ProxySG Web安全网关 影响力产品奖
信安世纪NetOpti应用安全交付网关 创新产品奖
网御星云Power V6000系列万兆UTM安全网关 影响力产品奖
山石网科SG-6000-M8860安全网关 创新产品奖
启明星辰天清无线安全引擎 最佳无线安全产品奖
金山私有云安全平台 影响力方案奖
Websense DLP解决方案 影响力方案奖
北信源存储介质信息消除系统 创新产品奖
360杀毒软件 影响力产品奖
外设
华为eSpace AT系列绿色坐席终端 最具创新产品奖
AOC“刀锋Ⅲ”D2757PH 创新产品奖
闪迪酷型USB闪存盘 年度影响力产品
闪迪至尊极速固态硬盘 年度创新产品奖
Vivitek丽讯QUMI Q5 LED微型投影机 创新产品奖
理光超短焦投影机PJ WX4130N 年度创新产品奖
奥图码EX611ST短焦商务投影机 最佳应用奖
云计算产品
IBM Smart Cloud 优秀云计算产品
微软Windows Azure 优秀云计算产品
VMware vCloud Suite 优秀云计算产品
Radware Alteon 5224 优秀云计算产品
无锡云计算解决方案 优秀云计算解决方案
大数据解决方案
IBM PureData 优秀大数据解决方案
IBM大数据平台 优秀大数据解决方案
微软SQL Server 2012 优秀大数据解决方案
Teradata Aster大数据综合分析平台 优秀大数据解决方案
这正是白宫网站的《大数据研究和发展倡议》所追求的——“通过收集、处理庞大而复杂的数据信息,获得知识和洞见,提升能力,加快科学、工程领域的创新步伐,转变教育和学习模式”。
各行各业都能用得上大数据,只是对大数据重要性的意识程度不同:凯捷咨询(Capgemini)的调研结果显示,76%能源和自然资源行业的高管相信公司是数据驱动的,在医疗医药行业和生物科技行业这个数字为75%,在金融行业为73%。包括英特尔在内的有能力提供大数据解决方案的IT厂商正在努力让各行各业的企业切实感受到大数据的魔力。
能否置身事外?
随着网络应用和多媒体应用的兴起,互联网成为大数据的主要来源。随之而产生的网络营销调整围绕大数据而展开。淘宝是国内公认的对用户数据利用得较好的公司——淘宝网利用大数据统计分析得到诸如“欧洲杯的球队胜负如何影响各队球衣的销量?花露水的最佳搭配是电蚊拍还是痱子粉?”等问题的有趣结果,并以此为依据来更好地调整营销战略。
近日,阿里巴巴集团宣布,将在集团管理层面设立首席数据官岗位(Chief Data Officer),负责全面推进阿里巴巴集团成为“数据分享平台”的战略。这直接证明了大数据对于互联网企业的意义。
别的行业能不能对大数据冷眼旁观呢?赛迪智库软件与信息服务业研究所研究员安晖认为,虽然目前大数据的主要来源是互联网,但许多以信息流作为核心竞争力,如金融、电信、零售等行业的机构或企业,其数据量也不容低估。例如,美国国家海洋和大气管理局(NOAA)数据中心存储的数据超过20PB,沃尔玛数据中心的存储能力超过4PB,eBay分析平台每天处理的数据量高达100PB。并且,由于这些机构和企业所存储的数据更加有针对性,其数据的价值密度更高,进行大数据处理的意义更强,运用大数据的需求也更为迫切。
安晖以数个典型行业为例来说明大数据能带来什么好处——电信行业可以从庞大的数据中分析出不同群体的差异化需求,实现套餐制定等精准营销;制造行业可以通过整合来自研发、工程和制造部门的数据以实行并行工程,显著缩短产品上市时间并提高质量;交通行业可以通过整合和处理相关数据,实现智能交通(管理)与高效物流调度。
赛迪顾问软件与信息服务业研究中心研究总监胡小鹏认为,金融行业中证券、信用卡、电子支付等数据规模庞大,具有使用对象多样化、信息可靠性、实时性、保密性要求高等特点;电信行业中大数据主要体现为电信业务系统产业的计费账务数据和用户信息(包括客户资料、客户服务数据等),不仅数据量大,而且保存时间长;能源行业大数据主要集中在石油勘探以及电力生产、经营、管理等数据,具有数据量大、分散、类型复杂等特点。其中,在金融行业,利用大数据的挖掘和分析改善用户体验、监督欺诈行为、验证合规性、服务创新等,从而助力金融智能决策,提升竞争力;而对于电力行业,大数据分析有利于电网安全高效运行(安全检测与控制、灾难预警与处理、供电与电力调度决策支持和负荷预测)、电力营销(用户用电行为分析)、集团集中管控与精细化管理等。
大数据这场盛宴上,哪个行业也不愿意没有一席之地。
谁能站出来?
大数据的热度可以由英特尔、IBM、EMC、惠普等厂商纷纷推出面向大数据的一体化产品和解决方案直接反映出来。
然而,一个不能逃避的现实是,虽然越来越多的行业用户尝试应用大数据的解决方案,但是大多数行业用户对于大数据的认知仍然比较有限。面对林林总总的不同厂商提供的大数据解决方案,用户分不清这些解决方案的差异在哪里,也就不会真正了解哪种解决方案适合自己。
有用户反映,大数据解决方案容易给人的错觉是该解决方案就是把数据分布存储,再并行处理。即使采用国外厂商的工具,这些工具成熟度不是特别高,导致解决实际问题的时间过长。
英特尔相关专家表示,从总体上看,中国大数据市场发展迅速,特征明显,相关技术和应用可改进和提升的空间巨大。而且大数据要落地,必须实现包括芯片商、软件企业等在内的IT基础设施与服务层平台的开放。
英特尔在硬件上的领先无需多言。在软件层面,考虑到Hadoop的开源特性,很多厂商都有机会在Hadoop的基础上推出产品,但行业解决方案提供商面临的一个苦恼是,他们不得不进行底层开发。实际上,底层解决方案是有很多共性的。对行业解决方案提供商来说,如果有一个由可靠厂商优化过的平台再好不过了。利用这个平台,行业解决方案提供商可以抛开重复的、无意义的劳动,将注意力和精力更加集中在行业特点上,进而开发出满足行业所需的实打实的行业解决方案。在这种情况下,英特尔适时地推出了英特尔Hadoop发行版,打造一个优秀的、高价值的底层平台。
对于如何从大数据中发掘价值,英特尔指出,这需要在IT基础设施与服务层、数据组织与管理层、数据分析与发现层、决策支持与IT服务层全面引入新的技术,特别是在堪称大数据应用“载体”的IT基础设施与服务层,采用基于开放架构的平台将是最佳选择。
O‘Reilly Strata和Open Source Convention大会委员会主席Edd Dumbill曾指出,使大数据真正变得强大的方式之一就是让上层程序员可以将精力放在数据而非底层Hadoop设施的抽象特征上。他们编写更简短的程序,能够更清晰地表达出对数据所做的处理。这些将有助于为非程序员创建更好的工具。
延伸到企业层面,“行业解决方案提供商需要稳定性和可用性都足够好的平台。在这样的平台上,行业解决方案提供商可以从不必要的重复性劳动中解放出来,从而把更多的精力放在提供差异化特色方案和服务上。”英特尔亚太研发有限公司总经理、英特尔软件与服务事业部中国区总经理何京翔的看法类似。进而,他解读了英特尔Hadoop发行版的优势:“英特尔Hadoop发行版的优势在于:处理接近于实时;能在英特尔平台上实现最优化的性能,比非英特尔发行版有成倍的增长;通过和电信、智能城市、医疗等行业客户的合作,英特尔Hadoop还做了更进一步的优化。”
除了提供平台,英特尔(中国)行业合作与解决方案部中国区总监凌琦强调,英特尔还会把大数据解决方案的研究和服务作为投资部门的重点。英特尔的风险投资部门也对大数据中所涉及的关键平台、关键应用、提供商,给予关注。
行业侧重点
英特尔硬件平台的特点让其可以用“通吃”来形容,行业特色则由软件来体现。
正如英特尔Hadoop发行版白皮书所指出的,它“为企业应用而优化”,其拥有的增强高可靠性、增强分布式文件系统HDFS扩展性(使集群的I/O吞吐量能够随着节点数量的增加而线性增加)、动态调整数据复制策略(提高热点数据的并发访问能力)、改进分布式计算框架调度算法(避免并行任务退化成串行执行)、增加Hadoop集群监控管理、优化HBase查询、实现细粒度的HBase合并调度控制(避免合并风暴)、创建异地HBase大表、均衡负载等相对开源Hadoop和其他Hadoop发行版的核心优势在多个行业中均不可或缺。
从早期担任英特尔服务器平台事业部总经理,到移动工程总监,再到担任英特尔CIO,柏安娜每一次工作重心的变化,都与英特尔战略变革息息相关。如今,她担任英特尔公司全球副总裁兼数据中心及互联系统事业部总经理,负责管理英特尔面向企业和云服务器基础设施的盈亏、战略和产品开发,并同时负责高性能计算、存储、通信、网络以及智能互联系统。在她的带领下,该部门在 2011 年创收超过 100 亿美元,重点开发适用于所有数据中心基础设施的产品和解决方案。
2012年,在美国旧金山召开的秋季英特尔信息技术峰会(IDF)上,柏安娜接受了本刊的独家专访,这是她近期首次对中国媒体就英特尔的大数据战略进行详细的解读。她透露了自己的目标:五年内英特尔数据中心的相关业务将会实现倍增,2016年时达到200亿美元,而这一高速增长的乐观期望,正是来自于云服务商提供的大数据业务。
移动设备爆炸带来变革机会
云计算会吸引更多人上网,接入更多设备,从而产生更多海量数据——这个即将出现的循环将带来巨大的机会。
《数字商业时代》:云计算的出现让全世界所有信息和通信技术覆盖的地方,都试图通过技术来生成一个数字化的投影。这种更彻底的数字化浪潮将为商业和经济带来怎样的影响?
柏安娜:云计算从提出到取得飞速发展是最近五年的事,它在面向消费者和企业的相关服务及应用的数量都在快速增加。云计算模式很有吸引力,它可以在低运营和低拥有成本的基础上进行大规模的扩展,而且它具有按需提供服务的能力,因为它的基础设施是共享的。可以看到,中国和美国的云建设都在飞速发展。这就像一个虚拟的循环,随着越来越多的人上网——目前有23亿人上网,他们会购买更多设备。这些设备与数据中心连接,需要建设云基础设施来支持这些设备。这会推动新服务和解决方案的创新,从而吸引更多人上网。这些推动了云计算的发展,并推动相关服务的发展。在这个令人惊叹的循环中,随之带来的是我们从未想过的新式服务和解决方案。就像你所说的,我们现在真正处于数字创新时代,新服务在线上不停地涌现,因为我们能够在云中进行新功能的快速部署。
《数字商业时代》:与这种数字化浪潮最为匹配的技术,似乎就是大数据分析技术,现在和未来一段时间内,有哪些因大数据技术而生的商业模式值得人们关注?
柏安娜:一直有很多企业数据,但从来没有分析和利用这些数据的高效方式。这种情况下,数据就没有发挥作用。现在围绕大数据有很多行业创新。一个是计算成本继续增加,例如横向扩展存储等。一个重大成本是这些数据的存储成本,传统存储方式太过昂贵。因此,你看到存储创新,基于英特尔平台的横向扩展存储。然后是围绕开源数据分析解决方案的大量创新。Hadoop是个非常好的开源框架,让你能够提取所有这些数据,高效地存储并实时分析。计算存储平台和分析解决方案相结合,让企业和消费者都能看到重大数据。有个很好的例子,中国政府要求电信运营商为消费者提供90天的交易记录,让消费者能够上网了解过去90天的所有消费情况,这是一个重大的大数据问题,涉及的数据量也非常巨大。我们与电信运营商合作,利用Hadoop向他们提供一个稳定、优化的Hadoop平台以分析和报告这些信息,从而满足政府的监管要求。我们目前是Hadoop框架的分销商,我们现在所做的是以前从未做过的事情。
数据就是价值
大数据时代,IT将不再是成本,而成为价值。
《数字商业时代》:有迹象表明在云计算与数据的时代它将开始主导企业业务的发展甚至是变成一个核心业务,简而言之就是变成企业的盈利中心,你对这一趋势有何看法?
柏安娜:这个观点很对。平均每6—8年,IT的角色就会发生变化。IT一开始是成本中心,必须为此付费,因为需要让网络和PC稳定运行。现在,我们把IT看作业务的战略合作伙伴。随着计算平台和软件解决方案的发展,IT发展与业务的关系越发紧密,提供做出正确决策所需的业务信息。因此,我们现在说IT部门和业务部门正在合二为一,因为一切都是为商务合作伙伴提供恰当的IT解决方案以满足他们的业务需求。这已经不再是像网络这样的一般,而是提供有针对性的IT解决方案以让业务运转更加顺利。所有东西都来到网上,每个公司的业务也都转向网络。每个人都希望每周7天,每天24小时获得来自全球的支持,不管自己身在何处。因为IT和业务间存在如此高的依赖性,它们必须合二为一。IT的角色越来越重要,为业务带来越来越高的价值,对于英特尔而言也是如此。
从定量、结构的世界,到不确定、非结构的世界。这个转变,使我们得以了解真实信息,提高决策水平,当社会对自然的数据有较为完善、随时的分析能力时,我们对事件的把握及预测能力便增强。以云计算为基础的信息存储、分享和挖掘手段为知识生产提供了工具,通过对大数据分析、预测会使得决策更为精准,而对于许多企业而言,数据正成为在商战中取胜的决定性要素。
日前落幕的第十一届大连软交会“2013大数据创新论坛”。以大数据的分析及服务为主题。邀请了来自Intel、微软和IBM的高层专家,分享了对大数据技术的见解,共同探讨大数据生态系统的构建。
中国有着庞大的人群和应用市场,复杂性高、充满变化,如此庞大的用户群体,构成了世界上最为庞杂、最为繁复的数据。解决这种由大规模数据引起的问题,探索以大数据为基础的解决方案,是中国产业升级、效率提高的重要手段。
IBM“智慧的计算”引领方向
作为论坛当日的一大亮点,IBM中国开发中心首席技术官毛新生在以“智慧的计算”为主题的演讲中提出:大数据并不是Hadoop,Hadoop只是进行大数据分析的一个很小的分支,大数据分析是非常多样化的领域,每一个领域自身数学模型和数学属性,这些模型和属性需要开发者去开发领域相关的算法,然后将这个算法映射到一个可以进行大规模分布的机制上,这个机制往往要利用云计算基础设施达成。
作为大数据领域的领导者,IBM正在利用领先方法论和全面大数据技术帮助企业重新思考已有的IT模式;助力企业进行基于这场信息革命的业务转型,获取竞争机遇和不可估量的商业价值。同时,IBM作为目前业界唯一能够集咨询、服务、软硬件综合实力,提供端到端全面整合解决方案的厂商,相关产品和服务覆盖了大数据及分析相关领域的各个阶段、各个领域;IBM的大数据实践已经深入到包括中国在内的全球市场的各个行业,包括电信、金融、医疗、零售、制造等众多客户已在IBM大数据平台及大数据分析等技术和理念支持下获得收益。此外,IBM还推出了一套以成果为导向的组合产品解决方案,包括欺诈预测、财务运营和客户服务三大核心能力。这套解决方案广泛汇集了IBM的智慧资本,包括软件产品、基础架构、研究及咨询服务。
针对企业大数据方向开发者,IBM推出了多款产品和技术,大力提升了其分析产品的加速性能,简化了开发和运营。新版本企业级Hadoop产品InfoSphere Biglnsights可以利用现有的SQL技术,更便捷地开发应用组件。兼具安全性强和高可用性特点,新版Biglnsights能够更加契合企业部署需求。新版流计算软件InfoSphere Streams在实时分析的开发和部署上进一步增强了操作的简易性。新版关系数据库管理软件Informix包含TimeSeries Acceleration,能够适用于智能仪表和传感器数据的运行报告和分析。
英特尔软硬协同、体验至上
“大数据正在深刻地改变软件行业、IT产业,以及人们生活的方方面面。”英特尔亚太研发有限公司总经理、英特尔软件与服务事业部中国区总经理何京翔博士表示:“产业正在重构。我们希望与广大产业链伙伴和开发者分享英特尔大数据技术平台和计算解决方案,推动构建本地‘端到端’的大数据生态环境,共同迎接智能城镇建设中日益苛刻的大数据挑战。”
目前,英特尔的软件支持已经扩展到整个软件栈,从平台硬件、固件、虚拟机、云计算到操作系统、开发工具、中间件和应用程序,帮助广大产业链伙伴和开发者释放创新潜力,革新用户体验。以英特尔针对大数据的开放架构核心产品线,配合英特尔Hadoop分发版,可以实现“软硬协同、体验至上”的创新效果。例如,利用英特尔至强处理器平台对网络和I/O技术所做的优化,与英特尔Hadoop分发版进行强力组合,以往分析1TB的数据需要4个多小时漫长等待才能完全处理完毕,现在仅需短短的7分钟即可完成,极大地提升了大数据“智能”的意义。
英特尔Hadoop目前已经有了广泛的应用案例,包括智慧城市、电信、金融、医疗等行业都产生了用户。在谈到具体案例的时候,苗凯翔博士指出在英特尔Hadoop发行版软件的应用领域,中国比其他国家是先迈出了一大步,走在了世界的前列。以电信行业为例,英特尔Hadoop发行版已经被中国联通,用以进行历史账单及流量的查询与分析。正是由于客户的强烈需求,使得英特尔Hadoop这一原本在英特尔作为创新与尝试性的项目最终变成实际的产品出现。
通过与本地合作伙伴的携手努力,英特尔正在将大数据技术应用于智慧医疗的创新。英特尔亚太地区研发有限公司数据中心软件部大数据解决方案经理王晓栋介绍了在过去一年中与用友在UEP框架下实现的合作,主要是基于英特尔x86集群+x86综合解决方案,来尝试处理现在在医疗中的问题。例如医生查询病人病例,以前可能要拿病例本才能查到,而随着整个医疗系统在大数据时代的升级,所有医疗病例都集成在英特尔大数据平台上,使其查询速度、处理速度都达到顶级的水平。在过去一年,双方在区域性、大型电子健康档案和区域性的医疗质量分析方面均进行了不同程度的尝试。
从IT硬件系统,到数据管理应用,再到数据处理和分析软件领域,英特尔都拥有广泛的合作伙伴和健康的生态系统,通过合作伙伴间的紧密合作,已能够向用户提供适用于大数据应用,或针对此应用进行了进一步优化的服务器、存储设备和网络设备,以及能与这些设备实现无缝对接、更符合大数据应用需求的数据管理和数据分析软件。
大数据处理任务对于开放架构平台的倚重,让英特尔在这一领域获得了越来越多开发者的关注。作为全球领先的开放架构平台最核心部件——处理器平台的提供商,英特尔首要的任务就是要打造适用于大数据应用的“芯”,而后帮助开发者围绕这一基础创新打造可承载大数据应用的基础设施。英特尔还计划在其上的数据组织与管理层,针对大数据的分发和管理需求提供针对英特尔平台优化的Hadoop产品和服务;在分析与发现层,提供针对客户端与服务器端算法开发的支持,以满足大数据计算所需的性能与规模要求;在决策支持与IT服务层,则将联合生态系统内的合作伙伴,提供更为优化的可视化应用体验。英特尔所有与这些规划相关的具体策略,将随着大数据技术、应用和市场的发展逐步深化、细化。
微软携甲骨文漫步“云端”
结合对大数据本身的认知和微软自身强大的产品组合,微软可以为用户提供一个端到端的大数据解决方案。简单来说,就是后端以新一代SQL Server 2012为基准平台,将大数据管起来,然后在中端以数据集市为依托,配以丰富的数据应用,最后在前端以丰富的界面形式展现数据分析的结果,完成数据的汇总——应用与分析——结果呈现的完整流程。
为帮助企业快速采用其大数据解决方案,微软将同时在Windows Azure平台和Windows Server上提供Hadoop(在前者上用作基于云的服务,在后者上用作内部部署的分布)。并且有非常多的第三方针对Hadoop的应用工具,能够在这个平台上做到更好的分析、更好的视觉化的工作。微软大数据解决方案还支持Mahout等通用的第三方工具与框架,通过Hadoop流,支持C++、C#、Python、Ruby和Pearl语言的定制挖掘算法。
去年9月份,微软跟中国电信天翼平台达成合作共识,他们把门户网站的服务、灾备服务都建立在Windows Server上,这样便整合成了一个非常完整的“云”操作系统。对于客户来说,这个系统将带来了相当大的价值,它能够把你所有的应用、所有的运维场景在线上和线下更好地管理起来。从整体角度来说,云的管理系统能够帮助IT人员解决一系列操作场景。
为了让更多初创企业使用微软公有云服务,微软大中华区副总裁兼市场战略部总经理、微软大中华区首席云计算战略官谢恩伟表示,公司已在华启动了云加速器项目,免费为新创企业提供Windows Azure服务,而目的也是进一步推广公有云服务。Windows Azure开放、可靠、易用的平台服务大幅降低了初创企业系统开发及运营成本,帮助初创企业决速在全球范围内开展业务,并为全球用户提供一致卓越的用户体验,使初创企业集中精力于核心业务开发,加速业务成长。目前第二期项目已接近尾声。
此外,吸引广大开发者眼球的好消息还包括HTML 5网页app、Apache Cordova/PhoneGap和Windows Phone 7.5的开发者,现在可以用Azure作为服务支持。而可以享有这个权利的移动端浏览器包括IE8以及“现行版本的Chrome、Firefox、Safari和2.3以上的PhoneGap。”
近日,有国外媒体报道称,甲骨文与微软公司宣布在云计算领域展开深入合作。其中微软云平台Windows Azure将全面支持Oracle数据库、Java、Weblogic和Linux。通过与甲骨文的合作,微软能够给Windows Azure平台的客户提供更多的部署选择。但对于Azure平台应用在甲骨文和微软云上的表现具体会如何,目前尚不得而知。
三巨头 八仙过海各显神通
2012年,从整个云计算解决方案ITBrand排行榜上看出,IBM、微软、英特尔虽然在排名上有细微波动,但一直稳居前三位。
日前,在戴尔公司召开的2012年高层客户峰会上,戴尔亚太及日本地区总裁、全球新兴市场董事长闵毅达(Amit Midha)表示,IT市场目前呈现出五大趋势:IT系统简化、虚拟化与云计算逐步普及、数据大爆炸、新兴市场发展、IT消费化。因此,他认为,推动部署虚拟化、降低IT系统运营成本、管理快速增加的复杂数据、管理工作人员所使用的各种IT设备,这些都成为企业面临的挑战。戴尔近年来同样通过转型,努力提高全面服务于客户的能力,为用户提供端到端的解决方案。
收购加速能力提升
在IT界,一直以来都不乏通过对具有先进技术的公司的收购,来迅速提升本公司能力的案例,对于以往以PC等终端设备见长的戴尔来说,要想转型进军企业级市场,收购无疑是一条快速实现目标的捷径。从2008年开始,戴尔就将目光投向了在存储、网络、安全、软件、服务等领域有特色的厂商,开始了有计划、有步骤的收购行动。
至今,戴尔已经收购了20多家厂商,其中不少很成功的收购为业界所津津乐道。例如对存储厂商EqualLogic的收购,两年时间就使其业绩达到10亿美元,而用户数增加了8倍;2010年年底收购的智能存储厂商Compellent,使戴尔的存储解决方案上了一个台阶,Compellent的“流动数据”理念现在已经成为戴尔存储的设计理念;对咨询服务厂商佩罗的收购更是填补了戴尔企业级咨询服务的空白,使戴尔的解决方案成为名副其实的“端到端”,并有效地带动了戴尔其他产品线的销售。
正是这一次次的收购,使戴尔迅速转型,业绩不断提升,在当今云计算和大数据时代,也有了更多的话语权。戴尔全球企业解决方案事业部副总裁Cheryl Cook认为,戴尔在大数据方面拥有创新性的解决方案,不仅可以为用户节省大笔资金,同时可提供极高的价值。她认为,大数据从开始到成熟分为5个阶段,即从混乱、保留、优化到简单分析、复杂分析。在这5个阶段里,戴尔针对前3个阶段,可提供大数据保留解决方案;而对于后两个阶段,戴尔则拥有大数据分析解决方案。Cheryl Cook认为,戴尔创新性的解决方案可处理成熟度模型范围内的结构化、半结构化和非结构化内容,她特别说道,戴尔将利用Hadoop,并与从事Hadoop开发的Cloudera公司合作,为用户提供大数据分析解决方案;而在大数据保留解决方案中,戴尔将充分发挥在存储方面的优势,通过存储虚拟化和整合、应用程序优化、数据保护、灾难恢复以及数据保留和管理等技术,为“流动的数据”提供存储和保护。
深谙用户需求
在戴尔2012年高层客户峰会上,戴尔服务部首席创新官James Stikeleather就“IT的未来”进行了演讲,他认为,企业IT未来将面临着来自IT价值、所有权和角色等方面的五大根本性变化,这些变化包括:信息超越流程、IT嵌入在业务服务之中、外部化的服务交付、企业合作伙伴的责任更大、减弱的独立IT角色。
作为IT解决方案供应商,戴尔同样也是一家企业,James Stikeleather认为,在当今这个转型的时代,戴尔已经成功地转型成为高效企业,它将战略性支出从2008年占IT预算的20%提高到今天的52%。这期间,戴尔的IT经过了标准化、简化、自动化,并最终实现云,比如将97%的系统迁移到x86平台;大力推进虚拟化,从而减少了6000台服务器;仅用一个控制台就可管理13万台服务器和客户端;运用云平台聆听客户的声音、信息和进行交互。这些举措使戴尔更加了解用户,更有针对性地为用户提供适合的解决方案,真正解决用户的问题。
闵毅达介绍说,戴尔目前针对不同行业推出了不同的解决方案,尤其在金融、教育、医疗、制造业等行业中更是拥有大量的用户,并与用户一起合作开发和培养人才。在会上,戴尔与教育部教育管理信息中心针对教育信息化建设和管理人才技术培训及试点合作签订了备忘录,与北京大学计算机科学技术研究所签署了戴尔虚拟集成系统(VIS)联合实验室项目备忘录,还与中国东方航空就长期发展签署了合作备忘录。
2013年,惠普了大数据解决方案平台HAVEn,这是一个能够处理所有数据类型,能够实时分析且安全的开放架构。目前,该平台在国内外的金融、电信、能源、互联网等行业中已经拥有了许多成功应用。惠普中国区副总裁、软件集团大中华区总经理于志伟表示,HAVEn的推出标志着惠普已经脱离了初始的数据汇集的阶段,步入了大数据应用的新阶段。
行业、能力、人才
于志伟认为,目前中国的大数据应用还处于起步阶段,而且由于行业需求、区域和人才储备等情况的差异,造成了大数据应用水平参差不齐的现象。在某些行业,用户对大数据的需求是十分迫切的,但是相当多的用户仍纠结于数据量“大”这个问题,还没有考虑结构化、半结构化和非结构化等不同类型的数据应该如何处理。
国外的大数据应用水平已经达到很高的程度。举例来说,在美国,一个区域内的所有医院的信息都会被搜集起来用于分析,据此可预测某种疾病的死亡率。“国外的大数据应用已经走入行业,可以挖掘出行业中真正有价值的东西。虽然国内的大数据应用还停留在初始阶段,但在某些行业,比如互联网,其大数据应用的复杂程度比国外更甚,发展水平也较高。”于志伟向记者表示。
大数据的应用要经历一个过程,不同的行业对大数据应用的需求是不同的。于志伟表示,企业在实施大数据应用时应注意以下几个问题:第一,注重大数据的行业应用价值;第二,企业要不断提升自身的能力去获得想要的信息;第三,大数据人才非常重要。“目前,我国大数据行业面临着人才严重匮乏的局面,从数据模型专家到通晓行业应用的复合型大数据人才都十分短缺,这会影响大数据应用的发展速度。”于志伟表示。
HAVEn是一种方向
今天,产品集成并不是难事,那么HAVEn是不是简单地将相关产品攒到了一起呢?于志伟澄清说,从HAVEn本身的标准架构来看,H代表Hadoop,表明HAVEn是一种分布式的架构,能够支持各种类型的数据,而且存储成本非常低廉;A代表Autonomy,表明HAVEn可以高效地处理非结构化信息,特别是机器语言;V代表Vertica,表明HAVEn可以实时处理和分析大量信息;E代表Enterprise Security,主要针对半结构化数据的处理;n代表的是各种在大数据平台上开发的应用。
HAVEn是一个平台,它可以处理所有类型的信息,而且能做到实时分析,同时具有安全性。那么,HAVEn能不能代表未来大数据方案的发展方向?于志伟并没有正面回答记者的问题,而是举了一个例子,全球最大的社交媒体公司,之前采用Hadoop架构对信息进行处理。但是在半年前,它们采购了Vertica。很多人认为,Hadoop代表了大数据主流的发展方向,那么这家企业为什么会转而选择Vertica呢?最主要的原因是,Vertica可以实现实时分析。对于以广告收入为主要来源的这家企业来说,实时推送精准的广告是至关重要的,而Vertica可以实现。这家企业用Hadoop处理非实时的数据业务,而用Vertica进行实时的业务分析。虽然相比Hadoop,Vertica的采购价格略贵,但这家企业还是一次性采购了20PB。还有一家美国的知名电信公司,一次性采购了25PB的 Vertica解决方案,用于4G业务。
“我们不去争论HAVEn是不是业界最先进的产品,但是综合上述这些已经使用了HAVEn的代表性企业的实践,HAVEn代表了一种发展方向。”于志伟分析说,“Hadoop将来会不会更全面,也能实时处理信息?有这种可能性,但需要时间。三年或五年以后,什么都可能发生,一种新技术甚至会消失。事实证明,我们的大数据平台能够解决用户的问题,而且很多用户都在使用。”
在中国,也有用户在使用HAVEn,比如一个运营商使用HAVEn中的Vertica,分析用户的上网行为,每天分析的记录达到几十亿条。以前,这样的分析工作很难在一天之内完成,而使用Vertica,分析速度提高了60倍。另外,国内某知名能源公司采用HAVEn中的Autonomy,支持其信息共享平台。
于志伟认为,HAVEn还只是一个大数据平台,而用户购买的是应用。因此从这个角度说,惠普提供的解决方案还不够全面。HAVEn中为什么会有一个“n”,就是表明惠普要在大数据领域开发更多的应用。惠普与全球最大的几家咨询公司合作,并在亚太和中国市场上寻找类似的合作伙伴。“行业解决方案是有区域性特征的,不可能直接照搬国外的。在一些垂直细分领域,我们一方面自己开发,另一方面也和合作伙伴共同开发解决方案。”于志伟补充说,“我们与政府合办的IT培训基地也把大数据当作一个重点。中国极缺大数据人才,我们从现在开始就要培养。这些人才今后可以为我们的合作伙伴所用,有利于我们共同构建一个良好的大数据生态体系。”
树立行业样板
记者在采访很多用户时,他们都表示已经认识到了大数据、云计算的重要性和可能给企业带来的收益。但是认识与接受是两回事,目前真正将大数据、云计算用于业务并取得显著经济利益的用户毕竟是少数。大数据是当前用户最迫切需要的、关系企业成败的技术,还是只是起到了锦上添花的作用?
于志伟对于大数据的前景十分乐观:“目前在客户中,真正使用大数据的比例可能低于5%,但即使是这5%已经是巨大的客户量,而且这5%的企业都是超大型的企业和最需要大数据的企业。惠普一定是先与这些企业合作,树立大数据的应用标杆,然后再引导更多的企业加入。惠普目前在做的人才教育和培养工作,也是为了更好地普及大数据应用。我们不确定大数据市场何时会井喷,但我们会一直持续地给用户和市场更多方案、经验和信心。”
大数据的一个典型特征就是实时处理和分析,能够实现实时处理的解决方案价格相对昂贵,而客户往往追求的是高性比的解决方案。那么,价格会不会是阻碍大数据普及的一个因素呢?Vertica是实时分析工具的一个代表,它的价格是普通企业用户能接受的吗?“相对于Hadoop大数据方案来说,Vertica的成本高相对高一些。”于志伟并不讳言,“Vertica运行于开放的硬件平台架构之上,不管是惠普自己的硬件还是第三方的硬件,即使在低端的x86平台上也可以良好运行。我们可以为用户提供灵活的选择,既能提供Vertica软件,也可以提供软件与硬件组成的整体解决方案,包括一体机。无论从整体拥有成本,还是灵活性的角度来分析,相比市场上的其他一体机或大数据解决方案,Vertica大数据解决方案还是非常有竞争力的。”
链接
惠普中国软件集团的四件大事
2014年,惠普软件的整体战略相较去年不会有太大变化。于志伟表示,惠普软件在今年将主要做好以下四件事。
第一,在大数据、云计算方面继续加强与政府的合作,同时抓好人才培养工作。
第二,在大数据、云计算、移动应用等领域,寻找并树立更多的成功用户样板,吸引更多新客户。
如何充分利用大数据,挖掘大数据的商业价值,从而提升企业的竞争力,已经成为企业关注的一个焦点。这也是甲骨文公司努力的方向。
全面解决方案才能奏效
当前,越来越多企业将大数据的分析结果作为其判断未来发展的依据。同时,传统的商业预测逻辑正日益被新的大数据预测所取代。但是,我们要谨慎管理大家对大数据的期望值,因为海量数据只有在得到有效治理的前提下才能进一步发展其业务价值。
最广为人知的大数据定义是Gartner给出的大数据的3V特性:巨大的数据量(Volume)、数据的快速处理(Velocity)、多变的数据结构和类型(Variety)。根据这一定义,大家首先想到的是IT系统中一直难以处理却又不容忽视的非结构化数据。也就是说,大数据不仅要处理好交易型数据的分析,还把社交媒体、电子商务、决策支持等信息都融入进来。现在,分布式处理技术Hadoop和NoSQL已经能对非结构化数据进行存储、处理、分析和挖掘,但未能为满足客户的大数据需求提供一个全面的解决方案。
事实上,普遍意义上的大数据范围更加广泛,任何涉及海量数据及多数据源的复杂计算,均属大数据范畴,而不仅局限于非结构化数据。因此,诸如电信运营商所拥有的巨量用户的各类详细数据、手机开关机信息、手机在网注册信息、手机通话计费信息、手机上网详细日志信息、用户漫游信息、用户订阅服务信息和用户基础服务信息等,均可划归为大数据。
与几年前兴起的云计算相比,大数据实现其业务价值所要走的路或许更为长远。但是企业用户已经迫不及待,越来越多企业高层倾向于将大数据分析结果作为其商业决策的重要依据。在这种背景下,我们必须找到一种全面的大数据解决方案,不仅要解决非结构化数据的处理问题,还要将功能扩展到海量数据的存储、大数据的分布式采集和交换、海量数据的实时快速访问、统计分析与挖掘和商务智能分析等。
典型的大数据解决方案应该是具有多种能力的平台化解决方案,这些能力包括结构化数据的存储、计算、分析和挖掘,多结构化数据的存储、加工和处理,以及大数据的商务智能分析。这种解决方案应具有以下四个特性:软硬集成化的大数据处理、全结构化数据处理的能力、大规模内存计算的能力、超高网络速度的访问。
软硬件集成是必然选择
我们认为,大数据解决方案的关键在于如何处理好大规模数据计算。过去,传统的前端数据库服务器、后端大存储的架构难以有效存储大规模数据并保持高性能数据处理。这时候,我们让软件和硬件更有效地集成起来进行更紧密的协作。也就是说,我们需要软硬一体化的专门设备来应对大数据的挑战。
坚持开放的战略