解读2013年大数据应用与趋势的调研
在互联网行业,2013年可以说是被公认是具有跨时代意义的“大数据元年”。在这一年,数据比以往任何时候都要宝贵,甚至成为可以与石油资源相媲美的新能源,大数据被认为是继信息化和互联网后整个信息革命的又一次高峰。然而,大数据不是口号,需要更多的企业付诸实践,从单调的数据中挖掘出潜在价值。
在本年初的一项调查曾指出,28%的全球企业和25%的中国企业已经开始进行大数据实践。为了进一步了解中国企业大数据应用的真实情况,有关结构展开了一项有关大数据应用与趋势的专项调查,揭示大数据给企业带来的挑战及其解决之道。
此次调查于2013年9月30日正式启动,历时一个半月,通过线上线下两种途径回收问卷500余份,人群覆盖数据架构师、数据库管理和运维工程师、数据库开发工程师、数据分析师、研发总监和IT经理等技术人员。
一、本次大数据调查的主要结论
1、每月新增数据规模在500G以上的企业由2012年的16.67%,增长到18.11%。虽然拥有大数据的企业比例有所上升,但与预测中数据增长速度还有很大差距。
2、选用国产大数据产品的企业仅占5.61%,国产厂商若抓住大数据和信息安全的重大机遇,将迎来成长的春天。
3、企业认为大数据的存储和处理过程中三个最大的难点是数据安全、系统性能瓶颈和数据类型多样化。
4、在大数据时代,企业面临的最大挑战是缺乏专业的大数据人才。
5、针对非结构化数据,企业目前最迫切需要解决的是如何对这些数据进行分析。
6、当前已经部署大数据的企业达到21.89%,计划1年内部署的占27.92%,2014年将是大数据部署的高峰期。
7、企业在大数据选型的过程中最先考虑的三个因素是产品的性能、服务与支持水平和与其他应用的兼容性。
8、大多数企业选择大数据产品或解决方案的类型是大数据分析软件。
9、被调查者最关注的大数据技术,排在前五位的分别是大数据分析、云数据库、Hadoop、内存数据库,以及数据安全。
10、被调查者认为在大数据分析中最重要的三个功能,分别是实时分析、丰富的挖掘模型和可视化界面。
二、企业大数据应用现状
对于如何定义大数据?这是一个仁者见仁、智者见智的问题。主流的有“3V”模型,即数量(Volume)、速度(Velocity)和种类(Variety),还有Gartner的定义,即大数据是超出了常用硬件环境和软件工具在可接受的时间内为其用户收集、管理和处理数据的能力。
庞大的数据量无疑是大数据最明显的一个特征。有预测称,全球信息量正以每年59%的速度增长。企业的数据规模是否达到难以承受的程度?在去年的调查中我们就曾对企业每月新增数据规模进行摸底,结果显示企业的数据规模不断增大,但还未达到企业无法掌控的程度,每月新增数据规模在500G以上的企业占到16.67%。
1、企业每月新增数据规模调查
今年的情况又是如何呢?从上图可以看出,被调查者所在企业每月新增数据规模在10G以下的占到26.79%,11-100G的占到41.89%,101-500G的占到13.21%,500G以上的达到18.11%。
对比去年的结果可以看出,企业每月新增数据规模在500G以上的由2012年的16.67%,增长到2013年的18.11%,同比增长8.64%。拥有大数据的企业比例有所上升,但与预测中数据增长速度(59%)还有很大差距。
2、企业选用大数据厂商调查
企业更青睐哪家大数据厂商?或许从现有产品的部署情况可以看出端倪。从上图可以看出,排在前六位的的厂商分别是IBM(18.74%)、Oracle(18.33%)、SAP(11.35%)、Microsoft(9.71%)、SAS(7.52%)和NetApp(7.52%)。
与2012年的调查数据相比,Oracle从27.93%下降到18.33%,一家独大的状况终止,取而代之的是遍地开花,各个厂商所占份额相对平均。前三位中IBM和SAP份额增长最为迅猛,分别由15.99%和7.66%增长到现在的18.74%和11.35%。
在今年的调查中,新增了国产厂商的选项。相比国外的几家IT巨头,国产厂商的占有率仅为5.61%。今年震惊一时的“棱镜门”事件给企业信息安全敲响了警钟,也给国产厂商带来巨大的机遇和挑战。大数据和信息安全领域的需求激增,国产厂商将迎来成长的春天。
三、企业大数据痛点分析
多年前,企业关注信息化和互联网化,近几年关注更多的是云计算、移动化和社交化。马海祥觉得无论哪种技术趋势,都给企业的数据处理和分析带来不少难题。数据量的激增、数据多样性和复杂性、数据安全的问题,都成为企业面临的挑战。为了进一步了解企业的真实需求,此次调查针对大数据时代的企业痛点进行分析。
1、企业大数据的存储和处理难点调查
从上图来看,企业在大数据存储和处理上的难点分布比较均匀,所占比例最高的为数据安全(18.98%),排在第二的是系统性能瓶颈(18.42%),第三位的是数据类型多样化(18.01%)。其他还有数据分析效率低(15.24%)、数据读写瓶颈(14.96%)和存储压力(14.40%)。
选项之间的差距非常小,也说明这六项都被认为是企业数据存储和处理的难点,其中数据安全是企业最关注的问题。在大数据环境下,很多企业正在重新思考信息安全策略,保护数据资源不被侵犯。
2、企业在大数据时代面临的挑战
在大数据时代,企业面临的挑战可以从上图中看出一些端倪。缺乏专业的大数据人才(26.99%)成为企业面临的最大挑战,其次是非结构化数据的分析和处理(26.65%)、传统技术难以处理大数据(25.27%)以及新技术门槛过高(21.13%)。
大数据相关人才的欠缺将会成为影响大数据市场发展的一个重要因素。据Gartner预测,到2015年,全球将新增440万个与大数据相关的工作岗位,且会有25%的组织设立首席数据官职位。大数据的相关职位需要的是复合型人才,能够对数学、统计学、数据分析、机器学习和自然语言处理等多方面知识综合掌控。未来,大数据将会出现约100万的人才缺口,需要社会、高校和企业共同努力去培养和挖掘。
3、企业针对非结构化数据的挑战
面对文本、图片、视频等非结构化数据,企业并不擅长处理。从上图的调查结果可以看出,企业目前最迫切需要解决的是如何对这些数据进行分析,所占比例达到38.96%。其次是与其他数据源进行集成(32.50%)、如何保存这些数据(14.72%),以及数据安全问题(13.82%)。
我曾在马海祥博客的一篇文章中提过数据的核心是发现价值,而驾驭数据的核心是分析。分析是大数据最关键的环节,尤其对于传统方式难以应对的非结构化数据,人们最先想到是把它们转化为结构化数据,然后再处理和分析。
与企业对结构化数据安全性的关注不同,非结构化数据的安全问题在企业中缺乏应有的重视。但据统计,高达80%的商业数据均以非结构化的形式保存。非结构化数据的安全问题也迫在眉睫,企业需要提前做好预警和规划。
四、企业大数据选型规划
毋庸置疑,大数据是2013年最热门的话题。热闹之余,马海祥觉得我们更应该去冷静的思考一下,企业是否需要部署大数据、需要部署哪种类型的大数据,以及如何选择适合的解决方案,需要做一个有针对性的选型规划。
根据今年的一项调查显示,全球企业软件支出近300亿美元,相比2012年增长6.4%,预计2014年企业支出将向大数据倾斜,尤其在企业内容管理、数据集成和数据质量工具三个方面。
1、部署大数据应用规划调查
从国内企业大数据应用的现状和规划来看,情况有什么不同呢?通过上图可以看出,目前已经部署大数据应用的企业所占比例达到21.89%,计划1年内部署的企业占27.92%,计划2年内部署的企业占14.34%,没有相关计划和不确定的企业分别占11.32%和24.53%。
大数据时代,企业已经逐渐意识到数据的重要性,也慢慢开始接受从传统数据库到大数据分析的转变。但是大数据最大的难点就是落地,需要与业务需求相结合,选择一套合适的大数据解决方案。
2、大数据选型影响因素调查
从上图可以看出,企业在大数据选型的过程中最先考虑的三个因素是产品的性能(19.79%)、服务与支持(15.20%)和兼容不同应用(13.94%)。其次是产品的价格(13.16%)、产品的易用性(12.18%)、支持移动化(11.11%)、所属厂商及品牌(7.80%),以及是否开源(6.82%)。
产品的性能排在第一位是毋庸置疑的。排名在产品价格前面的服务与支持,却似乎印证了IT厂商向服务提供商转型道路的正确性。另外,随着移动化的不断深入,支持移动版的大数据解决方案,将成为未来趋势。
3、大数据产品或解决方案类型调查
除了产品选型时考虑的因素,企业选择什么类型的大数据产品或解决方案更适合自己呢?从上图可以看出,选择大数据分析软件的企业占32.05%、选择大数据整体解决方案的占28.96%,选择基础架构产品的占28.38%,最少选择的是大数据一体机,所占比例达到10.62%。
除了前文所述的大数据分析的重要性之外,我们还可以看到大数据一体机没有想象中那么受欢迎。据马海祥博客上的业内人士透露,大数据一体机往往针对某一业务流程设计,缺乏普适性,且价格昂贵,不是一般企业能够接受的。所以目前的大数据一体机往往针对成熟的业务流程,能极大的简化部署和维护工作。
五、企业大数据应用趋势
在很长的一段时间中,只要一提到大数据,人们的脑海中总会浮现出Hadoop,它几乎成为大数据的代名词。但其实大数据的技术领域很广,涉及数据获取、整合、治理、分析、探索、汲取智慧的方方面面。
1、大数据技术趋势调查
从上图可以看出,被调查者最关注的大数据技术中,排在前五位的分别是大数据分析(12.91%)、云数据库(11.82%)、Hadoop(11.73%)、内存数据库(11.64%),以及数据安全(9.21%)。其次是NoSQL(8.21%)、数据仓库(8.21%)、数据集成(7.94%)、商业智能(7.13%)、列式数据库(5.96%)、大数据(数据库)一体机(3.52%),以及NewSQL(1.71%)。
令人欣慰的是,Hadoop已不再是人们心目中仅有的大数据技术,而大数据分析成为最被关注的技术。从中可以看出,人们对大数据的了解已经逐渐深入,关注的技术点也越来越多。
2、大数据分析功能调查
既然大数据分析是最被关注的技术趋势,那么大数据分析中的哪项功能是最重要的呢?从上图可以看出,排在前三位的功能分别是实时分析(21.32%)、丰富的挖掘模型(17.97%)和可视化界面(15.91%)。其次是预测分析(13.10%)、社交数据分析(12.12%)、云端服务(11.69%),以及移动BI(7.90%)。
我们在2012年也曾做过类似的调查,当时选择丰富的挖掘模型(27.22%)比实时分析(19.88%)多7.34%。短短一年时间内,企业对实时分析的需求激增,成就了很多以实时分析为创新技术的大数据厂商。
马海祥博客点评:
本调查针对2013年大数据应用现状和趋势展开,从调查结果可以看出,企业在未来一两年中有迫切部署大数据的需求,并且已经从一开始的基础设施建设,逐渐发展为对大数据分析和整体大数据解决方案的需求。与此同时,大数据还面临人才的缺乏的挑战,需要企业和高校联合起来,培养数据领域的复合型人才,帮助企业打赢这场“数据战”。
本文发布于马海祥博客文章,如想转载,请注明原文网址摘自于http://www.mahaixiang.cn/sjfx/367.html,注明出处;否则,禁止转载;谢谢配合!您可能还会对以下这些文章感兴趣!
-
预测2020年数据中心行业发展的10个趋势分析
岁末年初正是对未来一年数据中心行业发展进行预测的时候,人们将会看到一些事情的到来:云计算的兴起、SSD硬盘的发展,以及其他问题,例如许多企业将业务从云平台遣返回到内部部署数据中心。而专家对数据中心行业的预测可能偶尔会带来一些惊喜。随着大数据行业和技术的发展,企业需要改善内部部署数据中心和云计算资源之间的平衡,在服务器上采用人工智能技术,并努力有效地管理数据蔓延。行业媒体通常会对未来一年进行预测,像往常一……【查看全文】
-
关于用户调研数据分析中常见的一些误区
近期和一些做用户研究的人员进行了交流,发现很多做这个行业的人都对自己所做的工作有些迷茫,报告写了很多,数据也分析了很多,但是却感觉对产品的实际运营帮助不大,甚至分析出来的结果和实际情况比偏差很大。其实用户研究并不是一个新兴的领域,在很多传统行业,用户……【查看全文】
-
分类型数据可视化的操作方法及案例分析
在当前互联网,各种数据可视化图表层出不穷,本文尝试对数据可视化的方法进行归纳,数据可视化可以将海量数据通过图形、表格等形式直观反映给大众,降低数据读取门槛,可以让企业通过形象化方式对自身产品进行营销。数据可视化技术的基本思想,是将数据库中每一个数据项……【查看全文】
-
分析解读数据的真正目的是什么?
最近我在马海祥博客上新开了一个数据分析专栏,主要是通过平时的一些数据解析来合理科学的提高网站的各项指标的。可能一说到数据,可能就会立马让人想到是数字、图表、模型、方程等容易让人怯步的词语。其实做数据分析的真正目的和意义,是躲在背后的那些人。 在营销学……【查看全文】
-
解读2014年中国移动互联网用户行为洞察研究报告
2014中国移动互联网用户行为洞察报告旨在协助行业上下游相关人士了解用户行为的最新动向,全面透析用户的媒体使用习惯、新媒体使用方式、对移动广告的接受程度以及移动广告如何影响用户的购买决策。更多移动互联网用户将手机作为他们首选或唯一的上网工具。……【查看全文】
-
零基础学习数据地图的制作与分析
有时在实际工作中会碰到这种情况,即数据与地名有关,这时虽然也能用Excel的图表来表现,但如果能将数据和地图结合起来,将会收到更加好的效果,应用地图来分析和展示与位置相关的数据,要比在Excel中单纯的数字更为明确和直观,让人一目了然,数据地图就是解决此类问题……【查看全文】
-
如何以客户为中心进行数据挖掘与分析
数据挖掘与分析可以说是信息领域发展最快的技术,很多不同领域的专家都从中获得了发展的空间,使得数据挖掘成为企业界讨论的热门话题,随着信息技术的发展,人们采集数据的手段越来越丰富,由此积累的数据日益膨胀,数据量达到GB甚至TB级,而且大数据也成为数据分析主流……【查看全文】
-
大数据环境下衍生出的营销思路或策略
“大数据”的概念距问世已经有39年了,而大数据营销的时代在前几年才得以到来,这种基于数据协同和深度计算的个性化营销正在用其巨大而全面的影响力改变着营销的格局和战略方向。淘宝每天处理数以万计的交易数据,Facebook每天接待40亿访客,在互联网这种领域,……【查看全文】
-
数据分析的流程及分析方法
数据分析是指通过建立审计分析模型对数据进行核对、检查、复算、判断等操作,将被审计单位数据的现实状态与理想状态进行比较,从而发现审计线索,搜集审计证据的过程,在实用中,数据分析可帮助人们作出判断,以便采取适当行动,数据分析的目的是把隐没在看来杂乱无章……【查看全文】
-
大数据时代下的第三方数据公司和甲方公司的差异
现在是一个大数据时代,人人嘴边都挂着数据创造价值、数据挖掘等一些热词。各公司内部也逐渐认识到数据的重要性,纷纷成立数据部门,期待数据可以真正的为业务服务。另外,也有一些专做数据服务的第三方公司不断涌现,希望能帮助产生数据的甲方分担数据分析的担子,挖掘……【查看全文】
分类目录
互联网更多>>
- HTTP与HTTPS的区别 超文本传输协议HTTP协议被用于在Web浏览器和网站服务器之间传递信息,HTTP协议以明文方式发送内容,不提供任何方式……
- 如何开启苹果系统的两步验证机制,避免iCloud帐号遭到攻击 首先,你需要登录至苹果的网页版Apple ID管理系统,你需要点击“管理你的Apple ID”,随后输入帐号密码信息。在登录……
- 如何破解互联网思维的误区 互联网正在成为现代社会真正的基础设施之一,就像电力和道路一样。互联网不仅仅是可以用来提高效率的工具,它……
SEO优化 更多>>
-
什么是长尾关键词?
网站上非目标关键词但也可以带来搜索流量的关…… -
揭秘50+seo操作手法:如何通过关键词
用这个方法的的确可以快速的提高网站权重,而…… -
网络推广专员怎么有计划的做百度知
百度知道在百度搜索引擎上的排名也是非常好的…… -
如何将一个第三方整形网站做到月订
在互联网行业工作也有很多年了,纵观这些年来…… -
关于SEO的100个问题及解答
SEO是搜索引擎优化的意思,通过SEO技术,我们可…… -
解读2013最新版SEO元素周期表
其实SEO元素周期表早在2011年的时候就有首发出来…… -
2017年淘宝天猫的新规变更公示通知
随着时代的变化,网购的人越来越多,而真正的…… -
百度移动搜索引擎医疗健康行业网页
百度搜索综合用户对不同医疗类网页的实际感受……