分类型数据可视化的操作方法及案例分析
在当前互联网,各种数据可视化图表层出不穷,本文尝试对数据可视化的方法进行归纳,数据可视化可以将海量数据通过图形、表格等形式直观反映给大众,降低数据读取门槛,可以让企业通过形象化方式对自身产品进行营销。
数据可视化技术的基本思想,是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。
一、数据可视化原理
数据化可视原理是综合运用计算机图形学、图像、人机交互等技术,将采集或模拟的数据映射为可识别的图形、图像、视频或者动画,并允许用户对数据进行交互分析的理论方法和技术。
数据可视化可以将不可见的现象转换为可见的图形符号,并从中发现规律从而获取知识。
在实际应用中,它可以针对复杂和大规模的数据,还原增强数据中的全局结构和具体细节。
二、可视化方法
1、数据采集:数据是可视化对象,可以通过仪器采样,调查记录、模拟计算等方式采集。在可视化解决方案中,了解数据来源采集方法和数据属性,才能有的放矢解决问题。
2、数据处理和变换:原始数据含有噪音和误差同时数据模式和特征往往被隐藏。通过去噪、数据清洗、提取特征等变换为用户可理解模式(具体可查看马海祥博客《如何将数据挖掘技术应用到客户内在需求管理》的相关介绍)。
3、可视化映射(核心):将数据的数值、空间坐标、不同位置数据间的联系等映射为可视化视觉通道的不同元素如标记、位置、形状、大小和颜色等。最终让用户通过可视化洞察数据和数据背后隐含的现象和规律。
4、用户感知:用户感知从数据可视化结果中提取信息、知识和灵感。数据可视化可用于从数据中探索新的假设,也可严重相关假设与数据是否吻合,还可帮助专家向公众展示数据中的信息。
用户感知可以在任何时期反作用于数据的采集、处理变换以及映射过程中,如上图所示。
三、数据可视化的具体操作
讲了数据可视化的原理和方法,接下来,我就为大家讲一讲数据可视化的具体操作,简单来说,有以下6个要点:
1、将指标值图形化
一个指标值就是一个数据,将数据的大小以图形的方式表现。比如用柱形图的长度或高度表现数据大小,这也是最常用的可视化形式。
传统的柱形图、饼图有可能会带来审美疲劳,可尝试从图形的视觉样式上进行一些创新,常用的方法就是将图形与指标的含义关联起来。
比如Google Zeitgeist在展现top10的搜索词时,展示的就是“搜索”形状的柱形,图形与指标的含义相吻合,同时也做了立体的视觉变化。
2、将指标图形化
一般用在与指标含义相近的 icon 来表现,使用场景也比较多,如下:
3、将指标关系图形化
当存在多个指标时,为了挖掘指标之间的关系并将其进行图形化表达,可提升图表的可视化深度,常见有以下两种方式:
(1)、借助已有的场景来表现
联想自然或社会中有无场景与指标关系类似,然后借助此场景来表现。
比如百度统计流量研究院操作系统的分布(上图),首先分为windows、mac还有其他操作系统,windows 又包含xp、2003、7等多种子系统。
宇宙星系中也有类似的关系:宇宙中有很多星系,我们最为熟悉的是太阳系,太阳系中又包括各个行星。根据这种关系联想,图表整体借用宇宙星系的场景,将熟知的Windows比喻成太阳系,将XP、Window7等系统比喻成太阳系中的行星,将Mac和其他系统比喻成其他星系。
(2)、构建场景来表现
指标之间往往具有一些关联特征,如从简单到复杂、从低级到高级、从前到后等等。如无法找到已存在的对应场景,也可构建场景。
比如:百度统计流量研究院中的学历分布:指标分别是小学、初中、高中、本科等等。
各个类目之间是一种阶梯式的关系,因此,平台就设计了一个阶梯式的图直观的反映出了数据呈阶梯式递进的趋势。
再比如:支付宝年初出的个人年度账单中,在描述付款最多的三项时设计了一个类似颁奖台的样式也很出彩:(然而并没有觉得我在哪个类目买买买付款最多有什么骄傲的)
下方图示为供参考的线性化过程,实际可视化思考中,将哪类元素进行图形化或者图形化前后的顺序可能均有不同,需根据具体情况处理。
4、将时间和空间可视化
数据可视化方法总体上可分为两种,一种是将时间维切片,然后将三维数据转换为多面板的时间序列进行显示;第二种是将空间维的变量压缩成一维变量与时间维一起进行可视化。
在此,我就从时间和空间的角度上简单的说一下:
(1)、时间
通过时间的维度来查看指标值的变化情况,一般通过增加时间轴的形式,也就是常见的趋势图。
(2)、空间
当图表存在地域信息并且需要突出表现的时候,可用地图将空间可视化,地图作为主背景呈现所有信息点。
Google Zeitgeist在2010和2012年的年度热门回顾中,都是以地图为主要载体(同时也结合了时间),来呈现热门事件。
5、将数据进行概念转换
先看下生活中的概念转换,当我们需要喝水时,通常会说给我来杯水而不是给我来500ml的水。要注意来(一)杯水,是具象的,并不是用量化的数据来形容。在这里,500ml就是一个具体的数据,但是它难以被感知,所以用(一)杯的概念来转换。
同样在数据可视化,有时需要对数据进行概念转换,这是为了加深用户对数据的感知,常用方法有对比和比喻。
感知就是一个将数据由抽象转化为具象的过程。
(1)、对比
比如下图就是一个介绍中国烟民数量的图表:
如果只看左半部分中国烟民的数量:32000000(个十百千万十万百万千万亿…)好吧数据量级很大,不论是数零还是数逗号都很容易数错,而且具体这个数字有多大仍然很难感知。让我们目光向右移动,来看右半部分:中国烟民数量超过了美国人口总和,太恐怖了,这样一对比,对数据的感知就加深了。
(2)、比喻
下图是一个介绍雅虎邮箱处理数据量大小的图表,大概就是说它每小时处理的电子邮件有近1.2TB,相当于644245094张打印的纸。
上面这个翻译很无聊是不是,但这并不是问题的重点,这个数它到底有多大呢? 文案中用了一个比喻的手法:大意就是将这些邮件打印出来首尾相连可以绕地球4圈。嗯,比香飘飘奶瓶还多3圈。到这里,我相信大家肯定能初步感受到雅虎邮箱每天处理的数据量有多大了吧,而且还没有被打印出来,为地球节省了很多纸(假装环保)。
6、让图表“动”起来
数据图形化完成后,可结合实际情况,将其变为动态化和可操控性的图表,用户在操控过程中能更好地感知数据的变化过程,提升体验。
实现动态化通常以下两种方式:交互和动画。
(1)、交互
交互包括鼠标浮动、点击、多图表时的联动响应等等(具体可查看马海祥博客《交互设计是什么》的相关介绍)。下面是百度统计流量研究院的时间分布图,该分布图采用左图右表的联动形式,左图中鼠标浮动则显示对应数据,点击则可以切换选择:
(2)、动画
动画包括入场动画、交互过程的动画和播放动画等等。
入场动画:即在页面载入后,给图表一个“生长”的过程,取代“数据载入中”这样的提示文字。
交互动画:用户发生交互行为后,通过动画形式给以及时反馈。
播放动画:通俗的来说就是提供播放功能,让用户能够完整看到数据随时间变化的过程。
上图是Gapminder在描述多维数据时,提供随时间播放的功能,可以直观感受到所有数据的变化。
四、案例分析
案例:360“骗子地图”
简介:360依托12亿终端设备作为支撑,利用海量的数据分析能力,推出了基于互联网安全的产品“骗子地图”。用户只要点击进入“骗子地图”的链接或按钮,即可直观的在上面看到全国各地的被拦截电话以及骚扰电话的分布以及地区排行榜。同时右侧还有由用户上传的“骗术揭秘”,不仅能看到实实在在的数据,还能学到更多的防骗技巧。
1、案例流程
数据采集:360借助其5亿PC端用户和7亿移动端用户的海量装机量,结合360网盾对钓鱼网站的实时监控拦截数据和手机卫士拦截的诈骗电话等数据结合,将枯燥的数据进行翻译、梳理并展现为用户可以感知的数据。
2、数据处理和变换
实时性:拦截数量实时变换,直观反映各地的拦截情况。
图形化:将数据可视化为“钓鱼“形象的图标,背景用中国地图,通过图标的闪烁反映各省市自治区、直辖市的钓鱼网站拦截情况,直观,便捷。通过不同颜色标注诈骗类型:金融、网购、虚假信息等。
个性化:针对用户在不同时期的关注点不同,“骗子地图”也推出了不同的策略方针。如在春节期间,由于人流量扩大,用户的出行需求增加,相应的假机票、车票的钓鱼网站量增加明显,针对这种情况,在这段时间内,360加大了对假机票、车票网站的拦截及处理,保证用户的出行安全。
3、可视化映射
①、通过闪烁的图标表示数量和频率,闪烁频率高,亮度大的地区发生诈骗的概率大。
②、右侧配合排行榜,列出数据和地区,直观反映排名靠前的省份以及其诈骗频率,弥补了图标无法显示数据的缺点。
4、用户感知
“骗子地图”的核心理念是为了增强用户对网络安全的意识,提升用户的防骗意识,让用户在网络虚拟世界中用最现实的资料和例子了解到安全的重要性。实时为用户呈现各种基于大数据的可视化数据图,更有相关的“防骗技巧”帮助用户了解安全的重要性。
5、小结
360“骗子地图”的可视化的一些经验:
①、海量用户数据:由于多年提供免费杀毒服务的经验使得360拥有可观的用户数量这为其数据的准确性提供了不错的支持
②、技术先进性:其自身研发的360网盾能够很好的对诈骗行为进行识别,对于诈骗数据的准确性筛选提供了保障。
个人的一些想法:
虽然不清楚360这个公司靠什么盈利,但这个项目就短期来看应该不会被撤销。所以,在“骗子地图”目前的基础上,挖掘用户“为何被骗”的痛点。例如可以对用户进行诈骗提醒,进而可以推广自己的产品和服务,我认为这个才是360这个项目未来的发展方向。
另外在形象化图标和界面上应该再做改进,图标+数据排行的模式很不错,更加方便用户在数量上有清楚的认识。
马海祥博客点评:
数据可视化可以将海量数据通过图形、表格等形式直观反映给大众,降低数据读取门槛,可以让企业通过形象化方式对自身产品进行营销。同时,目前有很多专门进行数据可视化包装服务的企业,如IBM等企业。
数据可视化具备比较广阔的前景,对企业内部的管理也有其独有的贡献。
本文发布于马海祥博客文章,如想转载,请注明原文网址摘自于http://www.mahaixiang.cn/sjfx/1654.html,注明出处;否则,禁止转载;谢谢配合!上一篇:常见的数据分析基本思路及手法
下一篇:用户调研的操作步骤及过程
您可能还会对以下这些文章感兴趣!
-
分类型数据可视化的操作方法及案例分析
在当前互联网,各种数据可视化图表层出不穷,本文尝试对数据可视化的方法进行归纳,数据可视化可以将海量数据通过图形、表格等形式直观反映给大众,降低数据读取门槛,可以让企业通过形象化方式对自身产品进行营销。数据可视化技术的基本思想,是将数据库中每一个数据项……【查看全文】
-
数据分析的流程及分析方法
数据分析是指通过建立审计分析模型对数据进行核对、检查、复算、判断等操作,将被审计单位数据的现实状态与理想状态进行比较,从而发现审计线索,搜集审计证据的过程,在实用中,数据分析可帮助人们作出判断,以便采取适当行动,数据分析的目的是把隐没在看来杂乱无章……【查看全文】
-
关于用户调研数据分析中常见的一些误区
近期和一些做用户研究的人员进行了交流,发现很多做这个行业的人都对自己所做的工作有些迷茫,报告写了很多,数据也分析了很多,但是却感觉对产品的实际运营帮助不大,甚至分析出来的结果和实际情况比偏差很大。其实用户研究并不是一个新兴的领域,在很多传统行业,用户……【查看全文】
-
零基础学习数据地图的制作与分析
有时在实际工作中会碰到这种情况,即数据与地名有关,这时虽然也能用Excel的图表来表现,但如果能将数据和地图结合起来,将会收到更加好的效果,应用地图来分析和展示与位置相关的数据,要比在Excel中单纯的数字更为明确和直观,让人一目了然,数据地图就是解决此类问题……【查看全文】
-
预测2020年数据中心行业发展的10个趋势分析
岁末年初正是对未来一年数据中心行业发展进行预测的时候,人们将会看到一些事情的到来:云计算的兴起、SSD硬盘的发展,以及其他问题,例如许多企业将业务从云平台遣返回到内部部署数据中心。而专家对数据中心行业的预测可能偶尔会带来一些惊喜。随着大数据行业和技术的发展,企业需要改善内部部署数据中心和云计算资源之间的平衡,在服务器上采用人工智能技术,并努力有效地管理数据蔓延。行业媒体通常会对未来一年进行预测,像往常一……【查看全文】
-
如何以客户为中心进行数据挖掘与分析
数据挖掘与分析可以说是信息领域发展最快的技术,很多不同领域的专家都从中获得了发展的空间,使得数据挖掘成为企业界讨论的热门话题,随着信息技术的发展,人们采集数据的手段越来越丰富,由此积累的数据日益膨胀,数据量达到GB甚至TB级,而且大数据也成为数据分析主流……【查看全文】
-
分析解读数据的真正目的是什么?
最近我在马海祥博客上新开了一个数据分析专栏,主要是通过平时的一些数据解析来合理科学的提高网站的各项指标的。可能一说到数据,可能就会立马让人想到是数字、图表、模型、方程等容易让人怯步的词语。其实做数据分析的真正目的和意义,是躲在背后的那些人。 在营销学……【查看全文】
-
解读2014年中国移动互联网用户行为洞察研究报告
2014中国移动互联网用户行为洞察报告旨在协助行业上下游相关人士了解用户行为的最新动向,全面透析用户的媒体使用习惯、新媒体使用方式、对移动广告的接受程度以及移动广告如何影响用户的购买决策。更多移动互联网用户将手机作为他们首选或唯一的上网工具。……【查看全文】
-
大数据环境下衍生出的营销思路或策略
“大数据”的概念距问世已经有39年了,而大数据营销的时代在前几年才得以到来,这种基于数据协同和深度计算的个性化营销正在用其巨大而全面的影响力改变着营销的格局和战略方向。淘宝每天处理数以万计的交易数据,Facebook每天接待40亿访客,在互联网这种领域,……【查看全文】
-
大数据时代下的第三方数据公司和甲方公司的差异
现在是一个大数据时代,人人嘴边都挂着数据创造价值、数据挖掘等一些热词。各公司内部也逐渐认识到数据的重要性,纷纷成立数据部门,期待数据可以真正的为业务服务。另外,也有一些专做数据服务的第三方公司不断涌现,希望能帮助产生数据的甲方分担数据分析的担子,挖掘……【查看全文】
分类目录
互联网更多>>
- 如何开启苹果系统的两步验证机制,避免iCloud帐号遭到攻击 首先,你需要登录至苹果的网页版Apple ID管理系统,你需要点击“管理你的Apple ID”,随后输入帐号密码信息。在登录……
- HTTP与HTTPS的区别 超文本传输协议HTTP协议被用于在Web浏览器和网站服务器之间传递信息,HTTP协议以明文方式发送内容,不提供任何方式……
- 如何破解互联网思维的误区 互联网正在成为现代社会真正的基础设施之一,就像电力和道路一样。互联网不仅仅是可以用来提高效率的工具,它……
SEO优化 更多>>
-
揭秘50+seo操作手法:如何通过关键词
用这个方法的的确可以快速的提高网站权重,而…… -
2017年淘宝天猫的新规变更公示通知
随着时代的变化,网购的人越来越多,而真正的…… -
如何将一个第三方整形网站做到月订
在互联网行业工作也有很多年了,纵观这些年来…… -
百度移动搜索引擎医疗健康行业网页
百度搜索综合用户对不同医疗类网页的实际感受…… -
关于SEO的100个问题及解答
SEO是搜索引擎优化的意思,通过SEO技术,我们可…… -
什么是长尾关键词?
网站上非目标关键词但也可以带来搜索流量的关…… -
网络推广专员怎么有计划的做百度知
百度知道在百度搜索引擎上的排名也是非常好的…… -
解读2013最新版SEO元素周期表
其实SEO元素周期表早在2011年的时候就有首发出来……