百度迁徙图的大数据是如何做出来的?
对于像我这样一年才回一次老家的同龄人来说,在2015年的新年到来之际,免不了要参加一些同学聚会之类的,大家一见面就对自己过去一年的经历侃侃而谈,聊着聊着就聊到了百度迁徙图,一些同学知道我是研究互联网的,就问我百度迁徙图到底是怎么做出来的?百度迁徙图的数据真的准吗?
这一问也使我发现原来我也有我好多不明白的地方,这也激发了我这个技术宅的兴趣,我到处找资料研究终于知道了百度迁徙图的基本原理,后来想想肯定也有很多博友不知道这背后的原理及百度迁徙图的大数据是如何做出来的?所以我就在马海祥博客上跟大家分享出来做个科普吧!
1、为什么会有地理定位技术?
一谈到为什么会有定位技术,可能很多人的第一反应是认为这个发明就是为了让自己看地图找餐馆或某个场所更加的方便,但事实却相距甚远。
现在我们从源头来讲,为什么我们会有地理定位技术?
其实最早的定位系统是来自美国国防部50年代的军备竞赛,当时苏联在1957年发射了Sputnik-1人造卫星,而美国不甘示弱,1958年,为了实现军事上的高精确打击,美国海军开始研制子午仪卫星定位系统。
1973年美国建立国防导航卫星系统DNSS,此后DNSS改名为Navstar即授时和测距导航卫星或者说是全球定位系统(Navigation Signal Timing and Ranging/Global Positioning System),后来简称GPS,1994年,终于完成覆盖全球98%的卫星系统。
从军备竞赛到全面民用这和互联网的发展有相似之处,互联网的前生就是为了防止遭到苏联的核打击后被摧毁重要中心节点导致全面瘫痪,进而建立起的去中心化网络,这个意外的军事发明也在随后被民间大量普及。
所以,一切都是意外啊,这个发明真的不是用来给你找餐馆的。
2、百度如何做定位的?
百度、苹果和谷歌是不是只用GPS定位呢?错了,因为民用GPS的定位误差大,没有军用GPS定位准确,而科技公司不可能发射高精度卫星,只能退而求其次,除了用GPS定位以外,还会用其他办法为用户做到更精确的定位,下面马海祥就开始介绍百度定位时用到的方法。
百度地图定位用到的主流方法:
(1)、GPS定位,主要用于室外导航。
(2)、IP定位,这在PC时代一直都在用,比如以前用QQ外挂的时候可以看到对方在那座城市和网吧,就是用的IP定位技术,但是IP定位有个弱点就是范围不是太精确,只能定位到街道级别。
(3)、基站定位,用户用2G、3G和4G网络都是要经过运营商基站的,那么通过获得用户所使用的基站位置,判断用户位置,定位半径精确范围是265米左右。
(4)、WIFI定位,WIFI定位是最为精准的,因为WIFI的强度半径相比于其他来说都最小,当然这里的WIFI指的是大商场或者咖啡厅的wifi,通过这些公用WIFI就能相当精准的收集到信息,定位半径精确范围是35米左右。
(5)、混合定位,就是将上述定位方法全部混合,定位半径精确范围是60米左右。
基于以上定位方法,使用大数据相关技术才能实现比较精确的定位。
例如,一个用户既连着WIFI又连着基站的4G,那么百度就可以根据该WIFI在和基站在数据库中的空间坐标以及他们的辐射半径来计算出更精确的位置范围,百度还会根据用户连接基站时移动中的信号强弱变化确定用户位置,计算起来相当复杂。
上面谈的都是如何更精确定位的技术,现在谈下如何为用户提供决策方案的技术。
百度通过收集大量用户在某些地段移动的设备、速度进而来判断某个路段的交通拥堵情况,这就是百度地图的“实时路况”功能,而百度导航又会根据“实时路况”为用户提供出行最优解决方案,当然,目前除了为个人出行提供决策方案以外,已经在为交通部的道路规划提供决策支持。
3、百度迁徙的数据从哪里来?
好了,现在再谈最后一个问题了,有了这样的技术后,百度迁徙的数据是从哪里来的?
数据来源一:地图用户
凡是使用百度地图的用户,百度就可以收集到对应数据,根据CNNIC发布的《2013-2014年中国移动互联网调查研究报告》,2014年8月百度地图占领地图市场的63.7%的用户,这也就是说百度能够收集到绝对多数的移动互联网用户的出行数据。
数据来源二:第三方应用
很多手机应用都是需要地理定位的,比如天气应用,再比如同城类应用,而普通开发者一般是没有强大定位技术的,只能借助于第三方开放定位技术平台,在国内做的最好的两家也就是百度地图开放平台和高德地图开放平台,而选择百度地图开放平台的应用,只要用户使用该应用,百度就能获得更多的数据。
目前墨迹天气和百信网用的就是百度地图的开放技术,还有更多安装了百度地图的应用百度就能收集数据。
这两个数据源就是百度最主要的数据统计来源,目前百度已与交通部有深入合作,预计后期会有可能来自交通部更加精确的数据。
最后,百度用这些定位数据的变化在春节期间做出了很?的“百度迁徙图”。
马海祥博客点评:
百度迁徙图非常有意思,我们看到的是一个最后呈现的完整数据图,但是在这背后确有十分复杂的高精尖技术做支撑,远比我们想象中的复杂,同时我们也看到地理定位技术最先发源于军事,最后又由于移动时代的商业发展诉求得到了更为深入的发展,所以顺着这次百度迁徙我们也再次看到了驱动技术发展的本质—恐惧与欲望。
本文发布于马海祥博客文章,如想转载,请注明原文网址摘自于http://www.mahaixiang.cn/sjfx/1081.html,注明出处;否则,禁止转载;谢谢配合!上一篇:如何将数据挖掘技术应用到客户内在需求管理
下一篇:企业营销数据分析的方法及策略
您可能还会对以下这些文章感兴趣!
-
分析解读数据的真正目的是什么?
最近我在马海祥博客上新开了一个数据分析专栏,主要是通过平时的一些数据解析来合理科学的提高网站的各项指标的。可能一说到数据,可能就会立马让人想到是数字、图表、模型、方程等容易让人怯步的词语。其实做数据分析的真正目的和意义,是躲在背后的那些人。 在营销学……【查看全文】
-
零基础学习数据地图的制作与分析
有时在实际工作中会碰到这种情况,即数据与地名有关,这时虽然也能用Excel的图表来表现,但如果能将数据和地图结合起来,将会收到更加好的效果,应用地图来分析和展示与位置相关的数据,要比在Excel中单纯的数字更为明确和直观,让人一目了然,数据地图就是解决此类问题……【查看全文】
-
如何以客户为中心进行数据挖掘与分析
数据挖掘与分析可以说是信息领域发展最快的技术,很多不同领域的专家都从中获得了发展的空间,使得数据挖掘成为企业界讨论的热门话题,随着信息技术的发展,人们采集数据的手段越来越丰富,由此积累的数据日益膨胀,数据量达到GB甚至TB级,而且大数据也成为数据分析主流……【查看全文】
-
解读2014年中国移动互联网用户行为洞察研究报告
2014中国移动互联网用户行为洞察报告旨在协助行业上下游相关人士了解用户行为的最新动向,全面透析用户的媒体使用习惯、新媒体使用方式、对移动广告的接受程度以及移动广告如何影响用户的购买决策。更多移动互联网用户将手机作为他们首选或唯一的上网工具。……【查看全文】
-
大数据时代下的第三方数据公司和甲方公司的差异
现在是一个大数据时代,人人嘴边都挂着数据创造价值、数据挖掘等一些热词。各公司内部也逐渐认识到数据的重要性,纷纷成立数据部门,期待数据可以真正的为业务服务。另外,也有一些专做数据服务的第三方公司不断涌现,希望能帮助产生数据的甲方分担数据分析的担子,挖掘……【查看全文】
-
分类型数据可视化的操作方法及案例分析
在当前互联网,各种数据可视化图表层出不穷,本文尝试对数据可视化的方法进行归纳,数据可视化可以将海量数据通过图形、表格等形式直观反映给大众,降低数据读取门槛,可以让企业通过形象化方式对自身产品进行营销。数据可视化技术的基本思想,是将数据库中每一个数据项……【查看全文】
-
大数据环境下衍生出的营销思路或策略
“大数据”的概念距问世已经有39年了,而大数据营销的时代在前几年才得以到来,这种基于数据协同和深度计算的个性化营销正在用其巨大而全面的影响力改变着营销的格局和战略方向。淘宝每天处理数以万计的交易数据,Facebook每天接待40亿访客,在互联网这种领域,……【查看全文】
-
数据分析的流程及分析方法
数据分析是指通过建立审计分析模型对数据进行核对、检查、复算、判断等操作,将被审计单位数据的现实状态与理想状态进行比较,从而发现审计线索,搜集审计证据的过程,在实用中,数据分析可帮助人们作出判断,以便采取适当行动,数据分析的目的是把隐没在看来杂乱无章……【查看全文】
-
关于用户调研数据分析中常见的一些误区
近期和一些做用户研究的人员进行了交流,发现很多做这个行业的人都对自己所做的工作有些迷茫,报告写了很多,数据也分析了很多,但是却感觉对产品的实际运营帮助不大,甚至分析出来的结果和实际情况比偏差很大。其实用户研究并不是一个新兴的领域,在很多传统行业,用户……【查看全文】
-
预测2020年数据中心行业发展的10个趋势分析
岁末年初正是对未来一年数据中心行业发展进行预测的时候,人们将会看到一些事情的到来:云计算的兴起、SSD硬盘的发展,以及其他问题,例如许多企业将业务从云平台遣返回到内部部署数据中心。而专家对数据中心行业的预测可能偶尔会带来一些惊喜。随着大数据行业和技术的发展,企业需要改善内部部署数据中心和云计算资源之间的平衡,在服务器上采用人工智能技术,并努力有效地管理数据蔓延。行业媒体通常会对未来一年进行预测,像往常一……【查看全文】
分类目录
互联网更多>>
- HTTP与HTTPS的区别 超文本传输协议HTTP协议被用于在Web浏览器和网站服务器之间传递信息,HTTP协议以明文方式发送内容,不提供任何方式……
- 如何破解互联网思维的误区 互联网正在成为现代社会真正的基础设施之一,就像电力和道路一样。互联网不仅仅是可以用来提高效率的工具,它……
- 如何开启苹果系统的两步验证机制,避免iCloud帐号遭到攻击 首先,你需要登录至苹果的网页版Apple ID管理系统,你需要点击“管理你的Apple ID”,随后输入帐号密码信息。在登录……
SEO优化 更多>>
-
揭秘50+seo操作手法:如何通过关键词
用这个方法的的确可以快速的提高网站权重,而…… -
如何将一个第三方整形网站做到月订
在互联网行业工作也有很多年了,纵观这些年来…… -
2017年淘宝天猫的新规变更公示通知
随着时代的变化,网购的人越来越多,而真正的…… -
关于SEO的100个问题及解答
SEO是搜索引擎优化的意思,通过SEO技术,我们可…… -
解读2013最新版SEO元素周期表
其实SEO元素周期表早在2011年的时候就有首发出来…… -
百度移动搜索引擎医疗健康行业网页
百度搜索综合用户对不同医疗类网页的实际感受…… -
网络推广专员怎么有计划的做百度知
百度知道在百度搜索引擎上的排名也是非常好的…… -
什么是长尾关键词?
网站上非目标关键词但也可以带来搜索流量的关……