2017全球未来网络发展峰会

创新合作共赢    引领未来发展

当前位置:嘉宾致词> > 分论坛五

《谁在观察谁?基于手机信令的位置研究的利弊与未来》

编辑: 共浏览:420次

大家下午好,非常高兴向大家介绍,我叫chris  carth,我为中国足迹这家公司工作,我们主要是研究手机信令的大数据分析,所以今天我会先给大家介绍一下我们公司以及我们在行业中的工作,以及我们如何运营还有我们在不同科技当中的运用。首先我会给大家介绍一下我们很小,只有70个员工,而且它才上线了一年,智慧足迹刚上线了一年,但是提到这两个名字,一个中国联通,一个telefonica就熟悉了,联通可以说给我们提供了大量的手机用户,而且给我们员工很多的资源,产品资源和硬件、设备支撑、第二个西班牙电信,他的产品主要应用在拉丁美洲的国家,他的产品有很大的用户,这个软件是由智慧足迹,但是在三大洲包括英国、西班牙、还有拉美、德国和巴西都运营。

我们平时在做什么呢?首先给大家看一下左边的这一张PPT,我们用所有的中国联通的基础上的信用,包括我们全天后的手机来源有2G、3G、4G网络上的信条,有超过数10亿条的信令,我们接受这些主动的信令还有被动的信令。但是我们也知道用于一些原信令和我们之间会产生竞争。左边PPT这些信令有主动的信令,激活的信令,我们只是最少给比如说15个人发这种短信,而不是主动发。我们并不放任何个人的信息,因为我们知道大概五六年前的时候我们刚做这行业,我们并不想获取很多个人信息,因为对于我们公司而言,我们并没有选择这么字。因为中国联通特别大,大概代表了整个的人口的20-25%,所以基本上可以说我们是能代表全样本量的。为什么我们要选择未知数据作为我们运营商,因为我们觉得和中国联通合作是有很大的机遇,我有两个理由,第一个就是很说有人说我们这些网络之间的合作在发达国家,人们的手机保有量可以说几乎饱和,比如说像拉丁美洲,但是在拉丁美洲还有非洲的这些国家还有很多的增长量,但是发达国家几乎是饱和了,呈现一种市场收缩的情况。比如说我们用4G的网络,在英国的时候西班牙电信,我们发现和他推出的时候是一样的,我们的客户并不想花钱,所以为了推广这种4G的网络我们花了很多的钱,因此产生和不同运营商之间的竞争,至少在英国推出的时候,我相信我们如何能够提供更多服务可能就是通过降价,因为运营商认为4G5G不大可能带来进一步收益的可能,但是他是一个很好的收入流,并不会侵蚀到运营商其他已有的领域收入,同时也是一个很好的投资机会。当我们这么做的时候我们也意识到,比如说这是一个新产品,它就是大数据里面的产品,我们和新的供应商还有部门合作,让他们知道这个行业非常激动人心,我们通过积累大数据领域的经验,和伙伴形成新的商业合作关系。

那么我们智慧足迹究竟是干什么的?首先它能收集所有联通用户的命名信令,在大数据平台上进行处理,我们有几十亿的记录,比如说所有关于车联网上面的这些信息,大概2千亿的信息都能够在大数据平台上进行处理。第二步既是关于研究的我们有很多的算法,这些算法能够让我们减少不同机站覆盖范围的差异,它并不是限定以某种行业,但是你可以用这种算法使数据去重降噪,如果数据去重的话那就很难阅读,我们每个人比如是你有2G的,同时你也可以用4G的,你可以识别出出行的路径并且划分出  不同的PR的类型,在这么多的海量数据当中,他们可以 如果说过重的话,而没有识别出去的就很难使用,但是算法能够使我们识别出他们意味着什么,以及他们在商业上如何应用。我这里谈的是不同的利益点,我们也意识到,很多的人们他们在做什么,因为他们主要是用这种3G、4G做通勤,通过这种信息,我们的算法能够识别出行的方式和出行的目的。第三点我们能够叠加上很多人口的属性,包括网页浏览信息,比如说哪个年龄人群的人在上网,哪些职业的人在上网,他们对于浏览的网页有那些兴趣。所有的这些能力都给我们很重要的数据,使我们的产品变得成熟。有很多的原因告诉我们为什么不直接使用原始信令,因为它更便宜,而且因为我们也处于很激烈的竞争当中,其中一个原因就是我们获得的原始信令它只是有限的区域,而且获取时间的周期较长,如果你没有这种信令的话,你要花很长的时间获得信令,而当你真的有信令的时候,所有的这些人口信息,人口属性的信息都没有,你需要重新生产出这些信息,它没有叠加出POI或者是路径,网页的浏览信息,运用这些信息会加大难度,同时当你在审查这些数据的时候,他的使用价值是非常有限的,因为不包括连续的2G、3G、4G、主动或者被动的信令,当然这也取决于你的手机只能在2G,3G、4G,就会感觉这个人好象每几分钟就在移动20公里,而实际上原始信令会出现这种情况非常地频繁,每个机站的覆盖情况差别很大,你就需要增长额外成别弥补这些信息空缺的部分。

我们有什么样的突出能力呢,首先我们有热力、出行 方式、人群特征等都展示在这张图上,我们最厉害的能力一个是热力,活动包括出行方式以及出行目的,如果说你选择了旅游模式的话,你开车或者是坐船或者是火车,或者你选择不同的路径,在一个城市里面,人们开车然后到了目的地进行工作,甚至是人们可以思考,正如他们所想象的那样,这种信息,可以说每天接连不断的信息是一种很珍贵的数据。我们和很多媒体进行合作,这些媒体他们出现的商业产品,同时我们也和他们所在的部门有很大的信令,这是我最喜欢的一个案例,不仅因为这个案例在伦敦,也就是我的故乡,同时这张图看上去非常得原始,它告诉我们同行时需求的密度有多大,这个在伦敦的泰晤士河桥上,你可以看到一个红线、蓝线还有绿线显示不同的路,它显示出来在每天不同的时间段,跨江行人的数量,以及来源地和目的地,我们有一个不间断的镜头,每年365天,每小时都在监测,对于伦敦而言,我们有一段 跨江大桥需要维护,所以这个公司希望最大程度的降低对出行人的影响,这是一个很大的通勤项目。所以他们要对于很多基础设施的区域进行关闭,包括关闭大楼、关闭一些火车,右边这个图大家可以看到,伦敦桥,我们可以通过这些智慧足迹看到每段时间出行的时长、出行时间、出行的路径、还有每段出行开始结束的时间、来源地、目的地,这些信息对于公司最大程度降低对出行人的影响是很有帮助的。

大家看看技术层面,我来讲讲就是我们所选用的技术的一些优劣比较,我先从我们手机信令这个角度来讲,那我们有24小时持续不间断的一个样本的获取,它是一个处理算法持续稳定的解决方案。还有就是我们还能够了解到一些不同的人口特征所覆盖的一些人群的特征,那为什么我们在2G、3G、4G当中展开运营呢?因为那些一般都是大的地点,小短途距离的还没有被覆盖到。同样在一些规划公司的工作当中,他们会使用问卷,问卷也算是非常传统的很有效数据的相关技术了,因为这个散发非常容易和便捷,而且确实样本量确实是无法满足的劣势,人力成本比较高,要实现的时间成本比较长。还有一个技术是移动互联网和GPS技术,很自然GPS解决方案就是更加准确的,他们可以做小短途距离的出行数据。那么想看百度或者是腾讯这样的大公司,他们在这个样本量的获取方面是极具优势的,获取的样本量数量也是非常地巨大。我们已经和一些小型的公司聊过,比如说他们更看重的是一些个人化的电子商务的解决方案。所以说你可以发现这个移动互联网和GPS是较多运用于电子商务的一个领域,但是这个信息是断点的,有时候不连续,GPS的有效性和准确性是跟信息的连续性息息相关的,如果你的信息经常简短,对于GPS最后的数据准确性会产生很大的不良影响。还有这种GPS和移动互联网需要用户授权才能采集,那有些可能用户是不愿意进行授权的,那室内探针呢,也就是人们会把这个WIFI放在蜂窝当中,比如是机场、零售店或者是商务中心、商场当中会有,这些劣势就是同样你也需要获准你才可以有权限进行采集,你需要相关方的批准才能部署采集器,而且它没有所谓的人口相关的信息,而且数据的维度也非常有限,所以这几个不同的技术我给大家做的一些优势和劣势的比较,并不是说这些技术每次都是在竞争当中。我的建议就是说与其说竞中取一舍一,倒不如一次使用好几种进行联合技术的一个使用。刚才是到信息的准确性是最重要的,你要对比一下3G、4G、5G的话,他的结合会使得数据更准确,大家知道不同国家的2G、3G、4G可能还有一些不一样。比如是4G蜂窝在城区里面可能是100米以下那GPS这个解决方案可能是在一些小机站,在100、200米之间的,那GPS可能在十米以内,这是位置相关的数据。那与小机站和家庭机可以覆盖的活动,与GPS可以提升准确度,商业不是很明确,5G可以布设更多的室内和室外的小机站,这个技术在接下来的几年发展会提供更优的解决方案。我们知道5G的未来就代表着带宽的不断增加。其实对于这种位置服务,这其实是一个好消息,会有更多的室内和室外的小机站都会布局在5G的宽待网附近,这样的话就会使得位置、相关的服务更加准确。

最后,给大家总结一下,这种蜂窝网络在大数据服务的开发这方面尤其是基于位置的大数据开发有充分的理由进行投资,你要从创收来考虑的话,这些手机运商有充分的理由,和过去的问卷调查的成本高,样本量足够大,数据准确度不够大,原始的信令任何手机的信令大数据服务商都需要大量的投入在大数据处理和分析上,以便产出的数据是清洁和有价值的,基于2G、3G、4G的收集信令样本很大,数据连续不间断,更适合于分析长距离的出行,与GPS和探针的技术连接可以扩展数据的可用性,将来的5G的户使得数据的粒度更细。还有5G的提升将提升数据的粒度和准确性,应该要为此  做准备。