图文报道
<
>

刘欣:汽车其实是一个大件IOT设备

泰伯网 • 2018-06-15

摘要: 我们作为汽车数据化的底盘,帮助我们的合作伙伴在新的出行时代实现商业红利。

刘欣:汽车其实是一个大件IOT设备

6月15日,在WGDC2018大会的开发者星球—AI技术大讲堂上,阿里巴巴AIiOS产品总监刘欣发表了演讲,以下为演讲实录(未经本人确认)。

刘欣:

可能大家以前经常听说过我们有一个操作系统叫做云OS,最近有人问我云OS和AliOS有什么关系,其实是延续过来的,去年我们做了一个整体的品牌升级,把云OS正式更名为AliOS。

大家知道马老师给阿里巴巴有一个愿景,让天下没有难做的生意,我们也提了一个愿景,在现在这个信息化的时代,我们作为汽车数据化的底盘,帮助我们的合作伙伴在新的出行时代实现商业红利。首先是下面的核心系统,中间会有大量的数据,因为现在大家在讲所有的AI其实都是离不开数据的,AI三大元素数据、算法、计算能力,这些我们都是可以在整个操作系统层面考虑的。最上面是出行,因为现在我们主要的聚焦就是在汽车这个领域,汽车是一个强出行相关的,滴滴在这里面也是解决了另外一环,把出行服务化,节省大家的精力和时间。

整个车联网现在是非常火爆的,CES基本变成了另一个车展了,发展趋势里可以看到,汽车整个产业链里,软件的比重是在不断上升的,传统的主机厂也是有这个意识,也拼命的拥抱变化,不管是自己研发还是跟互联网公司合作,都是朝这个方向努力。

我们为什么要从操作系统来做出行?因为阿里对操作系统投入很多年了,我们2010年到现在,几乎是做了八年,我们觉得在面向一个万物互联、面向AI的时代,操作系统是需要有很多新的思路的。刚才我也提到了,在整个环境里,数据对整个的应用越来越重要,刚才提到了很多的算法和深度学习等等,都是需要数据的。我们传统的方式是操作系统本身并不是天然的为在线化的数据同步设计的,所以要做数据统计,比如有第三方的工具提供给大家,AliOS一开始就考虑到了这种场景,所以把数据作为一种天然的能力。

另一个是AI,现在不管是IOT的设备和手机,都有越来越多的传感器、摄象头、语音等等面向算法的应用。对开发者来讲,很多的开发者他们需要从头开始做很多基础的东西,我们觉得一个面向AI的操作系统,应该把这种AI的作为一个基础设施提供出来。交互也是非常重要的,大家可以看到,最近几年,整个智能产品的进化是从以前的纯手机触摸屏到了音响、语音,这是一个大的趋势,我们在车里也是非常重要的一个重交互的场景,因为你在开车的时候,你的双手是不自由的,你的精力也需要专注在路上,不能跟着屏幕看太久,所以整个交互的方式和人在PC以及手机上都是完全不一样的。所以我们在构建一整套的系统里,充分考虑了车的场景下人怎么跟汽车进行交互,用更好的方式,不管是语音、手势、触摸甚至是一个眼神和动作结合在一起,车也可以了解你的意图。

解决这个问题以后,车里面越来越多的内容也随之而来。以前车只是一个驾驶工具,传统的车厂在过去一百年做的事情就是怎么让座椅更舒服,让车更安全好操控,但是随着车的屏幕越来越大,大家对于互联网内容的服务需求期待越来越高,所以我们背靠阿里,希望建立这样的服务生态。

整个来说,我们觉得车也算是一个IOT设备,算是大家可以消费得起最大的IOT,我们更多的智能服务已经都是在云上发生的,端在这里面只是配合,里面很多的行为发生在端上,当它跟云上的所有大数据结合在一起的时候,我们可以提供更智能化的端上的体验。

从我们之前跟车厂合作的结果来看,我们觉得把这样一个操作系统放在车里,确实可以提升品牌价值,我们和上汽合作的车分了很多的版本,其实上汽一开始也不是特别有信心,这种高端联网的车型到底是不是可以卖很大的比例,实际最后的比例是超过了70%,有更多的用户是愿意接受一个有屏幕、有互联网能力更智能化的汽车。销量也是不用说了,这款车自从上市以后每个月几乎两万台的销量,后来不仅仅是RX5这一个车型,现在上汽总共在售的包括荣威,可能有十几款汽车都用了我们的系统。不管是买了车的用户,还是汽车行业的专家,对车整体的体验都是非常认可的。

大家知道阿里也是很大的集团,我们旗下有很多不同的子公司和部门,我们希望通过这样一个操作系统可以把阿里整个生态里面的核心服务整合在一起,你在车里我们是有端上的操作系统,背后有阿里云可以帮助你满足数据的存储、计算。斑马是我们重要的合作伙伴,也是阿里和上汽合资的,面向车厂做更个性化、深入的服务,高德是现在出行行业非常重要的一个玩家,千寻也是阿里巴巴和中兴集团合资的,提供高精尖的解决方案。上面列的这些都是我们已经在售的车型,下面这些,是从整个集团来说已经合作的,不仅是跟AliOS合作的,但是我们都有机会建立更深入的合作。

现在大家都在说汽车的四化,共享化、网联化、电动化、自动驾驶化,这四化本质都指向一个目标,把出行变成一种服务,这就是滴滴在做的,而且做得非常好,因为衣食住行对于人的生活太重要了,所以出行是所有消费微电子或者汽车行业都关注的本质的东西。

所以我们看待出行打了一些标签,叫新出行,我们觉得这里面分为两个层面,一个是新的方式,像Uber、滴滴带给大家的,我在手机客户端叫一个车就可以上去睡觉,然后下车,不用担心付钱的问题,自动就结算的,新体验的角度来讲,刚才也提到了车变得越来越智能,信息也变得越来越复杂,对功能和交互提出很多新的挑战。

现在很多的主机厂在面向出行服务化的过程还是非常上心的,我们可以看到,现在有很多传统的主机厂他们在强调转型。以后我们的主要业务可能就不是单纯的造车卖车了,而是他们觉得既然汽车要变成一种服务,那么他一定要参与进来,滴滴做得非常好,但是对于这些车厂来讲可能是不够的,因为车厂希望可以有一些自己的方式做运营,所以我们会帮助这些车厂或者新的运营玩家解决一些基础的平台性的解决方案。如果你要去做一个业务,你要做很多基础的车辆管理,包括一些运营的管理,我们就给大家提供了。

这个是很基础的东西,了解这个行业的都非常清楚,首先你的车辆要加一个Tbox,通过连网关实现互动等等,要做远程的诊断和用户的管理,还有订单的管理。整个过程可能就分为出行前、出行过程中、出行后,我们现在这里面提出了一个概念叫做车效,你去搭建这样一个平台运营起来是很简单的。如果去类比零售业,大家讲了一个词平效,也就是我租了一个店,很贵,每平方米到底能创造多少的利润,这对于一个商店能不能活下来至关重要。这对滴滴也是一样的,也就是怎么提升效率。我们接触到了很多这样的用户,确实遇到了这个痛点,他买了很多的车做了很多投放,因为车的运营可能成本更高,不像共享单车,共享单车全部到了一个地方,运营的管理人员发现不行了,就派一个人开一辆车,丢到卡车上。但是汽车成本比较高,首先投资就很重,运营的效率如果提不起来,这是致命的,公司可能就活不下去,这非常关键。所以我们围绕整个出行的过程里,怎么去提高他的效率,去分解很多的能力,包括我们和大的出租车市场打通,因为人出行不仅仅是我坐在车上这段时间。整个城市角度来说,其实需要一个统筹,滴滴也是努力的在做这个方向,阿里巴巴也有自己的城市大脑,很多的公众出行数据高德也会参与在里面,阿里云也会参与,这对一个城市整体的交通状况和需求以及对于大家的需求更有判断,包括人、车、停车场、道路等等这些资源的预判,会做一些智能化的调度,这些都反映在我们背后的AI算法里。

同时AI也体现在你坐在车里的状态,你定一辆车,这个车装了摄象头,可以做到人脸识别,知道你是定的这个车,可能走到你面前自动就解锁了。你在车里的时候,我们回到To C的用户体验,新体验就是在这个过程里发声,车也会有越来越多的AI,比如我手置做一些操作,或者AR导航的技术,现在其实很多的量产车已经出来了。比如驾驶疲劳检测,还有小的创意,车的后排也可以装摄象头,不仅对于运营公司的管理是有价值的,对于用户也是有价值的。比如你定了一辆车,这个车里到底什么状况,你可以提前看一下。

今天早晨我听广播的时候还听到有人抱怨,用某一个平台租了一辆车,上车以后发现这个车没有安全带,只能是退掉了,那个钱已经扣了,可能你把东西放到后座,下车的时候忘掉了,车门已经锁了,这个时候如果我们有全车智能AI的技术,我们是可以知道这个车原来是什么样,你放了什么东西进去,下车的时候如果不小心遗漏了物品我可以提前提醒你。

刚才我说了,其实AliOS还叫云OS的时候,我们怎么体现云在OS里面的定义呢?因为大家谈到互联网,现在就会觉得打开手机要下载一个APP,所有的服务都是通过APP完成的,其实以前不是这样的,只是大家现在接受了这种形态。如果早十年,大家想到上网,我打开我的笔记本电脑或者台式机、打开一个浏览器、输入网址,打开搜索引擎搜索我要的东西。现在经过了十年的发展,移动互联网已经成为大家生活的一部分,甚至成为人的另一个器官,所以这个概念已经根深蒂固了。也就是为什么AliOS以前在手机上做的很艰难,就是因为大家这种形式是很难打破的,但是我们讲的这个概念,当内容越来越多,信息越来越爆炸,我们提供给用户的信息应该是降低维度的,信息的维度越低,大家接受起来越容易。举例子大家就明白了,地图很难操作,地图是二三维的及很多人看地图都看不懂,信息流是一维的,对用户来说操作非常简单,你只需要看,不需要思考,朋友圈、新浪微博和抖音其实都是这种。我们在车里面想做的其实是一样的思路,不一定是用新的方式,因为内容多了,你一定不能去做一个很复杂的多级菜单。我们也不觉得你在车上需要提前下载一百多个APP,其实你在手机上很多的软件都不会点,你在开车的时候,可能连软件都看不清,所以在车里面我们想打造的真正体验是你忘掉APP的概念,就告诉汽车现在我想听谁的歌,我想去什么地方,你帮我看一下中关村是不是堵车,车就可以把这些智能的内容回答给大家。

大家都做地图,我们在车上做的地图有什么不同?我们的客服也不是APP,是一个桌面,这是我们在发布RX5这个车的时候就提出了,它对操作系统的影响是什么?比如以前你做了一个地图的开放平台,不管是百度、高德,你都做了SDK和VIEW,当应用的开发者想用的时候,他自己做一个页面,把地图的VIEW嵌入地图里。但是车上不是这样的,地图作为一个桌面永远存在,而应用是长在地图上的,所以这是一个关键的改变,车的屏幕变得越来越大,所以这些应用也许是一段纯语音,也许是一个卡片,也许有一些复杂的界面,但是都可以通过一些API跟地图产生互动,这个是我们想去讲述的。这是具体的案例,都是在地图的基础之上作为拓展应用或者说一个插件存在的,这个是我们把这些能力开放给我们的合作伙伴和第三方开发者的,以及独立的应用或者服务的经营商。

刚才也提到了车会变得越来越智能,智能对大家的影响就是上面这些,VUI做得语音的交互现在越来越重要,其实我们现在还在提一个新的概念,叫做VGUI,是AliOS希望把语音和UI整合多模态互动的能力,下沉到操作系统,变成一个很基础的能力。举例子,如果用过国内的或者国外的SDK语音提供商,大家是很头疼的,说话你对于语音有什么样的能力,接口什么样,怎么跟你自己的应用做整合是很头疼的,你需要很多学习的成本,开发成本也非常高,AliOS我们自己重新设计了一套多模态交互的框架,我们叫做云应用的框架,这个框架天然的是为语音优化的,支持一些基本的交互方式,你只需要按照传统的去写纯GOI的方式,只需要字简单的标注,你写的这些应用天然具备了语音的交互能力,到时候我们会把这些相应的文档放到网站上。

除了语音,图象识别也非常重要,刚才说到了,在车里面你的双手是被禁锢的,所以你在车里面需要借助一切的方式,比如头的姿态,HUD现在越来越重要。阿里巴巴也投资了一家非常先进的做HUD的公司叫威瑞,目前来说它是我看到的激光投影解决方案里效果和性能最好的,并且体积也是最小的,所以我们后面也会跟威瑞继续合作,把真正的HUD和AR的体验放在车里。

车的智能离不开感知,感知离不开传感器,现在车里面本身的传感器越来越多,传统的汽车供应商有一些很经典的,大家可以知道像博世之类的,比如有倒车雷达等等。但是我们觉得这些是一个纯基于传感器的进场感知,车内的感知基于摄象头和其他的传感器,是很重要的一个点,车外的感知,像激光雷达、摄象头、毫米波雷达等等。

云上感知是什么?我们觉得其实这个跟滴滴在用大数据解决问题是一样的,这些数据回来以后有很多的共性,现在高速公路也在不断的发展,大家在说自动驾驶的时候,路是很重要的,车路要协同。大家都说V2V、V2X,我们觉得所有的合在一起形成一整套车内、车外再到云上基于数据的整体感知,它会让我们对于整个车内不管是应用的体验还是安全度,都是可以提高的。现在国内的V2X标准也在逐步的制定,比方说我走在一个路上,我怎么知道旁边那辆车是什么样的习惯,是菜鸟还是老司机,但是将来所有的数据可能给整合在一起,你的车是可以感知到一些不可见的威胁。

中间我们构建一个服务层,就是基于所有的交互和感知以外,我们去做场景化的服务。我们发现买了我们车子的用户,很多都是上班通勤的,人在上班通勤的过程里,因为我对路很熟,不需要导航,但是我每天从回龙观出来,到底走什么路我不知道,因为每天路况不一样。所以我们的车会学习用户自己的习惯,平时他怎么开车,都去哪儿,都会走什么路,我们在结合高德的实时路况,我会去做一些预判,你在出门之前可能就在家里告诉天猫经理,帮我给车热一下,当你坐在车里,车里也会有相应的信息提示,告诉你今天上班应该怎么选择。

轻服务,是我们去APP化,把车内的应用变得更容易分发,可以用语音获取,展现形式也不引进传统的UI,可能是语音与UI,也许是仪表盘和HUD信息的组合。当你主动去发出一个请求它给你回应,这是一种方式,还有一种是让服务主动找你。因为当你停车接近加油站或者进到一个商场或者去了一个旅游景点的时候,你在车里面需要的信息一定是不一样的,也许是需要帮你推荐一个餐厅,也许是帮你找到一个停车场,也许是帮你自动完成加油和付费的服务。这些都是通过我们背后的场景引擎,可以去知道现在用户处于什么样的场景,你可以通过这些场景把你的服务复盘出来。

这是一个示意图,假定以后我们整个前挡玻璃的信息都是可以展现的,这里面想讲的几个概念就是,第一,它是通过AI和数据来做一些场景化的预判,给你一些云上的服务;第二,它的交互方式是希望可以让你更聚焦在驾驶本身,因为我们现在虽然阿里也在做无人驾驶,AliOS目前的使命还是在漫长过渡的阶段里,怎么去帮助驾驶者更轻松的完成他在路上的这一段时间。你可以释放双手和你的时间,帮助大家赢回丢失掉的时间,这个是我们希望可以做到的AR效果。今年我们跟上汽会发一款带AR的车,之前做过PR了,大家关心的话,可能看过一段视频。但是现在的视频可以看到车的硬件是有妥协的,因为时间的关系,今年来不及去把激光投影HUD放到车里,所以我们把AR转移到了仪表盘,去做了另一种AR展现的形式,至少基本满足我们AR想要带给用户体验的期望。

数据是增强的,当你坐在车里看外面世界的时候,你是需要更多信息的,因为人比不过机器,人走路、跑步速度并不快,但你在车里,车提高了你行动的速度,扩大了你行动的范围,但是人对于外界环境认知的能力没有进化得那么快,传感器也就是帮你看到肉眼可以看到的东西,所以当你在车里的时候,你是需要整个车变成孙悟空翻一个筋斗,告诉你前方发生了什么,当数据融合以后,包括V2V、V2X以后,可能就告诉里这个拐弯的地方发生了一个车祸,或者这个地方有一个大车,你要注意避让,这个是我们希望在车里最终打造整体的体验。

刚才说了这么多,基本是围绕新出行,行前、行中、行后,打造一整套的方案,作为操作系统,我们肯定知道不可能所有的服务都自己做,一定是跟合作厂商,我们操作系统还是提供基础能力和基础设施。

所以到现在,大家都在说汽车现在正在经历类似手机从以前的机型到智能手机的转型,汽车也会完成这个阶段,汽车是开发者的新机会,现在的移动开发者都是以前从PC转过来的。未来两三年,我们估计几乎80%、90%新的车都会是联网智能的,这会是个巨大的新机会,一定可以催生出一些新的场景下、新的设备下伟大的公司和服务。

新的机会,分为三点,我刚才都说到了,第一个,新交互方式。解决语音和更多的人工智能新的交互方式,一定会带来一些软件设计思路和实现方式的改变;第二个,分发的方式。以前你是需要去提前把应用放到应用商店让用户下载,现在我们觉得在车上是不行的,因为大量新的场景催生了,车有越来越新的硬件和更多的传感器,所以在车里你一定可以作出跟手机和家里不一样的应用,一定有很多新的可能性。

得出一个大胆的结论,因为我接触了国内外大量的厂商,看了很多新的产品,我明显感觉到现在汽车智联网系统,中国已经走在了世界的前列,是领跑者,这个是非常意外的。现在来看整个互联网的发展,中国和美国已经势均力敌了,如果把Top10的互联网公司排出来,中国几乎占了一半,在汽车上,我觉得未来两三年会是爆发的阶段,中国一定可以走在前面,这个是我们民族感觉到的趋势。

最后一件事,刚才说了那么多服务开发者和开发的可能性,我们准备在今年的云栖大会举办AliOS的开发者大赛,大家可以关注云栖大会的官网,这个是阿里巴巴集团和阿里云举办的年度盛会,会集结阿里集团所有的技术、产品线,是年度的发布大会。

张弦:AI技术打造复杂场景下更懂你的智慧地图

泰伯网 • 2018-06-15

摘要: AI技术打造复杂场景下更懂你的智慧地图。

张弦:AI技术打造复杂场景下更懂你的智慧地图

开发者星球—AI技术大讲堂

时间:2018年6月15日上午

主持人:欢迎大家来到WGDC2018开发者星球论坛,今天我们会围绕AI技术讨论,这是一个公开课,嘉宾演讲时间差不多45分钟左右,下面有请滴滴出行地图事业部总经理张弦,他分享题目是AI技术打造复杂场景下更懂你的智慧地图。

张弦:

谢谢各位同学、各位同行的到来,也感谢泰伯邀请,今天还是分享一下地图在出行这个复杂场景下的挑战和它的一些解决方法。有些挑战可能是我们难以想象的。这么来说,在解决挑战的时候,我们用了非常多的方法,我们更多把对这个事情的认知思考和结合分享给大家,这个过程我们就知道遇到类似的场景时候应该怎么做,少走一些弯路。涉及具体的技术是非常复杂的,公式特别多,今天我们就少讲,更多讲方向性的东西和结果以及背后怎么思考的。

我在这个行业做了十几年,同一段工作经历是做传统PDA导航,这个时候觉得用户对地图要求挺高的,感觉车厂对地图要求也很高,后来做了互联网地图,就是现在流行的BAT地图。因为是免费的,似乎互联网做这个事情的时候也不是特别严肃,似乎它的品质要求不是那么高,实际进去以后发现在这个场景下用户对地图的服务品质要求特别高。因为他更容易发表意见,发表的意见更多,他的用户群体更多。一个车机一天或者一年很少发表反馈,但是地图发表抱怨的频率和能力特别强,所以我们经常被各种挑战。因为有了挑战和压力,才有动力做好。

现在又投身于出行的地图,其实发现出行的地图对自驾导航要求又提升一个大的台阶。因为每一次出行都是一个交易,都是一个付费型的,这里面有任何一个差错,用户和司机对它的容忍度很低,收钱你就得服务好,对服务的理解度也很低,会产生一些纠纷和矛盾。应对这些矛盾的时候,地图又开始进化了,这里面有巨大的变化。

中间有一个表,我归纳了一些核心场景的变化,最后发现随着业务场景变化的时候,我们地图的技术、应用、用户价值在发生剧烈的变化,我们怎么把知识沉淀下来分享出去,是我们愿意做的事情。

下一个时代地图的挑战是什么?可能是无人驾驶。我们现在隐约感觉,无人驾驶的地图和我们现在心中规划的高精度地图是玩法有巨大区别的,可能是质变。可能不只是地图的精度提高了,也可能不只是它的对象更加丰富,关系更加复杂,可能生产、制作、更新、存储和服务方式会发生剧烈的变化,所以容错率也是有数量级的提升。每一个变化都是时代变化,正是因为这个时代催生了我们对技术和产品的认知。

滴滴本身我就不介绍了,除了这个图,我们还在这个图添加了外卖业务,我们做外卖业务发现运送人会比运盒饭更难,因为人有情绪,会表达,有肢体动作,盒饭是没有的,所以盒饭运起来比较容易。

滴滴未来的使命,一个是在出行领域,继续做打车网约车、单车以及拓展到国际化;第二点,向汽车运营商发展,比如汽车定制、充电;第三个是智慧交通,通过技术的手段优化服务、优化道路、红绿灯、基础设施。我们在上面做了实践,通过优化红绿灯和车道,通过优化点功能效益都有15%到20%的提升,某些路口可以达到30%的提升,现在整个交通治理处于非技术的状态,如果可以充分用上技术的手段,交通能力会大幅度的提升,可以简单理解为道路网络是一个生产线,是一个流水线,这个流水线的能力现在还属于很蛮荒的阶段。

地图在出行起到什么样的作用?有几个简单的场景,我们后面会分享一下这些场景背后的挑战和一些基本的解决方案。第一点,定位和上车点,看着是非常小的功能,但是对于用户价值非常大,这一个功能让整个通话率减少了30%,其实每一次通话都很痛苦的。

下面这个是推荐目的地,光这一点让用户的输入次数减少了40%,有很多的时候他是不需要输入就命中了。C是推荐加检索的页面,ABC构成了特别简单的发单过程,我们现在有70%的订单不需要输入任何一个字母就可以发出去,或者只需要输入三到四个字就可以完成订单,这背后运用了复杂的技术手段不断的解决问题。所以有些时候产品越简单技术越复杂,如果产品越复杂,就是技术没有做好。

D点,我们有一个预估价,它不是结算价,结算价是按实际走的距离和时间算的,我们首先预测这个订单所走的里程和这个订单的时间,以及这个订单的低速时长和高速时长、夜间时长,每个时长定价都不一样,这个时候是没有复杂的技术问题,我们后面会讲我们怎么来处理这种技术问题,怎么让这个偏差从20%降到13%以内,这也是一个艰苦的工作。

E点,你可以看到司机在哪来接你,光这点我们让整体取消率降低了2%,要把司机位置信息实时同步给云端,再同步给乘客,再加上司机手机的网络定位的能力,还是很复杂的,真正把功能做好,我们是花了大量的时间调试版本。

F点,这个是推荐的路线,有一部分用户可以用了,正在准备扩大流量,看到路线的时候,你可以对行走路线更加确定,或者干预路线,让乘客心里更加放心。

在司机阶段,提供接驾服务,提供送客导航服务,可以让司机反馈对于地图的错误,最右边这个图还反映出实际上我们心目中想象的GPS轨迹是一秒一个,很完美的线型结构,可是我们经常说的大量轨迹是右边的这种,可能在平时我们的订单比例不低于8%,刚才这个案例是比较严重的,这个案例不低于3%,这个时候人肉眼也无法辨别怎么走,这个情况你该怎么计费?给的信号精度还特别高,这个是不是可信?处理的时候非常复杂,我们最初用SIM模型,现在用了深度模型和特征输入,让这个司机预测道路怎么走,因为这个不能预测错了,跟钱直接相关,处理的时候背后有十个团队,一直在迭代这个功能。

除了刚才说的我们可见的司机端和乘客端直接的体验,背后更是一个复杂的系统,每天要支持三千万单的交易,因为交易是一个放大效应,每天请求的次数可能达到700、800亿次,每天请求的路径计算有400亿次,每天请求的检索和推荐次数也有数十亿次,这对系统整个工程要求特别高,所以我们支持分单,现在所有在线的车,可能是全国范围内有三四百万辆,这个时间发的订单有几万个,不断的求矩阵的相关性,每一个相关性有巨大的计算维度,比如时间、距离、费用,还有等待时长、司机的服务分和乘客服务分,还有安全指标安全系数,比如司机从A到B点以后,你必须做最大化的资源调度分配,这个时候地图就起到了极为关键的作用。

当用户在抱怨地图的时候,用户在抱怨什么?我们经常说用户的抱怨,这些东西来自于我们的公单的统计,滴滴每天会收到五十万个投诉电话,地图也要收到几千个投诉电话,投诉的第一个是路线,比如绕路,就这一点来说,我们想象中这似乎是一个技术问题,其实很多的时候50%是司机和乘客个人的行为,比如他选择回龙观,就无法给一个准确的路线。

主观认知,他对这个路线熟悉的时候,他不认可你另一条陌生的路线,如果他对你的路线不认可,他会有不安全感,这是主观的印象。还有主观的印象,交通规则的错误率,交通限行等等,这些变化率特别高。有些指标比较吓人,交通规则的错误率相当高,高到让我自己都很惊讶的地步。

用户会说你的导航不准,或者说你的卡住了,也有这个问题,但是卡住的问题有50%来自当时的GPS信号缺失,就这一段时间没有GPS信号所以就卡,但是这个问题就是我们技术要解决的,我们要用IMO手段解决这个问题。还有路网的错误率,定位不准,这些问题都是我们在日常中天天面临和面对的问题,正是这样,我们团队每天都在做最高优先级的事情解决这些问题。

和通用的个人导航相比,共同的地方相同的地方和特有的地方,我们简单总结了一下。定位方面,出发之前我们是不是不需要特别关心自己定位的起点,因为车开过来,走一走就可以了,但是对于出行来说,我们要先确定非常准确的上车点,要让司机和乘客非常好碰面,比如我们在国际会议中心,确定东南西北停车对司机来说驾驶是非常难的事情,选择好了,就是一个电话,选择的不好,可能就要打好多的电话还不一定搞定,所以我们要搞清楚这个地方能不能停车,有没有摄象头、警察、是不是单行道、有没有绿化带,不能停在这里堵上后面的乘客,偏航判断是个人导航了常用的功能,但是滴滴来说,我们要把不靠谱的点还原到真实路线上,让计费准。选择路线的时候,个人导航更多考虑怎么停车,对滴滴来说要考虑乘客在哪里下车,下车的地方有没有摄象头,是不是会把别的路堵上。我们面临这种问题的时候,除了要解决地图通用的问题,还要面临很多数据的缺失,比如现在我们不知道路可不可以停车,也不知道这个路是不是单行,一个车道会堵后面的车,这些东西都是我们通过各种的手段建立特殊工程,来把数据补齐。

在导航的时候,需要考虑到订单和订单之间连续的接送,连续的导航产生的导航体验和个人导航是有非常大的不同,在做躲避拥堵的时候,这是一个常用功能,但是滴滴上,这个功能对于预估价是很重要的,还有一口价,从A到B说是十块钱就是十块钱,不能多收,所以估多了就对乘客不利,少了自己就会有损失,怎么做得很准?这是非常难的一个事情。

在路径计算的时候,我们现在面对的需求可能还是每秒百万级的QPS,每次计算的时候要十个毫秒给出准确的批量路线,我们个人导航领域,每一次QPS一百多毫秒就可以了,但是你的计算资源太多了,怎么解决这个问题?而且是多业务模型快速的拼车和专车,优化模型都不一样。

正是因为右侧的这些不同的地方,推动了我们把整个的技术、应用、数据往上一层一层的推进,最终让地图有一个变化。

面临的挑战,这是商业行为,每一个订单都是一笔钱,所以你要非常严肃的对待每一公里、每一分钟、每一块钱,不允许错的,各位是滴滴的用户可能对这个也很在意,不过技术的手段还没有做出来,还要好几年才能逼近这个目标。

对地图来说,交通规则的错误率,在行业中不是很小的数据,是比较大的,我们第一步是要做到哪怕是1%的错误率,每天受到数十万订单,实际上是远大于1%的数字,我们怎么让错误减少?不是说只是减少错误,而是怎么在成本下降的情况下,把品质提高一百倍,这是很难的事情。现在我们也做了很多的实践和很多的改进。好处是我们每做一次优化都会有一个商业价值,虚拟号码我们是要付钱的,每个月号码保护的费用我们一个月是一千多万,每个电话少打一次就几分钱,如果每个订单司机和乘客少通话、少犯错、少走一个路口,每个订单节省一分钟,就变成了产能,产能转化为产值还是有一些过程的。

我们第一个,非常关注用户价值的层面,为用户创造价值,让用户少打电话,计费准确,接驾很有确定性和安全感,让司机工作效益更高,让司机工作压力更低,这就是我们很在意的用户价值,只不过现在我们做得好多东西跟用户最终的心理需求有相当大的距离,现在我们正在缩小和弥补这些距离。

实践过程我们怎么解决问题?除了充分的运用行业里的积累,道路的交通规则和路况UGC,我们还用交易行为、驾驶行为,比如左转右转都是驾驶行为,司机和乘客对于我们反馈,每天电话还有直接APP反馈有数十万次,基于新的技术,我们行业里经常用的算法我们是一直用的,而且起到非常关键的作用,我们也在充分对大数据进行数据挖掘和机器学习的算法使用,不是像AI技术是万能的,某些场景还需要靠我们行业之中的积累,比如客户端的开发、数据流的开发、工程,还是要靠行业的积累,但是在有些可以被模型化的地方,结合行业积累的特征,就可以做非常好的提升。

人才结构也有很大的变化,有40%地图行业、30%计算机、30%机器学习,形成了整个地图新的玩法和认知巨大的变化,为整个出行服务提高了效率和提高体验,出席的行程日志又反馈给地图系统,所以我们一方面在用行业的地图积累,一方面用很多自己特有的数据,像交易数据,这两个数据的体量是对半开,起到非常重要的作用。

基于大数据,每天订单量有三千万单,产生的数据日志非常多,路径计算有四百亿次,导航也会有数千万次,导航产生的各种左转右转、语音提示、司机偏航行为、刹车行为也会有数亿次,这些数据的数列集是非常大的。

除了数据大,更多是怎么用这些数据产生价值,最下层的地图生态,我们非常关注行业里获得数据,从司机和乘客角度获得司机和乘客的驾驶行为和反馈,与政府合作获得数据,这些数据源都是非常宝贵的,发现整个行业数据孤岛现象还是很严重的,数据非常割裂,标准化很差,质量也不是特别完美,我们在上面做很多的工作来提升数据生态的丰富度,利用数据生态结合我们行业中的积累,做大量的清洗和自动化工作,对定位的指南、POI、道路网、轨迹流还有很多的ID特征进行特征化和数据清洗工作,现在我们滴滴常用的POI错误率已经做到小于0.5%,但是还不够,我们目标是做到万分之一。还有交通规则,通过交通规则的挖掘和反馈,可以把交通规则的错误率降低一半,但是仍然不够。

在此之上是对数据价值充分使用和挖掘,定位检索推荐和路径规划,在这个时候,AI技术在里面发挥得比较充分。最上层是可以对业务的接驾分单进行非常好的支持。

具体的实践经验,比如现在我们通过行车记录仪采集很多的图象,这些图象可以通过计算机视觉识别这些可停车的标志,比如说马路牙子刷黄线,禁止停车,是不是有网格线,有禁停标志,是不是有摄象头,你要知道中国这么大的城市,这么复杂的道路结构,以低成本快速的方式覆盖,就是极端复杂的难题。

我们推荐上车点的时候,需要考虑这个乘客是否可以抵达,因为我们也出现过把上车点推荐到封闭道路上,因为我不知道这里是封闭道路,也不知道这里放了一个铁栅栏,因为中国的基建速度非常快,我们也是用行车记录仪去分析中间是不是有割裂带和铁栅栏,来通过这个让用户的上车体验更加安全和可靠。

现在我们部署了数万台行车记录仪,可以保证在我们现在的重点城市,每个星期把50%的道路扫一遍,可以保证每个月把80%的道路扫一遍,我们通过自动化的图象汲取技术,像交通规则、割裂带、禁停标识,可以批量化的提取出来,形成新的数据图层,再给上层模型。上次我们去上海,很多的道路刷了黄线,法规上绝对不允许停车,判断标准很简单,只要你停就罚,但是面临一个很大的问题,如果这个街都不让停车,那到底停到哪里?我前后走了五百米都不让停车,实际情况是司机和警察在玩猫捉老鼠的游戏,如果警察开车你也可以停,但是如果警察停电动车你是不敢停车的,现实情况复杂性,也是让我们做得不太好的一个因素。

基于司机和乘客的驾驶行为我们可以发现道路的变化,我们发现一群司机走到这里的时候,按照我们的预期目标走,他应该到蓝线,但是到蓝线他就偏航,我们就会发现有猫腻,然后人工检查一下,发现道路修路,就临时改道,这些技术大幅度提升了我们对缺陷的发现能力和改进能力。

时间估算来说,基于行业的积累,我们在15年的时候,时间偏差还是比较大的,20%以上,15年下半年实现了基于简单的机器模型,还是比较简单的特征,它的偏差一下子降低了五个点,接下来我们做的是使用了上千万的数据特征进行训练,又降低到了13%,春节前我们实现了基于深度模型,让偏差降低到了11%,这可能是行业乃至全球最好的表现,我们现在用智能学习的方式尝试让时间偏差做得更好,滴滴对时间偏差要求特别高,因为涉及到分单,既要考虑距离还要考虑时间,只是我们现在做得不是特别好,因为有的时候预测不是那么准,所以有的时候会分给你看起来比较近,实际比较堵车的,还有的时候可能周边有那一辆车,也没有别的办法。ETA对于用户估价也是有非常重要的作用。

路径规划上,我们也是对路径规划的算法基于MAE做很多的改造,比如对于整个结果集的排序可以显著增强路线的合理性,通过躲避拥堵模型提升躲避拥堵,还有通过偏航模型来躲避偏航,预估价在全国可以达到20%的降低,分单表现为距离有1%到2%的降低。

检索是一个地图行业最常用的功能,我们也是通过不断的深度学习的优化,让我们在平均3.5个字输入情况有95%的点击率,可能你输入三个字,你想要的地址就在里面,可以很好的完全发单使命,并且我们把这个技术能力放到了葡萄牙语搜索和繁体搜索等等,因为现在搜索也在面临国际化。

前面说的是一些挑战和认知,以及一些实践的经验,2018年我们继续做的事情还是提高服务的确定性,服务的质量来自确定性,来自方差,很多的时候我们跟用户说接你就十分钟,大家就认了,但是这次一分钟,下次十分钟,大家觉得很难受,更多的是让重大偏差的概率降低,让预估异常率降低,让困难接驾比例降低,现在可能要打60秒以上的电话,他的上车偏差点回答道2%以上,但是10%就会给大家造成比较不好的印象,也许降低到1%的时候,我们的答卷才勉强可以合格和满意,这条路还很长。

在乘客体验这块是提高服务确定性,在另外一端提高服务效率,让交易效率更高,让频车的时候可以拼的更多,跑得更快,让用户的发单转化率何以更高,取消率降低。

现在我们自己有很多艰难的课题,这些课题是我们自己解决着很难的,我们也在一直寻求合作,现在也和三个以上的重点实验室在进行课题的合作,滴滴有数十个课题在进行合作,今天我们也开放了几个课题,第一个,欢迎各位可以找我们合作,也欢迎学生同学到滴滴实习,去应对这些挑战。

第一个,面对合作的时候我们提供城市级的数据集,是非常庞大的,可能在行业里从来没有这么大的数据集,而且是真实的交易场景,数据量即使压缩以后都有50G,我们面临的问题是路线评估方法,因为路线好不好,很多的时候是没有标准的,好和坏既受客观的影响,也受主观的影响,道路是不是交通规则错误,是不是拥堵和绕远,受到很多主观因素的影响,比如他对路是不是很熟,心里是不是有默认的认知,这个时候做评价方法是比较难的,我们希望可以找到一种让社会广泛认可的路线评价方法,这个方法对我们做目标函数的优化是比较重要的。

第二个,道路权值挖掘,现在行业最常用的道路权值是道路等级和公路等级,还有车道数,还有速度,但是这些值往往不够细致和精确,我们会聚到这条小路,发现挤进去,出不来,数据上不知道哪个小路,有的时候还发现这个路非常颠簸,是一段土路,但是就是这段土路就可以省三到五公里,这就涉及到评价标准,有些城中村晚上走的时候就非常方便和非常快的过了,但是如果白天一个自行车都堵几分钟,这个问题的解决对我们来说真的是很大的挑战,我们一个是没有精力,还有一个是也没有办法做得很好,我们希望行业中有一些合作者。

还有室内定位研究,现在手机定位也不是那么靠谱,经常街区都弄错,我们也希望用上室内所有的信号,充分利用手机的各种传感器提高定位的准确度,五比如咱们在会议中心,如下可以推荐出南北门对用户是很好的,我们希望得到行业指点。

第三个,大规模的室内场景构建,室外场景的构建,还是可以做得,因为现在行业的积累对于室外场景用技术的特征,还是比较丰富的,构建了三维模型,我们看展柜的时候看到很多的三维层次的模型,构建的还是比较容易的,因为特征特别多,特别丰富,室内场景,像我们这样的建筑,其实这种计算机在寻找特征的时候,能力是很差的,机场和火车站识别能力特别差,可能整个平面上可以提供的有效点非常有限,这对三维组建和图片识别是非常有挑战的,但是人眼的角度你可以发现大量的特征信息,比如有很多的几何信息,点、线、圆柱、面,如果可以做成很多的特征,它用来对三维重建是非常有好处的,这块也是我们现在面临的难题,我们希望可以为用户从你现在出门开始到你上车提供一个非常好的实时的虚拟的体验,让你的整个上车过程是有一个非常自然流畅的过程,不是完全稀里糊涂的状态,像北京南站,我自己走过十次以上,但是每次去北京南站我自己都觉得是一个无比痛苦的过程,因为不知道从哪出去,反正先稀里糊涂走到大街上再想办法,因为光看北门出,走着走着北门就不见了,出去以后发现是在地下室,还上不去,或者上去以后发现在楼下,我们城市在发展,技术也在发展,我们希望通过技术的手段可以给用户更好的指引,让他的生活更加简便。

如果对于我们的开放课题有兴趣,欢迎访问我们的数据开放计划,可以跟我们取得联系,也可以获得我们开放的数据集,现在这个数据集在国内已经向上百家的数据科研机构提供了,而且我们的数据集是经过我们管理单位认可和授权的数据集。

联系我们
CONTACT US

赞助参展

郭女士

010-62101808-610

guozj@taibo.cn

票务咨询

李先生

010-62101808-629

lijie@taibo.cn

媒体合作

宁女士

010-62101808-618

ningmin@taibo.cn

会议地址

国家会议中心

总机:+86 10 8437 3300

电话:400 698 2008

关注泰小伯

拉你加入WGDC交流群