2016年底,亚马逊发布了一款全新的无人超市产品 Amazon Go。在视频中,用户只需用手机登陆亚马逊账户、在进门时通过身份审核,就可实现真正的无人结账,即拿即走,亚马逊将其戏称为Just Walk Out Technology。

虽然Amazon Go最多只有20人的承载量,但已经将自主消费结账系统带到了一个全新的技术高度,背后使用了计算机视觉、传感器融合、深度学习、生物识别等前沿技术。由此引发无人便利店的创业风潮。
淘咖啡真的就来了
7月8日,在第二届淘宝造物节现场,阿里巴巴实验已久的“无人便利店”正式对公众亮相,官方称其为“淘宝会员店”。自从马云提出“新零售”概念以来,阿里巴巴一直希望通过线上线下融合的方式改变传统零售业,无人便利店是第一个真正落地的产品。
这家无人值守商店的名字叫“淘宝会员店”(英文名Taocafe,也就是淘咖啡),在造物节主会场外略微寂寞地站着,从外观看起来跟普通纪念品商店没什么区别。

不过走进去你会发现,它的出口和入口有点特别哦。入口配备了两台扫码机,第一次入店之前,你需要用淘宝扫二维码,出现相关协议,通过之后,就获得了属于自己的二维码。让闸门扫码机扫码之后,相当于告诉商店的系统,你来啦。

在体验无人便利店之前,用户需要签署一个“支付宝免密付款”的协议,即最后的付款流程不需要用户确认。不知不觉中付款动作已经完成,这样才能实现真正的即拿即走。

听蚂蚁金服介绍,看到想要的货,拿起来(甚至还可以放包里),就可以立刻走了。出口是两个隧道一般的门,只要穿过了这条隧道,你的支付宝就会自动扣钱——就是这么不知不觉地剁手了。看看自己的淘宝,你已经消费了;看看自己的支付宝,你已经被扣费了。
支付门里究竟有什么玄机?
据了解,阿里无人店背后的物联网支付技术,是蚂蚁金服技术实验室的研发工程师研发的。这是一个专注于VR、IoT、区块链等前沿技术研发的团队,去年底蚂蚁金服发布的全球首个落地应用的VR支付技术,就出自这个实验室。
曾晓东表示,在识别人和商品上,蚂蚁金服混合使用了计算机视觉和传感器感应,再叠加了一些非配合生物识别技术(“非配合”的意思是在用户无感知的状况下就能完成身份核实),以降低误判率。
虽然技术人员没有太详细透露,但也提到视觉传感器、压力传感器等多种传感器结合,还有用户在店内的整个行为和轨迹都会被捕捉,整个线下的购物流程就被数字化了,客人逛超市最喜欢走哪条路线,哪个货架客流最密集,哪个货架客人停留的时间最长,客流曲线和销售曲线是高度重叠还是有明显反差……商家还可以根据相关数据调整库存和店内的商品摆设。
不过,光靠这个还不够,我们在线下购物,经常会有把货拿到收银台,想想以后还是回头是岸,又放下了,所以出口那个“支付门”是个关键,这个隧道会对你和你卖的商品做最后确认,并完成支付。
首先,进入支付隧道之前,看到门上有个传感器,压低帽檐就不让你进隧道,估计是负责确认你是谁的,识别不出来不让进。
进去之后第一道门会关上,把你锁在里面,柱子上有各种传感器。然后它开始识别商品,注意屏幕上的提示哦。

识别完毕之后,屏幕上就会出现下面这幅让你痛并快乐着的画面,然后你就被放出来了……再一看支付宝与淘宝,剁手已经完毕了。
无人超市之黑科技分析
根据极客公园的分析,这个无人超市可能有以下几项黑科技。
1、骨骼分析
据了解,「淘咖啡」面积 200 平方米,内部压力测试结果显示,同时在店人数 50 人基本没问题。
蚂蚁金服的工程师介绍说,「淘咖啡」在物联网支付方案用的是多模态识别,即计算机视觉叠加传感器感应。
这两项技术方案运用的权重比例,蚂蚁方面没有透露。对此我试着做了一些猜想:
首先,多模态生物识别是指整合或融合两种及两种以上生物识别特征,利用多重生物识别技术的独特优势,这其中就包括了人脸、指纹、虹膜甚至是骨骼分析等方式。通过多种技术+数据分析,能够使认证和识别过程更加精准、安全。
而如果说计算机视觉技术用的权重更大,那么有可能是用了人脸识别+骨骼分析的技术。人脸识别大家都已经比较了解了,手机上也有不少应用都会用到,我们不妨看看为什么可能会有骨骼分析技术吧。
简单来说,骨骼分析就是在摄像头眼中,在超市里走过来走过去的,只是一堆堆骨头,骨头之间再怎么叠加、交叉,基本还是可以被识别出来哪根骨头是谁的,这对于保证多人同时在店购物的识别精准度,起到重要作用。

而之所以推测骨骼分析,不是现阶段较成熟的图像分割技术(即把捕捉对象的边缘分割出来,从而去识别对象的行为),是因为后者存在一个问题,就是当店里人数一多,摄像头就容易抓瞎:假如十几个人同时在抢购同一款商品;或者几个人手交叉着去拿各自想要的商品,对图像分割来说,非常容易出现混乱。

所以,假如「淘咖啡」能够同时允许 50 人在店内活动的话,图像分割技术确实不如骨骼分析来的靠谱,也许就是包括了人脸识别+骨骼分析这两种结合在一起的结果。
2、眼动追踪
在逛「淘咖啡」时,工人还在现场布置天花板上方的摄像头和传感器,根据摄像头数量和摆放位置,我推测「淘咖啡」店还叠加了眼动追踪系统。
「眼动追踪」可能会让一些人想起来当年在三星手机上,那个根据人眼动作来自动浏览手机内容的功能,不过当时那项技术实际使用效果并不如想象中美好,所以后来也在三星的机型中取消了这个功能。
但之所以推测「淘咖啡」会有这样的系统,是因为它可以捕捉两个维度的信息:
一是店内,包括店内的实时热力图:客人最喜欢走哪条路线,哪个货架的客流量最密集,哪个货架人流停留的时间最长,哪个货架比较冷清等等。
第二是用户,比如甜品货架前的客人男女比例如何,平均体型偏胖还是偏瘦;客人站在货架前,眼睛最习惯首先往哪里看(以推算出货架真正的黄金位置)。



评论