阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力

经历了几波低潮，人工智能在近几年迎来了遍地开花。

从围棋打败李世石，到魔兽世界赢了顶级战队，再到DeepFake以假乱真，人工智能可谓出尽风头。

但AI在各行各业真实水平到底如何，恐怕只有资深业内人士才能知晓。

4月30日，阿里巴巴的华先胜在由信息技术新工科产学研联盟主办的人工智能教育线上公开课中介绍了视觉AI在各行各业中的情况。

他提到，其实当前的AI落地面临着三个困境，营收困境，实验与现实的困境，用户需求和成熟技术的困境。由于这三个困境，AI在行业里产生真正的价值还是非常有挑战。

他还提到，衡量AI落地是否成功，关键看其是否起到了画龙点睛的作用，即为用户提供了不可替代的价值。

以下是AI科技评论做的演讲笔记，提取了关键信息与观点，供大家参考。

AI落地的三个困境

阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力
人工智能的产业增速非常快，其中视觉智能占了百分之七八十，从2000年到2016年，全球共有8000多家的视觉人工智能的公司，2000年到2017年，AI相关公司增加了14倍。

仅在2017年，中国就有100多家AI的公司获得了5个B类的USD的融资。今天大量的公司都成立了自己的专门的人工智能的机构，学校里面也出现了人工智能学院。

似乎一切繁荣景象，但实际上真正的AI的落地，AI在行业里产生真正的价值，还是非常有挑战。

阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力

第一个挑战是营收，这是从价值的角度来衡量，衡量技术是否真正解决现实问题，是否为客户、用户带来核心的价值，所以营收指标最关键的一条。

实际上AI确实带来了价值，但是还不足够，从创业公司的角度来看，也有盈利，但是还没有达到我们期望的状态。

还有很多做项目，但项目和产品之间还是有很大的差别，产品可以规模化，但项目很难规模化。也有做API的，但API到底能够产生多少价值，还不好说，所以事情非常残酷。

阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力

第二个困境在于实验室和真实世界之间的差别，可以在实验室把算法测试的非常好，但是拿到真实世界可能表现非常不佳。比如，近几年比较热的人脸重识别，左边是公开测试集的情况，可以看到算法准确率比较高，而在右边，如果人员的服装变了，交通工具变了，那么对算法来说就是非常重大的挑战。

阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力

第三个困境是成熟的技术和用户需求之间的鸿沟非常大，上图是一个客户提的100多个需求，实际上真正能够做到的可能只有20~30个。所以，面对用户高期望的需求，我们今天的技术其实还有很多是不成熟。
那么这也促使我们思考，到底AI技术成功的关键因素是什么？论文很棒？融资很多？还是估值很高？这些当然都是成功的标志，也是非常重要的因素。

但有一点比上面的都重要，那就是有没有产生核心价值？有没有为应用场景、为用户带来核心的不可替代的价值？这个价值可以是锦上添花，也可以是无中生有。

人工智能最关键的一点，是画龙点睛。区别于画龙点须，人工智能让一些事情变得更有价值，更有亮点，能解决过去解决不了的问题，这就是画龙点睛。

视觉AI的重点行业与技术

阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力

除此之外，华先胜还介绍了视觉AI的相关技术，他提到视觉AI的关键行业有7个，分别是城市治理、工业生产、媒体娱乐、医疗健康、零售营销、教育培训以及视频通信。

在智慧城市里面还会有交通、平安、市政、能源、环保等等；工业的场景里边有工业的质检、监控、工艺的优化等等之类；医疗里面可能还有影像的分析、有导航、有养老的监护、疫情的防控等等。

阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力

所以，得益于视觉AI比人类更加高效，各行各业都已经在部署相关平台了。总的来说，涉及到的技术主要大致也包括七个部分：1、视觉理解，通常是计算机视觉相关的；2、编码传输，主要是视频编码；3、重建交互，例如三维成像；4、增强和生成，例如合成图像，合成视频或者是增强视频的质量；5、搜索挖掘，这比较偏视觉大数据，能够把大规模的数据索引起来进行搜索；6、安全评估，比如说一些版权保护、审核等等；7、视频/视觉平台，我们不管是做研发还是做部署，都要有平台城去支撑大规模的研发和大规模的部署。视觉AI的以上7个技术方向，逐渐支撑起了更广泛的应用，人脸识别，物体检测等等技术更是在安防、无人车等领域起着至关重要的作用。

视觉AI支撑的商业落地

阿里华先胜：遍地开花的AI落地，需要画龙点睛的威力华先胜还介绍了基于视觉AI技术的一些案例，主要有基于视觉搜索技术的产品、视觉智造类的产品......
不同于文本搜索引擎，视觉搜索需要描述视觉对象，视觉对象大多数是图像，其由像素组成。所以第一步是处理像素，这涉及到特征学习，即用像素把一幅图变成可以索引的特征。

第二步是大规模索引技术，主要满足在很大的图像视频数据库里搜索想要的东西的需求。

第三步是高精准的搜索，也就是在搜的时候能够快速的响应返回结果。

主要应用的场景是电商领域，例如淘宝上面的拍立淘，通过拍照就能在电商数据库中搜索相似商品。

视觉智造和一般的视觉技术不同，传统的视觉技术是分析、识别、搜索，而视觉智造涉及生成，生成视觉信号，例如阿里巴巴“Alibaba Wood”，能够1分钟内可以制作多达200个商品展示短视频。

例如视频的修复增强，已经在各大视频播放平台使用，一些经典的电影经过视觉AI的修复重新焕发了光彩。这也大大节省了人力成本，一个1.5小时的视频，只要两三两三个小时就可以处理完，如果人工的话，则需要40个小时。

还有一个是视频的植入，修改视频内容，比如在不影响观影体验的情况下，植入广告牌进去。

视觉诊断也是视觉AI的主要运用方向，例如冠状动脉的增强影像的分析，原来需要专业的医生诊断，现在的深度学习方法可以对影像进行准确的分析。另外还有骨科、肺部诊断等等应用。

最后，华先胜总结，人工智能已经进入各行各业，势不可挡，发展非常迅猛，但也有很多的局限。数据产生价值，但并不是把几个东西放在一起炒一炒就能产生价值，最终还是要弄清楚价值是什么。当前AI落地不仅是人脸识别这些热门技术，最主要的要倾向于人力所不能及的事情，即让机器帮助完成人类无法完成的事情。

今天的人工智能方法论，虽然有它不清楚的地方，但在应用领域有很大的空间，需要我们投入大量的人力物力进行研发。

对于传统产业和数字产业，都要拥抱人工智能，对于人工智能从业者来说，也一定要走进应用场景。对于人工智能的商业化而言，最关键的一点就是要创造商业创造不可替代的核心价值，思路可以从锦上添花到画龙点睛再到雪中送炭最后到无中生有循序渐进。

（雷锋网）（雷锋网）（雷锋网(公众号：雷锋网)）

雷锋网原创文章，未经授权禁止转载。详情见转载须知。

（完）