印奇、唐文斌同场,旷视回应一切!

7月29日,旷视科技举办“始于算法,成于价值”主题年中媒体发布会,CEO印奇、CTO唐文斌首次合体出席,并正面回应外界的关心和疑问。

一开始印奇便提到,今天我是以一位答题者的身份参加本次活动。作为CV领域名声在外的明星企业,旷视的一举一动都备受关注。

印奇、唐文斌同场,旷视回应一切!

去年8月份,旷视冲击AI第一股赴港上市,引起行业震动,结果在新冠疫情、美国实体清单事件、新基建等多重复杂因素下,旷视的上市之路显得颇为坎坷。

与此同时,在这个特殊的时代背景下,AI产业发展也迎来了前所未有的机遇与挑战。今天在本场发布会上,印奇和唐文斌将首度公开回应上市进程,并分享旷视在2020年的战略布局与行业洞察。

上市计划正在筹备中 

“对于上市,我们非常有信心”,印奇在发布会上说到,

“上市是手段不是目的,我们希望通过上市这个公开窗口,向大众展现旷视的综合实力,所以上市计划还在积极筹备中。”

旷视于去年8月25日正式启动赴港上市计划,据招股书显示,旷视估值40亿美元,拟公开发行40000万股,募集资金5至10亿美元。

IPO程序仅启动两个月,10月初便爆发了美国实体名单事件,包含旷视在内的28家中国科技企业被禁止从美企获取技术产品和服务。事件一出,旷视上市进程稍有停摆,但并无大碍。

此外,对于公司业务发展,印奇表示,禁止科技企业间的业务往来,对于名单上的中国企业来说,多多少少都会有一定程度上的影响,但旷视拥有自主研发的算法和引擎,在技术产业链上相对独立性,因此,这种影响可以忽略不计。

值得分享的是,新冠疫过后,AI产业落地迎来了更多应用场景。旷视在此也开拓了一些新的业务路线,例如,今年2月初,旷视在10天内自主研发了红外感知自动测温系统,被广泛部署于地铁站、写字楼等人流密集场所。后来该产品推向海外市场,也收获了一批海外订单。

印奇表示,新冠疫情爆发前期,对AI企业产生了明显冲击,但疫情后,AI落地呈现出深度拥抱各行各业的态势。疫情为AI激发了更大的发展逻辑,AI测温只是一个小的开始,未来我们的衣食住行都会越来越被数字化技术所包容。

印奇、唐文斌同场,旷视回应一切!

另外,今年受疫情影响国内大力提倡新基建,着力发展5G基站、大数据、人工智能、工业互联网等领域,这意味着国内AI技术发展迎来了新机遇,基于此,选择A股上市也不失为一种好的选择。

最后印奇表示,

一切选择还在综合考量中,如果上市,我们的股票必将是稳定且持续增长的。

逃离AI死亡之谷的三大挑战

在经历了几次爆发式增长后,AI产业发展逐渐步入稳定期,或者说是瓶颈期。发布会上,印奇为我们分享了一组技术成熟度曲线(Gartner),可见当前的AI产业现状已陷入“死亡之谷”。

印奇、唐文斌同场,旷视回应一切!

这一阶段,如何去泡沫化,走出产业发展“深水区”,实现技术落地,是企业关注的焦点问题。作为一家估值40亿美元的AI独角兽企业创始人,印奇分享了他的见解与思考。

AI产业落地要跨越三大挑战:算法供给、价值闭环和组织人才,印奇说。

算法如同血液,是基础,是必需品,而当前企业的供给能力还远远不够。AI算法从开发到应用需要经历可交付和规模化两个阶段。

其中,可交付性遵循二八原则,训练占据20%,部署占据80%。可见,部署是关键一环,从目前的规模化生产来看,部署耗费大量的时间成本,却只能够解决不到1%的算法供给需求

因此,解决算法供给问题的关键在于提高可交付性和规模化生产能力。

技术研发的初衷是服务用户。一个成熟的AI产品,必然要考虑它的用户价值、商业价值和可规模化生产的能力。这是从0到1的过程,也是AI产业落地最艰难的过程。

旷视的众多AI产品,同样遵循着这样的研发逻辑。对此,印奇将其概括为三个阶段:

价值验证:具备技术可行性和用户使用价值。

MVP产品:代指最小可行性产品,触达行业客户,检验商业变现能力。

规模应用:提供软硬件一体化服务,规模化生产,推向市场。

 在他看来,这三个是阶段是层级上升,封闭式的价值闭环,同时也是AI产业落地的最大挑战

人才的培养是对于任何产业/行业而言都是至关重要的。AI赋能百业,这是一个复杂的系统,需要完整的人才体系结构来支撑。

提到AI企业,大多数人的印象是公司员工基本为技术研发人员,但是对于打造一款面向行业、面向大众的产品而言,公司配备了解行业知识的人才同样非常重要。

拆开来看,AI产品从研发端到应用端,需要挖掘价值需求、完成技术研发、进行可行性评估,进而推向市场,不同阶段需要不同专业程度的人才。但整个过程AI技术和行业知识始终贯穿其中,并且同等重要。

印奇将这一人才需求体系称为4 in 1结构,凡是一个AI+产业,都需配备CEO(产品经理)、CTO(产品开发)、CAIO(性能评估)、CMO(行业洞察)四种角色。

同时,他强调旷视的人才体系已形成了4:4:2结构,前两者比重相同,分别为技术和行业人才。

印奇、唐文斌同场,旷视回应一切!

最后,印奇将AI产业落地的三个关键总结为:(1)解决算法供给侧的问题是AI企业的责任。(2)只有赛道聚焦才能更快完成价值闭环。(3)打造AI人才和行业人才融合发展的新型组织。

聚焦AloT,践行1+3战略

始于视觉算法,终于物联网(AloT),旷视早已不是一家单纯的人脸识别算法供应商,而一跃成为物联网软硬件一体化解决方案供应商。

在印奇看来,物联网是人工智能技术应用的主要场景,

如果把人工智能比作「大脑」,物联网就是「身体」,二者相结合,能够让世界更加智能化,我们的愿景就是构建连结及赋能百亿物联网设备的人工智能基础设施。

早在2019年初,旷视就已设下以“物联网”为核心的3+1战略布局。

印奇、唐文斌同场,旷视回应一切!

基于自研的Brain++人工智能生产力平台,深度聚焦个人物联网、城市物联网、供应链物联网三大领域,为更多企业提供行业解决方案。

Brain++集算力、算法、数据于一身。其中算法部分来自于深度学习框架天元(MegEngine)。旷视是国内为数不多的自研深度学习框架的企业之一,目前最主流的学习框架要数Google的Tensorflow和Facebook的PyTorch,国内比较知名的是百度的Paddlepaddle和华为的MindSpore。

在此,旷视是唯一一家能够与国内互联网巨头相媲美的AI独角兽企业。

今年3月份,旷视将天元(MegEngine)框架正式开源,所有从业者都可以免费享受这项技术服务。针对一些外界将天元与Tensorflow、PyTorch等主流框架相比较的声音,印奇回应称,

与Tensorflow相比,Brain++是更高维度的东西,比如它更像是Visual Studio,是开发者从一个创意到最后算法交付的端到端产品。目前它还还需要持续的打磨,但Brain++的开源会对行业未来产生积极影响。

此外,本次决定将天元开源是出于多方因素的考虑,为3+1战略模式扩展更多to B客户也是其中一个。

对于2020年下半年的发展规划,唐文斌表示,旷视的业务板块不会再扩张。目前1+3的战略模式已经具备极高的商业价值,三大场景都是万亿级的市场。接下来, 我们会在技术层面和产品层面,融入一些对行业、对客户价值的新的洞察和思考,把1+3战略框架做深入做扎实。

此外,印奇透露今年9月份可能会发布Brain++的1.0版本。同时2021年,旷视也会陆续推出更多AI硬件。比如在手机端融入算法、SDK和IP,创建AI定义的智能模块。在城市领域,用AI重新定义未来的传感器,或者计算范式。在工业领域,打造更加智能化的工业机器人。印奇表示,

随着Brain++和三个大场景的推进,软件和硬件一体化产品会在下半年Q3、Q4涌现。旷视在AI边缘能力上会有越来越多的AI硬件诞生。

长期来看,旷视1+3的战略版图基本不会变,在此基础上,旷视未来会着力打造一个到二个支柱性产业作为立身之本。从目前的财报数据来看,城市物联网或许是最重要的场景之一,其在2019年的营收业务占比超过了七成。

迈向CV+的技术洞察

旷视在2019年初,将公司名称由Face++升级为Megvii,以此对外宣称旷视不在是单一的人脸识别算法公司,而是走向了更加完整的战略模式。可能很多朋友会好奇Mgevii的名称由来,在这里旷视CTO唐文斌,做了一个小分享。

计算机视觉(Computer Vision)技术,定义为“How computers can gain high-level understanding from digital images or videos”

在这里,唐文斌将它简单理解为“大的视觉”,即Meg Vision,那么,缩写来看便成了Megvii旷视。

名字由来并不复杂,不过其背后却有着复杂且完整的技术体系:CV+

以深度学习为支撑的计算机视觉技术如何才能更好地应用?首先要解决的是输入源的问题,高质量的视频/图像作为输入数据,显然会有助于视觉技术的处理,其次,处理之后的输出,能用来做什么?

基于这样的技术洞察,唐文斌提出了以计算机视觉核心、包括计算摄影学,以及视觉反馈控制在内的三大模块,构建了一套完整的CV体系。

印奇、唐文斌同场,旷视回应一切!

计算摄影学:它就像“超级义眼”,通过手机前置摄像头等传感系统捕捉肉眼无法感知到的信息。如相机、单反或者摄像头,它们所摄取的信息分为光、感、知三个系统。

“光”是光学的结构,“感”是光感芯片(CMOS Sensor),“知”即采集一些曝光时长、光谱频率等信息传递给算法。这是传统的摄取方式,旷视要做的是在其中融入AI技术。唐文斌表示,

目前的摄像系统属于单向信息传递,数据之间无交互,我们将通过AI技术打通数据之间的链接,重构光感知系统。

视觉反馈控制:基于视觉认知,调动“眼、脑、手、腿”等全套设备协同运动。如“眼之所见,手之所向”,“脑之所念,手之所动”,在复杂世界中,像人类活动一样,通过视觉判断,完成手、脑一套设备的协调运作。

在供应链场景中,旷视发布的操作系统“河图”,便是这一功能模块的充分体现。

计算机视觉:它以深度学习为核心,具体从算法、系统和数据三个维度来讲,旷视做了很多研发和创新。

算法训练就是深度神经网络,在这方面做得最好的就是OpenAI研发的GPT3,它能通过预训练,与下游任务建立联系,无需微调达到SOTA,是目前NLP领域的最优算法模型。对于神经网络的结构性创新,也是旷视一直在尝试和探索的事情,比如,

  • 成立基础模型组,不做应用研究。最后提出的ShuffleNet、ShuffleNet,实现了低算力下的高训练效率。

  • 将芯片的二进制用于深度神经网络训练,探索极高的性能功耗比。其推出的DorefaNet通过低比特神经网络,实现了性能功耗的明显提升。

  • 利用几千张GPU训练超大“祖母模型”,让算法模型更加规模化。

  • 研发具有自我演化能力的模型(无需监督和标注)

除了基于算法的结构性探索,旷视在系统层面,打造天元MegEngine与Brain++相结合的完整系统,通过工程化创新提升效率。在数据层面,与北京智源研究院共同发布“Objects365”数据集,据了解,它比COO物体检测的数据集还要大16倍。

我们通过该数据集与超大“祖母模型”相结合,尝试探索深度学习的边界,唐文斌表示。

同时,他也强调,基于深度学习的计算机视觉在物体关联度、感知维度和感知精度方面都仍有很大的提升空间。这其中的关键,在于视觉算法的规模化程度,而目前已知的探索极限,将是全面的、城市级的数字孪生。

对话双子星,旷视的回应

提到创办旷视科技,还有一个有意思的小故事。印奇和唐文斌思同在微软实习,某一天他们突发奇想在Iphone4手机上制作了一款小游戏,没想到的是,这款小游戏竟意外的在App store上火了(中国区排第三),更没想到的是,为此还吸引来了一批投资人。于是,旷视就在这样的契机下开始了…

启明创投的创始人邝子平也是旷视的早起投资者之一,他说,以前觉得他们是一群很酷的年轻人在做一件很酷的事,时隔9年之后,感觉依然如此。

印奇、唐文斌同场,旷视回应一切!

今日,为了能够更深入的了解旷视,了解旷视的创始人,邝子平与印奇和唐文斌开启了一场深入又轻松的对话,下面小编将部分内容分享给大家~

问题一:印奇和文斌同为技术出身,在创办旷视的企业管理中,是如何确定分工的?

答:(印)如外界所说,旷视是一家命格清奇的公司,我们的创始人组合并不是最优组合,旷视走到今天背后也有很多偶然契机。我更偏向全局性和战略思考,解决“what”的问题,文斌更侧重技术和产品,擅长解决“How”的问题。但内部实际工作中,并没有严格的划分,很多问题我们都是一起商讨和学习的。

(唐)我认为我们都很聪明,但聪明的点不太一样。同样一个新技术,印奇更擅长Deep learn深入思考,而我更擅长Quick learn快速掌握。这一点我们相互补充,并负责不同属性的的工作。

另外,对于产品问题,我分享一个与第三位创始人杨沐的思考所得。对于产品的定义?他认为是价值的设计者,我觉得非常好,但从AI产品的角度来讲,我认为产品既需要满足客户价值,同样还要满足商业价值,双重价值导向才能设计出一款真正好的AI产品,因此它是双向价值设计者。

问题二:诸如如小区门禁等,视觉技术越来越普及化,很多AI企业都可以实现。旷视作为行业领导者,它技术壁垒是什么? 

答:(唐)它类似于90分和100分的区别,随着技术发展拿下90分可能已经不是什么难事,但要想拿到100分却并不容易。旷视的标准就是100分。

可能有的朋友会问,真的有必要达到100分吗?进入小区、公司能够达到90分已经够用了但视觉技术的应用场景十分丰富,很多行业/场景要求能够达到一个金融级别的安全性。越是需要高精尖技术的场景,价值往往也越大,自动驾驶就是一个很好的例子。

问题三:李开复关认为,“如今,AI壁垒低于行业壁垒,AI从业者学习行业难度要远高于行业者学会AI”,您怎么看?

答:(唐)我认为不一定。行业知识需要的是经验,它需要时间的积累,我最近在学习房屋地面沉降方面的知识,对此深有体会。反过来讲,行业里的人去学AI技术,之前从未接触未必能对它形成深刻的认识。技术本身是童子功,与行业知识相比哪个更容易?还真不一定。

我们在招聘行业人才时,有一个基本要求就是对技术要有信心、有好奇心,有空杯心态。现实中,很多行业里的人要么不相信技术,要么对技术抱有不切实际的幻想,我们二者最好可以能够综合一下,毕竟一个好的AI产品最终还是要回归到交易平衡中去。

问题四:随着AI落地深水区,旷视的友商越来越多,包括AI企业、互联网巨头、传统科技巨头等,请问旷视在技术层面,产业方面有哪些优势?

答:(唐)对于优势的定义是人无我有,人有我优,我认为这个世界上没有什么人无我有,行业里大家都很聪明,只是有人先看到了一些东西。比如,计算机摄影写、比如Brain++,我们先看到,并且踏踏实实地去做了,最终我们成为了这个领域内的优势者。

(印)另外,对于企业竞争问题,首先行业比较碎片化,to B竞争没有to C那么激烈,另外,旷视三大赛道的友商,可能与大家想象的友商越来越不一样。我们通常在深入某个行业后,才发现这个行业里非常优秀的玩家,它可能偏传统,但并不是大家眼中的AI企业。

另外,我们可以看到众多AI公司的风格变得越来越不一样,这很正常,是一种很良性的状态。这是每家公司有自己拿手绝活,他们选的行业不一样,对行业的认知也不一样。对于旷视而言,我们自己内部讲要道路自信,我们很坚定地朝这条路走,越走越觉得这是一种更务实的打法。

问题五:印奇总谈到,AI商业化路径分为三个阶段:价值验证(检验技术可行性、验证产品)、MVP产品(触达用户,完成变现)、规模化生产(软件一体化,推向市场),请问旷视在正处于哪一个阶段,三个阶段最难的是哪一个,是否有出现过失败,或者走不下去的情况?

答:(印)首先,旷视聚焦的三大场景(个人、城市、供应链)涉及不同的领域和行业,不同行业不同的发展阶段,所以很难一概而论。

其次,我认为第一个和第三个阶段最难。第一阶段是完全由创新驱动的过程。一个商人在开拓新业务时,会考虑两方面:一是技术场景,二是商业模式,两者之中必然会有一个是确定的。比如,技术场景是确定,那么可以从商业模式和销售通路上创新,这条路商业化路径也可能走得通。但对于AI产品而言,这两个方面都是不确定性的,要想在两者之间发现交集点,这个难度要占整个链路的50%。

第三个阶段要求AI公司必须构建出非常强的软+硬平台化能力。硬件能力是平台化,硬件从供应链到生产制造到销售需要平台,搭建完之后“软”会变得越来越容易。真正解决第一阶段核心的公司,如果很快构建第二和三步的话,可能会在行业里胜出。

(唐)第三个小问题我来分享一个案例。之前为了增强手机的交互体验,我们做过一款小鸟游戏,用不同的姿势隔空打小鸟,后来这个产品被毙了。我们做一款产品会考虑它的价值增效(Value Add),具体来讲,它是否达到了降本增效,或者提升了用户体验。这款产品听起来比较新奇,但它只是一时的刺激感,成就感和激励才是持续性的东西,所以我们放弃了。

还有一些产品还未发布,是因为目前的技术水平不能达到最佳的降本增效或者用户体验的效果,只要未体现出真正的产品价值,我们就不会公布。

(印)补充:关于产品这个问题,我发现对于技术性或to B业务的公司,节奏感非常重要。比如,旷视早年研发了一款产品,发现不work(起效),但三年后,这款产品在市场上很有Value(价值),自动驾驶就是一个很好的例子。技术性公司产品研发周期长,它节奏是按年来衡量的,如何早个5年、20年,公司发展就很困难了,所以方向很重要,节奏也很重要。

雷锋网小结

旷视成立9年,收获了很多标签,融资快、估值高,CV四小龙,AI独角兽。在这些荣誉背后,可能离不开的是贯穿其中的企业基因:技术信仰、价值务实。

印奇曾用Moonshot来形容他和唐文斌的技术信仰,一帮很聪明的人,做着从没做过的事儿,经过N多年努力,经历了很多的困苦,最后一刻发现把很多东西只往前推了一小步。

如果说技术信仰是一种自我推动力,那么价值务实则体现了旷视,对市场、对用户负责的态度。印奇在会上表示,价值务实是我们的流淌在血液中的基因,能够为用户带来真价值,是每一款AI产品的初衷和目标。

对于未来5年,10年,旷视会成为一家什么样的公司,印奇表示,旷视不会成为一家特别平台化的公司,我们会基于1+3战略,打造几个支柱型产业,作为立身之本。此外,在不同场景和维度中构建不同的“脑”,比如在供应链场景中,Brain++作为大脑,河图作为中脑,未来会在每个设备中开发小脑,打造一套完整的智能化体系为行业赋能。
(雷锋网(公众号:雷锋网)雷锋昂雷锋网)

雷锋网原创文章,未经授权禁止转载。详情见转载须知

印奇、唐文斌同场,旷视回应一切!

(完)