文 | 王刚
出品 | 雷锋网产业组
“在亚马逊,有一种说法是Day one(第一天)。而机器学习(Machine Learning)也毫无疑问是处在它的第一天。”
AWS副总裁Swami Sivasubramanian(斯瓦米·西瓦苏布拉曼尼)这样表达他对于机器学习广袤市场空间的看法。
他给雷锋网打了个比方:现如今的机器学习有点像我们刚睡醒需要喝杯咖啡的时刻,处于一天中的清晨。但即使在这么早的阶段,机器学习领域就已经出现了非常多的创新了,而且这些创新不光来自于那些实力非常雄厚的大公司,同时也来自于初创企业。假以时日,机器学习将成为所有应用的必备成分。
同时,随着今年4月中国区正式上线了机器学习服务Amazon SageMaker,AWS带给中国客户的技术能力边界再度扩大。
资料显示,SageMaker是AWS CEO Andy Jassy在2017年的AWS re:Invent大会上发布的,一经推出,就得到了热烈响应,成为应用开发领域的一支新力量,目前已在全球拥有了上万家客户。
据雷锋网了解,截止目前,AWS已经推出了三个层次的机器学习云服务,包括:AI服务、ML服务、ML框架和基础架构。
AI服务:比如,文本转语音:Amazon Polly、语音转文本:Amazon Transcribe、从文档中提取文本和数据:Amazon Textract、推荐引擎:Amazon Personalize等;
ML服务:Amazon SageMaker;
ML框架和基础架构: 集成了主流框架的机器学习镜像、GPU和CPU计算资源、集成FPGA甚至推理芯片的计算资源等。
Swami谈到,作为AWS人工智能和机器学习领域的负责人,他在AWS已经工作15年,他所在部门的使命就是把机器学习的能力赋予日常工作中普通的开发者和数据科学家使用。
据悉,此前,他曾任AWS的NoSQL数据库总经理,兼管大数据业务。多年来,Swami先生对大数据、人工智能领域始终保持着极高的热情。
在刚刚落幕的上海世界人工智能大会上,Swami就以视频演讲的形式“布道”了AWS的机器学习。
而借此契机,我们在Swami演讲后与其展开了一次对话,听到了更多关于机器学习落地中国的进展以及在新冠肺炎疫情中他对于机器学习发展的深度思考。
平台意识:AWS做云梯,创新企业聚焦业务
访谈中,Swami非常强调平台公司和初创企业的分工。
他认为,整个社会在转型,因此,当我们谈到人工智能和机器学习的时候,不光只是从研究、开发的角度去看待,他觉得其实更重要的,是能够让开发人员和数据科学家在日常的工作中也能够用到人工智能和机器学习,只有这样,才能够把机器学习的能力应用在更多领域。
而要达到这样的目的,平台企业就需要支持市场主流的一些机器学习框架,像Tensorflow、PyTorch、MXNet等等,并且支持GPU、CPU等不同的硬件架构。
而这些条件,包括SageMaker在内的AWS的机器学习服务都做到了。
雷锋网(公众号:雷锋网)注意到,截至目前,SageMaker 支持的领先的深度学习框架和接口标准包括:TensorFlow、PyTorch、Apache MXNet、Chainer、Keras、Gluon、Horovod、Scikit-learn 和 Deep Graph Library。此外,用户可以通过上传自己的容器镜像让SageMaker运行自定义的框架和模型。
Amazon SageMaker 是一项完全托管的服务,可以帮助开发者和数据科学家快速构建、训练和部署机器学习模型。SageMaker 消除了机器学习过程中的繁重工作,让开发高质量模型变得更加轻松。
Swami指出,其实机器学习的应用领域是非常广泛的,可以适用于很多行业。对于初创公司而言,可以深入到行业应用解决方案中,聚焦于行业化的具体应用开发和部署,帮助这些行业实现创新自动化。
而SageMaker这样的平台则可以被用来帮他们完成建模、部署等一些“苦活累活”。
对于初创公司,Swami的建议是其迅速找到重要的客户然后快速做创新,而工具平台则交给AWS来完成。
机器学习落地为王:晶泰科技、图森未来、有道乐读案例
实际上的确如此——Swami的观点符合当前AI重度强调落地,打造“AI+行业”的重要趋势。在国内,目前已经有众多公司使用AWS机器学习服务。
晶泰科技(XtalPi)是一家以计算驱动创新的药物研发科技公司,通过自主研发的基于AWS GPU计算实例的机器学习框架,实现大规模的模型训练及参数优化。
在新冠肺炎疫情爆发后,该公司很快对近3000个已通过美国药监局(FDA)审核的上市药物、以及超过1万种中药成分分子,进行了老药新用的扫描,成功找到了183个可能对新冠病毒有潜在治疗效果的药物。之后,晶泰科技对这些药物的活性进行了排序,然后又通过更加高精度的计算方法,最终锁定了38个药物。
图森未来(TuSimple)是一个无人驾驶卡车品牌,创立初衷在于以 L4 级别(SAE 标准)的无人驾驶卡车技术为全球物流运输行业提供支持。
在美国圣地亚哥和中国,它都使用了SageMaker进行超过100英里的自动驾驶货运服务的自主研发,它使用SageMaker训练了一百多种人工智能的模型,设立了不同的场景,以每小时65迈的速度实现车辆在车道中间误差不超过5厘米的精准度进行行驶。
有道乐读是一家网易有道旗下做少儿阅读的科技公司,使用了Amazon Personalize来开发自己的个性化推荐引擎。据雷锋网了解,有道乐读的开发团队非常精悍,他们通过Amazon Personalize这样的服务去实现了推荐引擎的快速开发。
此外,弹幕式互动平台虎牙直播也使用SageMaker,在云上训练机器学习模型。
个人洞察:抗击新冠肺炎疫情中,机器学习的3大趋势
此前一次采访中,AWS首席云计算企业战略顾问张侠博士表示,在全球范围内,有上万个客户都在AWS上运行各种各样的机器学习负载,大概有85%的Tensorflow负载都是跑在AWS上。据统计,在AWS上运行机器学习负载的客户量至少高于其它云运营商的2倍。
而新冠肺炎疫情大流行的这段时间,AWS的机器学习也在得到更大范围地普及。
Swami谈到,新冠肺炎疫情是一次洗礼,促使越来越多的公司向云端迁移,尤其是公共领域的公司,加快了使用云端机器学习来开发各式各样的应用。
AWS副总裁 Swami
比如一些公司使用Amazon Textract(一项自动提取文档中文本和数据的服务)来打造自己的应用,增加对申请表的智能处理能力,同时使用对话机器人来建构他们的呼叫中心,实现大规模部署的企业通讯系统。
总结来说,Swami看到了抗击新冠肺炎疫情中人们使用机器学习的三大趋势。
第一个趋势,大规模的通讯。
比如有公司利用来自官方渠道的权威信息,结合专业文献和词库,再利用机器学习和自然语言处理、知识图谱技术对专业信息进行结构化处理、整合归类并建立新冠肺炎防护的知识图谱,快速打造了一套准确率很高的新冠肺炎智能问答系统,累计解决了数十万个问题。
第二个趋势,人们使用机器学习来进行新冠病毒治疗方案的研发。
有公司利用机器学习进行了老药新用的扫描,成功找到了可能对新冠病毒有潜在治疗效果的药物,这得益于这类公司基于AWS GPU计算实例的机器学习框架,实现大规模的模型训练及参数优化,加速了算法研发效率。
第三个趋势,使用机器学习打造远程医疗平台。
利用AWS的机器学习服务,中国一家专注智慧远程心电平台及专业会诊服务的初创企业益体康实现了快速构建AI模型和推理部署,通过联网的专业心电设备和云端远程医疗平台帮助中小医疗机构解决专业医生资源不足的问题,为众多身处隔离病房不方便医生时时监测心脏受损状况的病患提供了服务,大幅减少了跨区传播的风险。
从这些鲜明的例子也可以看到,从初创公司到大型企业,部署机器学习应用程序几乎是普遍的重中之重了。
在每一个细分行业,企业不仅面临多变的外部环境(政治经济文化),也面临同行的激烈竞争。而借助机器学习,则有机会更快爬到行业金字塔的顶端,去应对这些不确定性。AWS提供的人工智能和机器学习服务,正是为了实现这一目的。
相关文章:
上万个公司都在用的机器学习服务SageMaker,AWS宣布要在中国推出了
雷锋网原创文章,未经授权禁止转载。详情见转载须知。