“想像一个10万人的体育馆里,每个人都有一台笔记本并用某种方法进行了联机运算,而太湖之光的运算能力相当于100个这样的体育馆,这对ASC的参赛队伍来说都是无法复制的体验。”
对于太湖之光超级计算机的性能,美国橡树岭国家实验室及田纳西大学教授Jack Dongarra是这么评价的。他同时是ASC竞赛专家委员会主席,和全球最快超级计算机排行榜Top500发起人。
太湖之光是全球最快的超级计算机,而ASC是一年一度的世界大学生超级计算机竞赛。
2017年的ASC决赛要求参赛队伍在3000瓦功耗的约束下,用浪潮的超算服务器自行设计超算系统,然后运行国际通行的基准测试,以及交通、基因测序、材料科学方面的应用,并在太湖之光超算上完成高分辨率海洋数值模拟。
今年的ASC由亚洲超算协会、浪潮集团、国家超级计算无锡中心、郑州大学共同主办。总决赛在无锡超算中心进行,从来自全球的230支队伍中仅选出了20支参加,最终清华大学获得了总冠军。
浪潮集团人工智能和高性能计算总经理刘军告诉雷锋网(公众号:雷锋网),超算竞赛的题目往往来源于实际生活、研究和生产,所以比赛中所创造的优化方法和一些成果,马上就可以反馈到实际应用当中。而这也正是比赛的意义所在。
竞赛题目中的一项就是很实用的人工智能交通预测。在这一项,北京航空航天大学团队的表现很好,他们设计了深度神经网络模型,并构建超算对百度提供的历史交通大数据进行训练,在对早高峰道路交通状况进行预测中,准确度排名第一,也因此获得了亚军。
不过现如今各大科技公司及云计算厂商都在做人工智能相关的事,甚至以此作为战略重点。比如百度一心扑在人工智能上;阿里云有ET大脑,并在城市交通中有过实践经验。在基因测序上,华大也与阿里云有合作。那用超算解这些题的用意是在哪呢?
除开比赛对人才培养与锻炼的因素不谈,国家超级计算无锡中心主任杨广文教授告诉雷锋网,超算主要提供了计算能力。在人工智能方面,现在超算的能力主要发挥在深度学习方面,对语音、图像及翻译的处理都可以用超算。当然,分布式系统也可以做深度学习,但超算的强项是对大数据的处理和强大的计算能力。
“在分布式系统上做的事情在超算上也能做,但在超算上能做到的,是小系统做不了的。它们各有各的优势,之间是互补关系。”
超算从传统意义上来说,最核心的问题就是做一些原来做不了的事情,解决原来解决不了的核心问题。他反问,“如果用超算做一些分布式系统可以做的事情,那为什么还要用超算呢?”
这大概也是Jack Dongarra感叹超算提供了“无法复制的体验”的原因,如果没有龙要屠,为什么要用屠龙技?
当然,除开人工智能超算也有很多其它的应用领域,但不是所有都需要用到。太湖之光的工作人员告诉雷锋网,目前超算执行的最多应用还是气象类。
Jack Dongarra
刘军也同意这种看法,他在采访中告诉雷锋网,超算与人工智能最密切的结合是在深度学习,这一目前AI最强者推动力方面。
“超算可以帮助神经网络去训练模型,让模型具备识别和推理的能力。训练需要强大的超算性能,才能让模型更好更快也更准确。这是超算目前与AI的结合点。”
他表示,就像这次超算赛题中的交通领域,每天都会产生大量数据。“如果用普通机器做训练模型,要很长时间,精度调整也会花很久,但超算会把整个训练和调整过程提升很多。”
杨广文同时表示,他们也在想怎么把超算的能力送到其他人手中,虽然超算是“高大上”的,但要降低用户门槛,帮助解决实际问题。所以他们做了一个太湖之光社区,希望能通过比赛类的方式,吸引更多人来使用机器,帮助解决制造、气象、新药研发等科学问题。
这就像现在国内外的科技巨头都提出了人工智能民主化的概念,即让它对任何人都唾手可得。雷锋网曾报道,Google云计算部门首席科学家李飞飞在3月的Google云计算大会上表示,要从计算力、算法、数据和人才四个方面推行AI民主化(Democratizing AI)。
更早前,微软CEO萨提亚·纳德拉也提出过相似的观点,“我们追求的人工智能系统,是为了让每一人、每一个单位能够与人工智能相连,让他们解决社会和经济上遇到的最紧迫的问题。”
超算也是如此。不过在推广应用范围的同时,人工智能的前沿与极限,或许还是会由超算来探索。
雷锋网原创文章,未经授权禁止转载。详情见转载须知。