粤港澳大湾区创新引擎——深圳正在揭起AI千人创新浪潮!
由深圳市主办的全国人工智能大赛复赛正在火热进行中!自开启报名以来,大赛吸引了来自13个国家的4253 人报名参赛,选手来自300+顶级高校和800+名企。选手共计有1万6千余次的AI作品提交,双赛项每个赛项最终选出前 100 支晋级团队。他们是粤港澳大湾区乃至世界人工智能科学发展的重要支撑、产业创新的活力之源。
千名AI人才为何参加年度权威赛事?优秀AI团队有何特质和梦想?今日起,南方+联合鹏城实验室、新一代人工智能产业技术创新战略联盟(AITISA)开设AI追梦人系列报道,专访大赛优秀团队,和他们一起在AI世界逐梦而行。
在AI+4K HDR赛项中,lzq_cris的团队由2位来自大疆影像部的算法工程师组成,这是他们首次参加AI类大赛,在初赛中就获得第二名的成绩。参赛初衷并不仅是“赢”,而是希望认识更多在降噪超分方面的“大牛”,因为“图像增强既是兴趣,也是工作”。
“希望能将学术界的一些研究成果和更好地和工业界结合起来,做更多可落地,有意义的东西。”他们说。
参赛初衷
更看重“高手过招” 想认识更多降噪超分领域“大牛”
我们来自大疆影像部,因为大赛主题跟自己部分工作内容相关,所以抱着试一试的心态来参赛,想借此机会了解更多前沿的降噪、超分、HDR等算法,同时也想借此机会认识更多在降噪超分方面的“大牛”。
在身边的同行和朋友看来,这次大赛挑战不小,不仅数据量很大,且算力要求高,有一定门槛。由于工作原因,我们的团队一没有足够时间,二没有足够算力,优势并不明显,很多工程上的经验和想法都没来得及验证。
在比赛中,最重要的是分析数据和评估指标。数据的问题可以在网络设计的过程中去解决,评估指标就是看怎么处理数据会有更好的视觉效果和更高的评分。
比赛收获
不错的成长!分析问题和处理数据能力得到锻炼
我们在分析数据和评估指标的基础上,尝试多种网络设计方案,然后在性价比最高、出成绩最快的前处理和后处理这些路子上做一些实验。这种做法的好处在于,不需要把网络变得更加复杂,节省算力和带宽,通过后处理使得网络输出尽量可控,同时减少黑盒子的影响。
在解题思路上,我们首先分析比赛的数据,将任务分解成多个模块,在各个模块上做各种尝试和小改进。其中,我们主要聚焦在分析数据和前后处理,比如需要考虑转场之类,在此基础上借助了EDVR框架修改。
在作品的设计与后处理方面,因为评估指标跟主观视觉有关系,后处理算法好不好同时影响到主观感受和PSNR,这就面临着
PSNR和视觉感官的权衡,需要做大量的实验来验证和评估。
这次比赛最锻炼选手的方面在于数据量较大,图像退化过程也比真实场景要复杂,对开发者要求有较强的分析和验证数据能力,并在此基础上才能更好地设计网络解决问题。
在短短两个多月,能学习到这么多的算法,和各路大牛同台竞技,同时还了解到降噪超分在各个领域的应用,对个人而言,分析问题和处理数据都能得到一定锻炼,有不少成长。不管最后成绩如何,都是一段不错的经历。
行业展望
热爱图像增强研究,构建数据样本需从实际需求出发
在人工智能发展中,图像增强是我最为关注的领域。我们认为,这一轮AI的崛起主要是凭借在图像和语音上的出色表现。图像增强既是我们的兴趣,也是我们的工作。
因此,AI+4K HDR有巨大发展前景,我们心中的AI+4K HDR应该是用深度学习的方法来实现传统4K HDR中的某些模块,借助CNN强大的拟合能力和统一框架,有可能取得传统方法难以达到的效果。
AI+4K HDR目前主要的瓶颈在两方面,一是缺乏足够好的数据样本,尤其是HDR样本,二是缺乏可落地方案,包括低功耗快速计算平台和轻量级网络。构建好的数据样本需要从相机原理和实际需求出发,这将会有更大的应用价值。
雷锋网版权文章,未经授权禁止转载。详情见转载须知。