雷锋网 AI 科技评论按:7 月 29 日,ACL 2019 进入正会第一天,密集的论文演讲、海报展示即将开始。今天的佛罗伦萨依然凉爽。(28 日 Tutorial 日的有趣见闻请见这篇文章)
上午 8 点 30,ACL2019 开幕式在大礼堂举行。(我们早早到达现场,占一个好位子)
参会人员与论文投稿评审概况
ACL2019 大会主席 Lluís Màrquez 首先上台,从参会人数角度介绍了本届 ACL 的会议概况。本届 ACL 的注册参会人数达到了 3160 人,比去年增加一倍还有余(有趣的是 ACL2018 的参会人数比之前两年都要少)。
在网上购买 ACL2019 参会门票时可以告知主办方自己感兴趣参与的 workshop 和 tutorial,如今这些数据统计出来,workshop 和 tutorial 都有好几个场次的参与人数同时超过了此前。这都展示出了这个领域的快速发展以及研究人员们的积极参与。
Lluís Màrquez 介绍 ACL2019 大会组委会成员、感谢工作人员和各级别赞助商,以及感谢在会议筹备组织过程中给与建议和帮助的其它 NLP 顶会的主席后,由大会副主席 Anna Korhonen 与 David Traum 介绍论文接收情况。
意料之中地,ACL2019 的论文数量也大幅增长,论文投稿数量从 ACL2018 的 1544 篇接近翻番到了今年的 2905 篇,共接收 660 篇论文,其中 447 篇长论文、213 篇短论文;总接受率为 22.7%,其中长论文接受率为 25.7%,短论文接受率为 18.2%。雷锋网 AI 科技评论记者猜测这可能是因为有许多论文作者都抱着试一试的心态向 ACL2019 投稿短论文,让短论文的竞争变得更激烈了。随着论文数量增长,审稿人的数量也从 1610 增加到了 2281,领域主席(Area Chair)的数量更是从 61 增加到了 230。
实际上审稿人和 AC 的数量并不是简单增加而已,根据 ACL2019 组委会介绍,为了应对如此之多的论文投稿,ACL 从 2018 年开始也采用了资深领域主席(Senior AC)+领域主席(AC)的双层结构,今年由 46 位 SAC 为 AC 分配论文和审稿人、为对应的领域做出一些整体性的推荐,184 位 AC 中的每位则只负责各自领域内的一部分论文,然后组织审稿人们进行讨论、为审稿意见撰写意见(meta-review),并做出论文选择推荐。这样的做法也是为了尝试弥补这个正在快速发展的领域中必定会出现的问题:缺少学识和经验丰富的审稿人。在双层结构下,每个 AC 负责的论文数量更少,他们就可以更多地关注审稿过程。在数据上的体现就是,相对于 ACL2018,审稿人的数量增加不多,但 AC 的数量增加了接近三倍。
更多的论文需要更长的审稿时间,针对这一点,ACL2019 也采取了一些措施来加快审稿过程,包括取消论文选择过程(不再让 AC 选择自己自己感兴趣的论文来审)、取消作者回复阶段(这当然也引起了一些争议,ACL2019 中做出的权衡是让 AC 花更多时间参与到审稿和讨论过程中,也让 PC 更多参与讨论)、采用了更简洁快速的审稿流程。与其它会议(比如 2019 年的 NAACL、EMNLP-IJCNLP)的举办时间没能拉开足够间隔给 ACL2019 的审稿过程增加了一些额外的麻烦;实际上论文作者们自己也希望不同会议之间能间隔得久一点,能够有时间把被拒的论文做修改后再投下一个会议。ACL 也希望未来不同学术会议之间可以多考虑一下协调举办日期,给各个环节的学者和工作人员们都留下更充沛的时间。
不同领域的投稿数量分布和 ACL2018 类似,没有占据特别高比例的领域,前 5 高的领域是信息提取和文本挖掘、机器翻译、机器阅读、对话和交互系统、文本生成。给人惊喜的是,有一些领域有很明显的增长,投稿数量比 ACL 2018 增加了好几倍,比如文本生成,以及语言学理论、认知建模以及心理语言学。
不同领域论文的接受率略有区别。可以说竞争最激烈的领域是文档分析(Document Analysis,18.5%接受率)、句子级别语义(Sentence-level Semantics,19.8%)、信息抽取和文本挖掘(Information Extraction and Text Mining 20.6%)、词级别语义(Word-level Semantics,20.7%)、以及音韵学,形态学和单词分割(Phonology, Morphology and Word Segmentation,20.9%),这几个领域的论文接受率都很低。
ACL 的惯例是早早公布最佳论文候选名单,并在正会最后的颁奖环节揭晓各个论文奖项,今年也不例外。今年共有八个论文奖项,包含一篇最佳长论文、一篇最佳短论文、五篇杰出论文、一篇最佳 Demo 论文。候选名单可以在 http://www.acl2019.org/EN/nominations-for-acl-2019-best-paper-awards.xhtml 查看,奖项名单在 31 日晚揭晓后我们也将第一时间为大家带来消息。
最后,三位本地组织主席向大家介绍了会议场馆情况、餐饮安排、信息查询方式,以及邀请大家参与 30 日的晚宴。
这张图大概最好地概括了本届 ACL 的规模,以及从一个角度展现了大会组委会、AC & PC、审稿人们的辛苦劳动。我们应当向他们感谢、致敬。
ACL 学会主席周明演讲
会议与论文情况介绍完毕后,ACL 学会主席、微软亚洲研究院副院长周明博士带来了一场全体演讲,演讲主题是「ACL/NLP 的光明未来」。
演讲内容分为两部分,ACL 学会的工作状况汇报,以及 NLP 技术发展概览。
在第一部分中,周明谈到「ACL 学会的发展史就印证了 NLP 领域的发展史」,如今随着 NLP 领域的发展壮大,ACL 也已经有了 EACL、NAACL、AACL 三个分会,都积极推动着 NLP 整个领域的进步。
接着,周明介绍了 ACL 学会的职责、目前的执行委员会成员情况,以及 2018 年当选的 5 位 ACL Fellow。
周明接下来介绍了目前遇到的「忧」和「喜」。
「忧」在于,不同国家和地区的论文接受程度有明显的高低之分,这显示出了发展的不平衡;以及,快速大幅增长的论文投稿数量为审稿过程带来了许多挑战,ACL 学会马上就会召开特别会议讨论如何应对这个问题。
「喜」,则是在亚太地区有大量 NLP 相关的学术组织,他们组织了大量的学术会议、夏令营、教学讲座,极大程度地推动了亚太地区学者们的 NLP 水准发展,
近几年有数届 ACL 会议在亚太地区召开。来自亚太地区的 ACL 学会成员比例,2018 时也相比 2013 年有了显著提高。
2018 年,ACL 的亚太地区分部 AACL 也已经宣告成立,在服务亚太地区 57 个国家和地区的 ACL 成员的同时,更是为亚太地区的所有 NLP 相关学会提供一个新的桥梁。
ACL 学会最终的目标,是通过更好的成员服务、更多的培养培训计划、更多差异化的会议和活动、对缺少资源的语言的更多支持、对代表弱势群体的学术组织的更多支持、对学术组织和会议的更好的系统建设和协调,促进 ACL 以及整个 NLP 领域向更均衡、更具包容性、更丰富多彩的方向持续进步。
在第二部分,周明对深度学习影响下的 NLP 技术进行了大视角的总体介绍。基于深度学习的 NLP 技术已经走过了词嵌入、句子嵌入、带有注意力的编解码器模型、Transformer(完全使用注意力)的这四个技术节点,预训练模型+针对具体任务的精细调节也已经成为了当前 NLP 实践的新范式。
下面,周明以富语料任务、低资源任务、多轮对话任务三类典型的任务为例,讨论了我们是否应当满足于当前的技术路线、目前已经能看到的问题有哪些。周明最终提出,未来的 NLP 不会只是基于规则的模型,同样不会只是基于 DNN 的模型;它应当是可解释的、有知识的、有道德的、有经济效益的、终生学习的模型。未来,深度学习和语言学研究应该互相帮助,多模态信息处理也大有可为。
整个 NLP 科研共同体的努力可以具体细化到计算能力、数据、模型、人才、合作、应用这六个方面,做出更多的努力,我们也就可以期待拥抱一个更光明的未来。
演讲结束后,29 日上午的开幕仪式全部内容就结束了。短暂的茶歇后,ACL2019 接受论文的论文演讲很快就会在多个不同的会议厅中分别开始。
和我们一起踏上 ACL2019 的学术探索之旅
在过去的一年中,我们见证了谷歌的 BERT 以一己之力刷新了众多 NLP 任务中的最好成绩(SOTA)、成为了新的基准模型并改写了 NLP 模型的研究风气,也参与了 OpenAI GPT-2「是生成还是记忆」、「是否夸大了危害」的讨论。还有其它许多值得纪念的学术成果和令人印象深刻的实践方法,我们将在接下来几天内更多地观察、更多地认识它们,也希望可以和现场的参会学者们一同捕捉、品评未来的学术趋势走向。各位读者如果有感兴趣的话题和领域,欢迎留下线索,或者留言与我们一同讨论。
雷锋网(公众号:雷锋网) AI 科技评论报道。
雷锋网原创文章,未经授权禁止转载。详情见转载须知。