「 日本一支研究团队开发了一种机器学习装置,其为一种人工智能耳机,能够跟踪听众的情感状态,创造出为听众量身定制的音乐,从而改善听众的情绪,激发新的情绪。」
人工智能耳机?如今人工智能已经成为最热的创业方向之一,因此对于有人想将人工智能和耳机结合在一起并不感到意外,不过第一反应是用人工智能为用户提供语音歌曲搜索等服务,而日本的这支研究团队则打破了雷锋网(公众号:雷锋网)编辑对目前人工智能耳机的认知。「 跟踪听众的情感状态」、「 量身定制音乐」这两点从目前的技术水平来说都是很难达到的。
从后面的介绍得知,他们是利用脑电波来跟踪听众的情感状态,耳机上装有传感器,传感器能够检测脑电波,并识别脑电图。而量身定制音乐则是通过人工智能完成,首先,AI系统能够收集用户大脑的音乐数据,创建个性化音乐的“情感音乐模型”;在开始谱写音乐之前,AI系统学习用户的脑电波,并能识别脑电波与各种音乐之间的关系;最后,AI系统合成为用户贴身打造的定制音乐,来刺激用户的精神状态。简单来说就是,通过监测你听不同音乐的脑电波反应,比如高兴还是沮丧,人工智能为你打造能让你轻松愉悦的音乐。而这里就涉及到两种技术,脑电波控制以及人工智能谱曲。
脑电波控制
脑电波控制,即利用脑电电极片收集脑电信号形成脑电波,并通过相应算法“翻译”出当中含义,最终实现识别和控制。早在19世纪50年代,学术界就开始了脑电波的研究,如今脑电波的技术已在医疗领域运用了超过二十年,用来治疗癫痫等脑部疾病的病人,在2004年巴西世界杯上下肢截瘫者诺平托正是依靠意念控制机械外骨骼踢出第一球的,而在民用行业这几年也开始有一些应用。然而,大脑的情绪状态非常复杂,之前就有很多研究指出,与特定情绪相关的脑电波似乎会随着时间的推移而改变。因此,还没有人找到一种能够利用脑电波清晰可靠地识别情绪状态的方法。
目前,民用的脑电波控制设备只是粗略地将收集到的原始脑电信号数据分离出四种波段,分别为α(阿尔法)、β(贝塔)、θ(西塔)、δ(德儿塔),而它们分别对应人脑的不同状态,包括疲劳、兴奋、沮丧等程度。
业界采用了三种脑电波收集方式:(脑电极)植入式、半植入式以及非植入式。前面两者需要把电极内置头骨之下,与大脑皮层接触。最后一种是将电极与头皮接触。相应地,前两者的精度高干扰少,而最后一种信号弱、干扰多等。目前emotiv、EEGSmart、BrainLink等国内外企业的产品都是头戴式设备,即第三种方式。也正因为如此,这类产品目前都难以有较大的市场,目前都集中在心理健康领域。
人工智能谱曲
上面这首曲子是Experiments in Musical Intelligence (音乐智能实验,EMI)研发的人工智能音乐作曲系统创作的一个模仿巴赫风格的赞美诗作品。EMI由美国加州大学圣克鲁斯分校的音乐教授兼作曲家大卫·科普(David Cope)开发,它谱写的巴赫风格作品在1987年被首次演出,惊艳四座。两年后圣克鲁斯巴洛克艺术节上EMI创作的模仿巴赫风格作品与巴赫原创作品同台演绎,直到科普告诉观众哪首曲子是巴赫的原创,大多数人都无法给出正确的答案。
EMI创作的原理为分解与重组,即从一名作曲家的作品中识别出不同类型的重现结构,然后以新的排列来复用这些结构,依此产生一份“同样风格下的”新作品。你可以想象 EMI 在学习了贝多芬的九首交响曲后,自行谱出《贝多芬第十交响曲》的情景。
EMI虽然不是最早的人工智能音乐作曲系统(最早的算法作曲(Algorithmic Composition)甚至可追溯到1957年化学家和音乐家Lejaren Hiller用算法生成了弦乐四重奏伊利亚组曲),不过很长时间内被称为最先进的人工智能音乐作曲系统。如今,在人工智能大热之际,不少大公司的实验室都在研究人工智能谱曲。其中,索尼巴黎计算机科学实验室研究人员盖坦·哈杰里斯(Gaetan Hadjeres)与弗朗索瓦·帕切特(Francois Pachet)开发的名为“DeepBach”(深度巴赫)的神经网络在经过对巴赫音乐学习训练后可以谱写出与巴赫风格高度相近的曲目;去年6月,谷歌的Magenta项目通过神经学习网络创作出了自己的第一首歌曲——一首时长90秒的钢琴曲(不过,这首钢琴曲背景内的打鼓声和管弦乐编曲并不是由这一算法生成的,而是后期添加的);百度深度学习实验室则发明了一种基于输入图片生成曲谱的自动化系统,即输入一张图片,系统会自动生成一段符合该图片内容和意境,且符合韵律和节拍的曲谱。
百度深度学习实验室看图作曲实验成果
由此可见似乎人工智能作曲并非一件难以完成的事情,但雷锋网发现这个方向的创业项目并不多。目前为止国内雷锋网了解到的有“听画”和“创悦”,都是随机创作音乐的。「 听画」与百度的看图作曲差不多,用户在听画 App 上传一张照片,人工智能技术为每张照片配上属于它的原创音乐。该项目在2014年由班砖科技开始研发,是一款将图片+音乐融合到一起的移动社交应用。不过,雷锋网在搜索该项目的相关资料时发现,关于该项目的最新消息停留在2016年6月的一篇报道,而其官方微博最后一条微博发布停留在2016年4月,另外该项目APP最后更新时间也是在这个时候,而其官网则已经处于无法打开的状态。不过,据IT桔子的融资情况显示,该公司在2016年5月完成1200万Pre-A轮融资。因此,对于该项目的最新进展还无法得知。「 创悦」是根据用户随口的哼唱片段进行再创作,目的是辅助用户原创工作,降低音乐创作门槛以及提高创作效率。利用用户给出的风格或者关键词或片段也是目前国外人工智能作曲创业的主要方向,如musical.ai和Jukedeck。
很多人对于人工智能谱曲存在质疑的地方在于,人工智能难以作出带有情感的作品。雷锋网咨询了多位人工智能方向的创业者和投资人,大部分人都表示并不看好这类的创业项目,有投资人表示以前有过,但到现在还没有做起来的,不过,作为人工智能方向的创业公司,狗尾草科技创始人邱楠则向雷锋网表示目前公司也在这方面的准备,由于精力有限目前只是做了些古典钢琴曲,大概年底会有新的东西出来。
目前来说,脑控设备与人工智能谱曲这两个方向在产业界都属于发展初期阶段,而将两者结合则更是将落地的可能减小到更低。就雷锋网的了解,在国内和这个项目比较类似的有EEGSmart 的脑电波头戴智能设备Umind,根据介绍,Umind根据用户喜好、状态、选定的场景进行人工智能学习,结合云端大数据分析,自动推动用户最喜爱的、最适合当下场景的乐曲。只不过,就像前面提到的,目前民用的脑电波控制设备只能粗略地将人类情绪分类,并不能非常准确地捕捉人类情绪,另外,用户的喜好是建立在大量的数据分析上的,目前即使是各大音乐服务商在这一方面也并不能做到很完善。当然,不用人工智能谱曲已经减少很多难题了。
雷锋网旗下栏目「 新智造」专注于智能时代的创新与创造,同时我们也关注这些创新能否在产业得到落地,关于脑电波控制设备以及人工智能谱曲未来的发展,「 新智造」也将持续关注。
雷锋网原创文章,未经授权禁止转载。详情见转载须知。