人工智能是眼下最热门的话题之一,人们对于机器翻译、自动驾驶、NLP 和 CV 等技术将会带给我们的影响也是各执一词。乐观主义者们畅想着有朝一日「司机」一词成为历史,而悲观主义者们则担忧数以百万计的卡车司机即将面临失业的风险。
在过去,人工智能常被表现为类似《终结者》影片中的天网效果。其实,人工智能目前在娱乐行业就有非常真实的落地产品。下面我们就列举一些令人激动的项目。
睡前「阅读」
人工智能的触角已经伸向了娱乐生活的方方面面,甚至是持续千百年的家庭传统,它能辅助父母给孩子朗读睡觉故事。比如,Novel Effect 等公司已经研发出的语言内容交互系统,当父母讲述《野兽家园》故事时,可以配以各种小动物的声效。
展望未来,8i 等公司研发的互动全息技术可以让大家看到儿童剧中的 Seussian 成为可互动的角色。Earplay 是另一家技术公司,他们在移动设备研发的技术则解放了妈妈们的时间。待孩子上床之后,录音机就开始模仿妈妈的声音给孩子们讲故事。
充满想象力的霍顿听到关于自己的故事
迪士尼乐园
迪士尼乐园曾是连接现实生活和童年幻想的桥梁地带,人工智能技术在这里也大显身手。说到主题公园,迪士尼一直处于领先地位。迪士尼研究院与主题公园的创意工程师团队密切配合,设计出了许多我们熟知和喜爱的游乐设施及景点。
如果利用 Zippy.ai 公司的技术,在迪士尼乐园即将开放的星球大战主题园放一台半自动的 R2D2 机器人怎么样呢?有自动导航技术做支持,自动驾驶的机器人在孩子们之间移动便非常安全。
或者,是否可以通过更深层次的交互技术让迪士尼动画的角色越出纸外,融入现实生活呢?米老鼠是否可以用她特有的声音与宾客交谈,互动回答孩子们的问题呢?
名人模仿
人工智能不仅用于合成娱乐声效,还能模仿名人的声音,包括人物的语音、语调和语气。举个例子,如果你输入一些内容,机器可以模仿泰勒·斯威夫特的声音朗读出来,效果惟妙惟肖。同样,人们很容易联想到将此技术迁移到智能助手中,假如用摩根·弗里曼的音色回答天气查询,谁不乐意呢?
将来人们不必再阅读纸质版的《纽约时报》,而是听安德森·库珀读新闻,并且向 Siri 或是 Alexa 大脑抛出一大堆问题,当然安德森是虚拟。Google Home、Apple 即将发布的 HomePod 等语音交互产品,北美地区今年估计接近 2000 万台,到 2020 年预计将达到 1.4 亿台,这意味着大部分人都将有机会接触此类产品。
重要的是,使用这些设备的人越多,底层的算法就越智能。每一个问题,每一条指令,其实都是一条训练数据,都能让模型聪明一点点。
名人模仿并不局限于声音。由华盛顿大学计算机科学与工程学院的 Paul G. Allen 制作的数字奥巴马证实了制作以假乱真人物视频的能力。当然,创新的技术也会存在黑暗的一面,政治倾向分化的大众沉迷于各种假新闻,媒体被虚假视频所利用。图谋不轨的人可能在视频中设计一些对话,然后配上语音、面部动画和肢体语言,从而复制一段以假乱真、令人信服的对话视频。据实际观察发现,几乎没人怀疑这不是奥巴马总统亲自发表的一次真实演讲视频。
虚拟现实
如果你曾幻想逃离到另一个宇宙,那么人工智能技术将能帮你实现:融入人工智能技术的虚拟现实使其各方面效果更可信,感觉更身临其境。假设你不希望逃往的后启示录世界渺无人迹,那么算法会为你的虚拟现实世界添加多维度的虚拟人物。
Rain AI 引擎已经被全球 10 万名游戏开发者所使用,竞争对手的理论已经在这个领域取得了长足的进步。Limitless 公司用自己平台制作的一段交互式虚拟角色短片,Gray 和 Gull,征服了 2016 游戏开发者大会的参会者们。同样,SIGGRAPH 大会近期也吸引了大批该领域的参与者。
由于人工智能技术的进步,故事情节本身也变得更加错综复杂。根据玩家个人经验训练的神经网络模型可以将已有情节按照玩家口味偏好进行改编。
Massive Software 在其人群仿真算法中已经加入人工智能因素。而他们预设计的人工智能代理可以直接加入场景中,视觉工程师们根据故事情节稍作裁剪即可使用,节省了原来生成 CGI 角色的时间。
动画电影
动画行业也吸引了人工智能技术的加盟,Midas Touch 公司已经开发了一款自动设计二维动画角色的工具。幕后制作者是 Pixar 动画的元老,他曾通过 WALL-E 机器人把人工智能技术搬到现实生活中。Pixar 公司本身也踏着 AI 浪潮乘势而上,将深度学习技术应用于检测和剔除质量差的图像帧,显著提升动画制作效率。去年,谷歌也凭借 Pixar 的产品给人工智能增添了一丝幽默感。
广告
人工智能不仅在视觉和交互方面改善了我们的体验,它还能理解用户的偏好和情感,为用户提供个性化的内容定制服务。Netflix 细腻的推荐算法已经让人眼前一亮,而基于情感识别和面部识别技术的视频运营商更是可以基于用户的心情推荐视频。iPhone X 的前置摄像头捕捉用户面部画面,通过计算机视觉算法解锁手机。试想一下苹果公司广告投放的新技术,当你在手机上浏览内容时,摄像头通过跟踪你眼球的活动方向,在屏幕相应的位置给你推送广告。摄像头可以分析知道用户在观看屏幕的哪一块区域,以及观看时的情绪状态。不久的将来,媒体评级机构 Nielsen 会被这些创新技术所取代。
市面上已有多家公司将这些新技术投入实际产品:TVision Insights 公司通过分析「真实观看人数」衡量电视节目的观众喜爱度。Affectiva 公司借助计算机视觉和深度学习技术分析用户的面部表情,从而判断用户情绪。游戏工作室 Flying Mollusk 使用 Affectiva 的软件开发了一款新游戏,实时根据用户的恐慌程度调整游戏难度。更进一步,当用户心情悲伤、喜悦或是兴奋,智能助手可以为主人挑选播放不同的音乐。
小结
相信大家已经见识到了,人工智能在娱乐领域的应用场景千姿百态。人们每一次使用 AI 辅助的娱乐设备休息、聊天或是玩游戏,都在为算法提供训练数据,让算法更深刻地理解用户习惯,更好地为用户提供娱乐服务。各位读者体会到了变化吗?