机器之心原创
作者:曾祥极
修改:H4O
人工智能之父马文·明斯基曾说到过,「假如机器不可以很好地模仿情感,那么人们或许永久也不会觉得机器具有智能」。
在人们的认知中,机器与人的分界线是机器是否具有情感。举个比方,假如一对情侣吵架,而有一方显得过于冷酷,那么另一方很有或许向对方说出类似于「你是一个没有情感的机器」的话。因而,机器是否具有情感是机器人性化程度凹凸的要害因素之一。
早在 1997 年,MIT 媒体试验室就提出了情感核算(Affective Computing)的概念,情感核算旨在经过赋予核算机辨认、了解和表达人的情感的才能,使得核算机具有更高的智能。
情感智能是让机器愈加智能的要害,具有情感的机器不只更通用,更强壮,更有用,并且与人类的价值观相一致。人类的情感机制也使咱们可以完结太难编程或难以让当时机器学习的使命 [1]。
例如,咱们的惊骇心情使咱们可以意识到危险并坚持安全。咱们感知别人的情感并站在对方的视点思考问题使咱们在杂乱的国际中可以做出恰当的决议计划。饥饿、好奇心、惊喜和高兴等情感使咱们可以标准自己的行为,并让咱们寻求咱们期望完成的方针。除此之外,咱们经过情感表达自己内部状况的才能是向别人交流并或许影响别人决议计划的绝佳办法。
情感核算首要有「辨认」,「表达」和「决议计划」这三个研讨方向,「辨认」首要是研讨怎么让机器准确识人类的情感,并消除不确定性和歧义性。「表达」首要是研讨怎么把情感以适宜的信息载体标明出来,如言语、声响、姿势和表情等。而「决议计划」则首要研讨怎么运用情感机制来进行更好地决议计划。
由于情感辨认和表达都是研讨前史较长的范畴,因而本文首要介绍情感辨认和表达的相关概念,以及运用情感进行决议计划的最新开展。
1. 辨认和表达
1.1. 辨认
情感辨认是一个前史比较悠长的研讨范畴,最早可以追溯到上个世纪就有学者从各个视点研讨情感辨认,比方语音、言语、表情和姿势等。它旨在从不同的维度准确捕捉人类的情感表达,首要有两种描绘模型可以对情感空间进行描绘,一种是离散情感空间,一种是维度情感空间。
图 1-1 Ekman 根本情感 [3]
离散情感空间把每一种情感分为一个个独立的标签,相互之间没有关联性,如高兴、悲伤、惊骇等情感。这种描绘办法更契合人的认知与日常日子的表达形式,具有天然的可解释性。可是缺陷在于不同的情感标签之间没有类似于数值向量的接连性,所以不同标签之间的差异和联络性就无法更好地核算。
此外,由于在学术界没有存在对情感的统一认识,这导致了现在存在着各种不同版别的情感分类标签。其间最为知名的当归于美国心思学家 Ekman 提出的六大根本情感。如图 1-1 所示,Ekman 列举了六种根本的情感,依次是气愤、高兴、惊奇、讨厌、悲伤和惧怕。
图 1-2 Valence-Arousal 模型 [9]
维度情感空间把不同的情感运用接连的多维向量标明,也称作维度理论。在维度情感空间中,每一个点都标明一种情感,具有数值向量的接连性,可以方便地核算不同情感之间的差异和联络,可是关于人来说,不具备很强的直观可解释性。
比较闻名的维度情感模型是 Hanjalic 提出的激活度-效价(Valence-Arousal)空间理论,如图 1-2 所示。激活度-效价理论把情感分为激活度和效价两个维度,不同的激活度和效价标明不同的情感,激活度和效价越高则代表情感越活跃,反之则越消沉。
图 1-3 Plutchik 情感轮 [11][12]
另一个闻名的维度情感模型是 Plutchik 提出的 Plutchik 情感轮模型,如图 1-3 所示。该模型把情感分为八种首要的心情,坐落圆圈的第二层,别离是高兴、信赖、惊骇、惊喜、悲伤、讨厌、气愤和期望,其它一切杂乱的心情都是由这八种心情组合而成的。越接近圆圈里边,心情越激烈,色彩也会增强。移动到外层,色彩变得不那么饱满,心情的强度下降。
情感辨认技能在许多范畴都有比较好的运用,比方在教育范畴,教师运用情感辨认技能来协助孤独症患者或许抑郁症患者树立一个健康的身心,并进步学习才能。
情感辨认在商业范畴也有很大的用途,例如商业公司运用情感辨认算法查询顾客在观看广告时的表情,这可以协助商家猜测产品销量的上升、下降或许是坚持原状,然后为下一步产品的开发做好预备。
1.2. 表达
人在与机器进行交互的时分,假如机器不可以对人的情感进行合理的反响,即机器可以表达自己的情感,那么或许在人类看来机器总是冷冰冰的,不那么智能。因而,在完成通用人工智能的进程中让机器可以合理的表达情感是一件非常重要的工作,情感表达旨在让机器从不同的维度表达特定的情感,比方经过语音、肢体和表情等。
语音是表达情感的首要办法之一,由于咱们人类总是可以经过别人的语音轻易地判别别人的情感状况。语音的情感首要体现在两个部分,一个是语音中所包括的言语内容,另一个是声响本身所具有的特征,比方腔调的凹凸改动等。咱们可以运用特定的声响风格加上文字内容组成语音,便可以表达特定的情感,带有情感的语音可以让顾客在运用的时分感觉更人性化、更温暖。
图 1-4 对立和协作式语音组成 [6]
现在的语音组成一般都是经过将需求组成的文字内容和特定风格的语音输入到神经网络中,然后让神经网络组成特定风格的语音。但是,现在的神经网络无法高效地将语音内容和风格分化。如图 1-4 所示,微软的研讨者在最近提出运用博弈论中对立和协作的思维来生成特定风格的语音数据,这个模型可以有用地将语音内容和风格分化,然后使得在语音生成方面风格可控,该模型在风格搬迁、情感建模等使命上均取得了不错的开展。生成样例可参阅 [7]。
肢体言语首要是指经过头、眼、手和腿等人体部位的和谐活动来表达人的主意。同样地,咱们也可以让机器学会肢体言语来表达特定的情感。肢体情感表达首要是经过剖析动作的根本单元,用运动单元之间的运动特征结构单元库,然后再依据不同情感表达的动作需求组成相应的交互动作,并让机器人履行相应的动作。
图 1-5 NAO 机器人 [8]
如图 1-5 所示,NAO 机器人是由 Aldebaran Robotics 公司推出的一款人形机器人,该机器人可以经过改动肢体的运动来表达不同的情感。它能模仿 1 岁小孩子的气愤、惊骇、伤感、高兴等心情,比方,你用力抱它,它会感到严重。或许你长期不睬它,它会感到焦虑。这个机器人可以较好地协助医治自闭症患者。
面部表情是体现情感的一个重要途径,首要经过脸部、眼睛或许肌肉方位的改动来表达情感。不同国家的人面部表情各不相同,亚洲公民的面部表情的强度相对较低,由于在亚洲文明中,面部体现出一些特别心情是不礼貌的。
图 1-6 ExprGAN[10]
面部表情的生成是一项具有挑战性的使命,由于它需求对输入面部图画进行高档语义了解。在传统办法中,组成的面部分辨率一般很低。现在首要盛行依据深度学习的办法进行面部表情图画生成,比方有研讨运用生成对立网络(GAN)进行带有指定心情的面部表情生成,如图 1-6 所示,该模型可用于可控表情的面部表情生成,可以很好地表达不同的情感。
一个更为归纳的情感表达的比方是对话体系,图灵在 1950 年就提出了闻名的图灵测验,他以为假如一台机器可以与人类打开对话而不能被辨别出其机器身份,那么称这台机器具有智能。咱们在文章的最初谈到,假如机器不具有情感表达,那么人们或许会以为机器一点都不行智能。
图 1-7 情感表达对话 [13]
因而在与机器进行对话时,机器可以辨认和表达情感是一件非常重要的工作。来自哈佛和微软的研讨者们就尝试着让对话机器人可以归纳言语信息和视觉信息进行带有情感表达的对话,如图 1-7 所示,针对问题「Did you have a good time?」,对话机器在看到不同的视觉场景会有不同情感表达。左面的图画是一个昂首并带有笑脸的小男孩,因而机器会回复「We had a great time at the beach!」,而右边的图画却是一个垂头的小女子,因而机器会回复「She just hates going for a walk!」。
2. 决议计划
很多的研讨标明,人在处理某些问题的时分,纯理性的决议计划进程并不是一个最优解,在决议计划的进程中,假如有生理反响(如情感)加入到决议计划进程中,这有或许协助咱们找到更优的解。假如咱们将情感机制归入到强化学习算法的规划傍边,那么智能体(Agent)会发什么风趣的工作?
举个比方,咱们人类在遇到不利于咱们生计的状况下,咱们的交感神经体系(Sympathetic Nervous System, SNS)会排泄一系列激素促进咱们的心跳、血压以及肾上腺素升高,并导致咱们发作惊骇的心情,这种惊骇的心情会加速咱们对危险躲避的学习。假如咱们将这种惊骇心情加入到强化学习的智能体并辅佐智能体决议计划,智能体在探究功率上或许会发作必定的改动。
2.1. 算法
微软的研讨者在这个问题上给出了自己的答案,他们提出了一种依据周围血管搏动丈量(Peripheral Pulse Measurements)的内涵奖赏的强化学习新办法,这种内涵奖赏是与人类神经体系的呼应相关的 [5]。作者的假设是这种奖赏函数可以协助强化学习处理稀少性(sparse)和歪斜性(skewed),以此进步采样功率。
轿车驾驭是一个日子中很常见的使命,这既依赖于内部的奖赏,也依赖于表面的奖赏。当咱们在高速驾驭轿车的时分,咱们的神经体系是高度激活的,这有助于咱们应对驾驭进程中呈现的突发状况,比方需求紧迫调整方历来防止撞到忽然走向路途中心的行人以防止事端。因而,当遇到突发状况时,这种生理内部的反响会有助于咱们更好地评价当时的环境并协助咱们做出有利的决议计划。
作者在一个模仿的驾驭环境中进行了试验,试验标明这种奖赏在学习阶段可以进步学习速度以及削减磕碰次数,即有用削减奖赏信号的稀少性。
图 2-1 依据内涵生理奖赏的强化学习 [5]
如图 2-1 所示,与一般强化学习模型的不同之处在于,作者提出的强化学习模型的奖赏首要分为两个部分,一个是外部环境的奖赏(Extrinsic Reward),一个是由内部生理反响发作的内部奖赏(Intrinsic Reward)。作者运用皮肤周围血管血液体积,即比方血容量脉息动摇(Blood Volume Pulse Wave),来模仿内部生理状况的反响。中心思维是假如人在遇到某种紧迫的状况,那么人的严重心情就会经过生理反响体现出来,比方血容量脉息动摇变大。作者提出的模型规划了一个新的奖赏函数,该奖赏函数如下:
公式中前者 r 代表外部环境的奖赏,而后者 r~(上波涛线)代表内部奖赏,λ代表权重。
图 2-2 依据场景猜测血容量脉冲动摇的卷积神经网络模型 [5]
这种办法的要害问题之一便是怎么确定在开车进程中哪种驾驭场景会导致驾驭者心思呈现动摇,比方心跳加速和血压升高。作者找了四个人来获取皮肤周围血液体积的改动,具体做法是让这四个人别离在这个模仿驾驭场景中进行驾驭,并记载每一帧图画(驾驭场景)的改动以及参与者自己对应的血容量脉冲动摇数据。如图 2-2 所示,作者运用获取到的数据对一个八层的卷积神经网络进行练习,图画帧作为输入数据,血容量脉冲动摇作为标签,值在 0 到 1 之间。练习好的模型便可用来猜测特定驾驭场景的心思反响,这种心思反响便是咱们前面说到的内部奖赏。
2.2. 试验
图 2-3 试验成果 1[5]
如图 2-3 所示,纵坐标代表不同的测验方针,如均匀速度、均匀间隔和方针导向的均匀间隔,而横坐标则代表不同数目的模仿次数。其间λ是咱们前面说到的奖赏函数的权值,λ越大,则代表越依赖于外部奖赏,当λ=1 时,则退化成传统的深度 Q 学习算法,当λ=0 时,则代表彻底依赖于内部生理状况的奖赏。从试验成果咱们可以看到,λ处于中心值时,这既能改进学习速率,又能促进署理更好地采纳与使命相关的特定行为。
图 2-4 试验成果 2[5]
为了测验内部奖赏能否协助智能体削减磕碰,作者查询了在不同λ状况下,智能体在磕碰之前所阅历的模仿次数(episodes)。如图 2-4 所示,咱们可以看到当λ=1(彻底依赖于外部奖赏)时,在第一次磕碰之前的均匀模仿次数简直总是最低的,这说明内部奖赏的确可以协助智能体有用削减磕碰。
3. 总结
北宋闻名词人柳永曾在蝶恋花中写道,「衣带渐宽终不悔,为伊消得人瘦弱」,这描绘了一种思念意中人到极致而瘦弱的状况。
高兴、忧虑等情感刻画了咱们人类本身,决议了咱们自己是谁,并影响着咱们的日常行为。情感触及到了人类的认知,是人类智能最中心的部分,更好地了解情感将会更好地协助咱们规划出更强壮的机器智能。
参阅:
[1] https:///en-us/research/blog/toward-emotionally-intelligent-artificial-intelligence/
[2] https://book.yunzhan365.com/poui/pudn/mobile/index.html?from=timeline&isappinstalled=0
[3] https://managementmania.com/en/six-basic-emotions
[4] https:///wp-content/uploads/2013/07/Basic-Emotions.pdf
[5] https:///en-us/research/publication/visceral-machines-risk-aversion-in-reinforcement-learning-with-intrinsic-physiological-rewards/
[6] https:///en-us/research/publication/neural-tts-stylization-with-adversarial-and-collaborative-games/
[7] https://researchdemopage.wixsite.com/tts-gan
[8] https://robohub.org/nao-next-gen-now-available-for-the-consumer-market/
[9] https:///emotion-wheel/
[12] https:///en-us/research/publication/emotional-dialogue-generation-using-image-grounded-language-models/
作者介绍:曾祥极是浙江大学核算机方向的硕士,首要研讨常识(Commonsense)以及常识图谱(Knowledge Graph),一起也对认知科学和体系科学这两个学科很感兴趣,痴迷于智能是怎么出现。作为机器之心技能剖析师的一员,我期望经过文字理清当时技能的开展前沿,与咱们一起共享我的见地,也期望咱们都能从中有所收成。
本文为机器之心原创,转载请联络本大众号取得授权。
------------------------------------------------