0%

摘要以及引言

人类拥有独特能力能够察觉到复杂,有细微差别的情绪,也拥有使用语言与他人交流这些体验的独特能力。尽管近些年的研究(...)提供了大量的证据,证明系统能够表达情感可以很大程度上提高用户的满意程度,但是对于制作一个产生更情绪化回复的对话系统来说,仍旧具有很大的挑战。

在早期的表征工作中,人工地准备一些规则,即有意地从语料库中选择一些需要的“情绪化”回复。在语料库中进行精心地调查后,这些规则由这方面的专家编写,但是这使得复杂多变的情感难以表达,并且难以很好地扩展到大型数据集。早期的情绪表征工作

最近,seq2seq 被用于构建对话模型。ECM 也由 Zhou et al(2018) 提出解决情绪表达的问题。然而还是遭受到了不小的困难。

语言在情感中扮演了重要的角色。正如表 1 所示,我们发现至少有两种方式可以将情感填入单词之中。一个是明确地(explicit)使用强烈的情感词汇来描述情绪状态(emotion states),例如“anger”,“disgust”,“contentment”,“joy”,“sadness”等;另一个是增强情感表达的强度,与之前的不同,它不是通过情感词汇,而是在某种情感上含蓄地(implicit)组合各种中性词。(博主注:如果无法理解,可以看原论文中的表一,它提供了例子)

在本项研究中,我们提出一个情感对话系统(emotional dialogue system,EmoDS),它可以以明确或者含蓄的方式,将一种特定的情感表达到具有连贯结构的词汇中我们使用一个基于字典的 attention 机制(lexicon-based attention mechanism)扩展 seq2seq 模型,这对使用情绪字典中的同义词替换回复中的单词有促进作用。回复生成步骤将由序列级别的情绪分类器指导,它不仅可以增强情绪表达的强度,还有助于识别不包含任何情绪单词的情绪化语句。我们还提出了一个半监督的方法去创建一个情绪字典,它是一个相对“准确”的情绪状态表征。实验结果显示了 EmoDS “厉害”。

阅读全文 »

摘要以及引言

现在的神经对话模型主要在词汇句法层面处理自然语言,而忽略了人与人对话中最关键的成分之一:其中的情感内容。我们在这一方向上迈出一小步,提出三种新型的方式,将情感(affective/emotional)融入 LSTM encoder-decoder 神经对话模型:1)情感词嵌入(affective word embeddings),这是认知上的设计;2)基于情感的优化函数(affect-based objective functions),增强了标准的交叉熵函数;3)用于解码的情感多样集束搜索(affectively diverse beam search)。实验表明这些技巧提高了 encoder-deocder 模型的开放域对话造诣,并且使得它能够产生富含情绪的回复,这些回复更有趣且更自然。摘要

人机对话系统已经有了很广泛的应用,从酒店预订到情绪化虚拟助手。在基于神经网络的对话系统中,离散的单词被映射为真实值的向量,这被称为嵌入,它们捕获到了单词的抽象意义;然后基于 LSTM 的 encoder-deocder 框架根据一条或者一系列先前的语句产生回复。编码解码方向上最近的进展已经表明,它在面向任务的对话系统和开放域回复生成上都是有效的。对话系统的一般做法

虽然现在大多数的神经对话模型可以在句法上生成格式良好的回复,但是他们脱离上下文、简短、枯燥且含糊。最近解决这些问题的一些贡献包括:diverse decoding(Li, Monroe, and Jurafsky 2016; ...),diversity-promoting objective functions(Li et al. 2016a),adversarial learning(...),latent variable modeling for diversity(...),human-in-the-loop reinforcement learning(...),online active learning(...),latent intention modeling(...),content-introduce approaches(...)。虽然这些进展有希望解决以上问题,但是我们仍旧离我们的目标很远——建造一个自动化神经助手,可以始终实现有趣的类人对话。近年解决生成语句单一的做法

现存开放域神经对话模型的其中一个缺点是对自然语言情感建模的缺乏。在大型的对话数据集上训练时,这些模型没有捕捉到人与人交互时的情绪状态,它们通常通过单词、短语与或者情绪的选择从而表现出来。例如 seq2seq 模型中的 attention 机制可以学习得到句法级的对齐。类似地,像 Word2Vec 的词嵌入通过上下文可以学习到词向量,并且可以永久地保存低级的语义。然而,现存模型无法清楚地捕捉到情绪方面的状态。现存模型的缺陷

我们的目标是在开放域神经对话模型中,通过情感智能增强它们以此缓和此类问题。我们将以三种方式实现:

  1. 我们使用认知工程化的词汇级情感词典,将单词嵌入到三维情感空间中(...),其中情感相似的结构彼此接近。通过这种方式,随后的神经模型可以感知到单词的情感特征;
  2. 我们提出使用情感目标,增强标准的交叉熵损失函数,因此我们的模型将会被明确地“指导”从而产生更多的情感语句;
  3. 我们将情感的多样性注入进生成的回复中,回复将通过情感多样集束搜索(affectively diverse beam search)算法的解码器生成,因此我们的模型能够在解码期间有效地搜索到带有情感的回复。
    阅读全文 »

什么是迁移学习

现在手上有一些与本实验没有直接关系的数据集,那么能不能使用该数据集来帮助我们做一些事情。

比如说要开发一个图像识别的模型,去识别医学上的图像。这方面的数据集可能很少,但是作为图片本身来说是有很多的。比如猫狗图片也是图片。

阅读全文 »

视频来自 https://www.bilibili.com/video/BV15t4y127V1。视频于 12:25 正式开始。

简介和概览

本视频从 30:10 开始介绍多任务学习,之前都是在做简单的介绍。 首先如何定义任务(task)?给定数据集 \(\mathcal{D}\) 以及损失函数 \(\mathcal{L}\),然后使用它们训练模型 \(f_{\theta}\)这是目前的简单定义,课程后期会更严谨地进行定义。 所以不同的任务会根据,1)不同的对象(different objects)比如一个任务是对猫分类,另一个任务是对杯子分类;2)不同的人(different people),对不同的人进行不同的预测;3)不同的目标(different objective)等进行变化。

阅读全文 »

论文地址,作者为 Zandie et al.,发表于 2020 年。

摘要以及引言

理解情绪并且对此作出回复是对话系统最大的挑战之一。本轮提出 EmpTransfo,一个多头 Transformer 架构,用于创建一个移情对话系统。EmpTransfo 利用用于语言生成的一流预训练模型(例如 OpenAI-GPT),不过可以使用不同的大小。我们展示了利用历史的情绪以及其他的元数据(metadata)可以提高生成对话的质量。我们使用一个具有挑战性的语言语料库进行的实验结果表明,我们提出的方法在 Hit@1 以及 PPL(Perplexity)上优于其他模型。

人类拥有独特的能力,能够使用细微的情绪通过自然语言交流。大多数现存的对话系统关注语言生成以及提高生成语言的质量。尽管它们也很重要,但是移情的能力是进行高质量对话必不可少的一环。

近来,NLP 取得了巨大的成功,但是结合类似情绪(emotion)以及上下文知识仍旧是一个挑战。

尽管用于大多数传统对话系统的语料库通常是大规模的,但是它们缺乏特殊性,不包含情绪,主题,人格等原数据。基于通用语料库训练出来的系统导致对话助手无法理解情绪,缺乏人格并且趋向于产生通用的回复,例如“我不知道”。因此有必要创建一个带有更多上下文信息的数据集。例如 DAILYDIALOG 包含情绪,主题,动作。

阅读全文 »

论文地址,作者为 Zhong et al.,发表于 2020 年。 这论文现在叫 Endowing Empathetic Dialogue Systems with Personas。

摘要以及引言

移情对话模型已经在很多领域被证明能够提高用户的满意度和改进任务的结果。在心理学上,persona 被证明与 personality 高度关联,进而影响移情(博主注:我实在不知道 persona 和 personality 有什么区别)。此外,经我们的实证分析也认为 persona 在移情对话中扮演者重要的角色。为此,我们提出了一个 persona-based 移情对话的新任务,并首次对 persona 在移情反应上的影响进行了实证研究。具体而言,我们首次提出了一个用于 persona-based 移情对话的新的大规模多领域数据集 Persona-based Empathetic Conversion(PEC)。然后我们还提出了 CoBERT,一个基于 BERT 的高效回复检索模型,在我们的数据集上获得了一流的性能(博主吐槽你们自己首次提出的数据集,当然是一流的)。最后做了总结。值得注意的是我们的结果展示出,当 CoBERT 在移情对话上训练而不是非移情对话上训练时,persona 能够提高移情回复的效果。 移情(empathy),严格来讲是情感共情(affective empathy),指的是用合适的情感(emotion)对他人的精神状态做出回应的能力。 当产生移情回应时,大多数现存的研究都没有考虑 persona。XiaoIce 有,但是她的 persona 是不可配置的,因此很难满足各种人类的需求。

阅读全文 »

论文地址,论文作者为 Rashkin et al.,发表于 2018 年。本文发布了一个情绪对话数据集。

我突然发现作者还有另一篇论文,与这篇几乎一模一样。

摘要与引言

对话代理的一个挑战是识别交谈对象的感受并且相应地做出回应,这一领域难做的原因是缺少合适、公开、可用的情绪(emotion)、对话(dialogue)数据集。本文提出一个新的移情对话生成(empathetic dialogue generation)任务以及一个移情对话数据集。与其他仅在大规模互联网对话数据上训练的模型相比,本实验表明使用此数据集训练的对话模型,由人类评测后被认为更具有同情心,同时在其他的指标上也有所改进(如 BLEU)。

阅读全文 »

目前所记录的论文只截止到 2020 年。此外,还有情感计算论文调研的文章。

2021.04.08 更新:此篇文章大概不会再更新,因为博主转做任务型对话了。(;д;)

Towards Persona-Based Empathetic Conversational Models

2020.10.24 留:本文未完成。

Introduction

情感计算(affective computing),移情计算(empathetic computing)。

阅读全文 »

论文地址,论文作者为 Zhou, Hao, et al.,发表于 2017 年。

论文概要与引言

想要对话系统或者对话助手取得成功,对情绪的感知和表达是一个关键因素。本文提出 Emotional Chatting MachineECM),可产生带有情绪的回复,而不仅仅是合乎情理且语法准确的内容。

阅读全文 »