[Reading Notes] Stance Detection (1)

Introduction: 本篇笔记主要是ACL’20的stance detection相关论文。stance detection中文叫做立场检测,任务目标是给定一段文本和一个话题/实体/事件等(target),判断该文本对于该话题是持支持、反对还是中立态度(favor/ against/ neutral)。封面图

Here we go ——

Enhancing Cross-target Stance Detection with Transferable Semantic-Emotion Knowledge (略读)

这是一篇关于cross-target stance detection的论文,也就是说训练集中出现的话题target在测试集中没有出现,需要模型在训练集到测试集进行知识的迁移。适用场景为:无需大量费时费力的人工标注,根据已有的训练集得到的模型,可以直接应用在新的target上(众所周知,在如今的社交平台上,无时无刻不在产生新的target)。话说回来,列contribution

  • 利用来自外部的语义(sematic)和情感词典(emotion lexicons)信息构建语义-情感异质图(semantic-emotion heterogeneous graph),并使用GCN来学习语义图表示。
  • 将标准的LSTM cell中扩充了一个额外的记忆模块(memory unit),有效地将外部知识整合到分类器中。
  • 当然还有实验效果啦,那不得比其他方法表现好嘛。(数据集:SemEval-2016 Task 6)

感觉现在很多工作都在做如何给模型融入外部知识,比较常见的就是融入知识图谱。这不,这篇paper便利用了SenticNet 融入语义词典,同时以word作为点,并根据语义关系连边;还利用了EmoLex 在前面形成的图中加入情感方面的语义信息(也就是再加点相关的点和边啦),以此构成一个图。作者认为这个图可以帮助模型在知识迁移过程中更好地区分出那些重要的词语。

img

个人认为,这种改进LSTM结构的想法还挺新鲜的(可能是我看的论文太少了之前没接触过),还用到了感觉最近很火的GCN来做图嵌入。方法和实验部分没有仔细读,就先不深入了。

Agreement Prediction of Arguments in Cyber Argumentation for Detecting Stance Polarity and Intensity(略读)

这篇文章一个主要的创新点在于提出一个新的任务,即stance intensity。上文说到的目前的stance detection任务都是做polarity分类,也就是三种不同的态度极性,而本文提出将文本表达的态度的程度用一种[-1, 1]的连续值表示(针对不同post之间的回应关系),能更好地在实际场景中进行分析。为此,本文还提出了一个新的dataset。

Will-They-Won’t-They: A Very Large Dataset for Stance Detection on Twitter (略读)

这篇paper同样也是提出了一个新的数据集,特点就是:规模非常大,专注于金融领域。相比于之前的数据集(几千的数据量),该数据集有51,284条tweet,平均每个target下有一万条左右的数据,用11个现有的模型在新数据集做实验,发现结果都有明显的下降,说明了该数据集的挑战性。同时,本文还提出了entertainment领域的数据,以此支持对domain adaptation的研究工作。

Reference

  1. Stance Detection: A Survey https://dl.acm.org/doi/10.1145/3369026
  2. Enhancing Cross-target Stance Detection with Transferable Semantic-Emotion Knowledge https://www.aclweb.org/anthology/2020.acl-main.291
  3. SenticNet 5: Discovering Conceptual Primitives for Sentiment Analysis by Means of Context Embeddings
  4. Crowd- sourcing a word–emotion association lexicon
  5. Agreement Prediction of Arguments in Cyber Argumentation for Detecting Stance Polarity and Intensity https://www.aclweb.org/anthology/2020.acl-main.509
  6. Will-They-Won’t-They: A Very Large Dataset for Stance Detection on Twitter https://www.aclweb.org/anthology/2020.acl-main.157