[Reading Notes] Stance Detection (2)

[EMNLP’20] DeSMOG: Detecting Stance in Media On Global Warming

作者(Dan Jurafsky !!!哇)专门针对global warming这个话题做了一个数据集,强调在讨论该话题时,人们通常引用并评价他人的观点来表达自己的观点的情况。例如:

Leading scientists agree that global warming is a serious concern. Mistaken scientists claim that global warming is serious.

作者将这种现象归纳为[ENTITY] [EXPRESS] [STATEMENT] 的模式,分别对应为SOURCE, PREDICATE, OPINION。当使用不同的主张动词(agree/ claim)时会形成对该句子不同的理解

img

针对这个现象,作者提出了两个问题:

Q1: Do different sides of a debate (in this case, GW-accepting and GW-skeptical media) show symmetry in their use of self-affirming and opponent-doubting discourse? 辩论双方(认同/怀疑全球变暖的媒体双方)是否在肯定自己和否定对方的论述使用中呈现出对称性? Q2: In cases where OPINIONS are ascribed to a named entity with a known (public) stance, does the stance of the OPINION match the expected stance of the named entity? 当观点归因于一个有着公认立场的命名实体时,该观点所表达的立场是否与该命名实体一致?(没举个例子有点晦涩难懂哈,简单来说,就是OPINION的立场是否与SOURCE的立场相符吧)

实验分析:作者利用种子词及WordNet扩展得到肯定词库(affirming devices)和怀疑词库(doubting devices)。对于问题一,实验结果表明在认同全球变暖的媒体论述中,self-affirming的比例远多于opponent-doubting,而在怀疑全球变暖的媒体论述中,二者比例几乎持平;对于问题二,双方分别有37%和38%的instance是不相符的,但是在GW-skeptical media(RL)中这些引用来源相比于GW-accepting(LL)广泛得多,同时作者还对双方使用的主张词(就是中间那个动词啦我也不知道怎么翻译)的差别进行了统计,总结出了发生以上不相符情况的常用词,例如acknowledge, admit, etc.

这篇paper跟之前看的都不太一样,全篇没有提到什么新的模型,没有用普遍的数据集,但是却以一个独特的视角分析了Global warming这个单独的话题,很多语言学,社会学,统计上的分析,写的句子也有点难懂,第一遍的时候真的没看下去(我发现了,有没有公式我都看不下去哎)。感觉跟之前在B站看到Dan Jurafsky的一个访谈节目里对他的印象一样,他们都在研究一些真的有趣有用的东西,敏锐的观察和新颖的思考,提出并解决新的问题,而不是在什么数据集上刷SOTA,调模型。希望以后我也能像他们一样吧,这样的research才是有灵魂的。

[EMNLP’20] Unsupervised stance detection for arguments from consequences

这篇paper时专门针对一种表达立场的模式做无监督的立场检测。具体来说,作者提到我们在表达观点时,经常提及某个事件发生的后果来支持我们的观点/反对他人的观点,即argument from consequences,具体来说

If A is brought about, then good (bad) consequences will (may plausibly) occur, and a conclusion A should (not) be brought about.

于是,作者提出一种pattern来匹配/建模这种表达方式,并直接根据pattern的结果推理出其所表达的stance。此外,本文还提出了一个满足这种模式的数据集。

< (T, dir), (P, eff ), (O, sent) > 其中T表示target,dir=1表示陈述是夸大target,dir=-1表示陈述在减弱target;P表示predicate,eff=1为积极作用,eff=-1为消极作用;O即object,sent=1表示该object被视为积极情感的事情,sent=-1为消极的事。

然后作者先提取出以上三元组,利用规定好的pattern规则,实现无监督判断一个句子对于目标的立场。

img

##[WWW’19] From Stances’ Imbalance to Their HierarchicalRepresentation and Detection

适用于Fake news领域的stance detection,target对应claims(新闻标题),tweet对应evidence(新闻内容)。作者提出原来的数据存在类别数据量不平衡的问题,因此将agree, disagree, discuss合并为related这个类别,提出两层神经网络模型,第一层先判断是related还是unrelated,第二层判断是agree/disagree/discuss。同时,两层的误差传播有三种方式,1认为两层没有依赖关系,不联合传播误差;2认为两层有关系;3通过MMD这种算法来学习二者的依赖性判断是否传播误差。

img

[SIGIR’19] Modeling Transferable Topics for Cross-Target Stance Detection

本文的任务是跨立场检测,提出在target之间有隐藏的话题(lantent topic)可以作为迁移的知识(target之间内在联系/共通点),利用无标注的target下的数据得到topic knowledge,作为memory融入到分类器中。一个弊端是,需要人工来判断是否target之间有隐藏的联系,例如本文只提到了两对相似的可以进行迁移的target(Feminist Movement与Legalization of Abortion, Hillary Clinton与Donald Trump),局限性太大,不能应对现实情况中,各种target无规律出现的情况。

img

Reference

  1. DeSMOG: Detecting Stance in Media On Global Warming https://www.aclweb.org/anthology/2020.findings-emnlp.296
  2. Unsupervised stance detection for arguments from consequences https://www.aclweb.org/anthology/2020.emnlp-main.4
  3. From Stances’ Imbalance to Their HierarchicalRepresentation and Detection http://dl.acm.org/citation.cfm?doid=3308558.3313724
  4. Modeling Transferable Topics for Cross-Target Stance Detection https://dl.acm.org/doi/10.1145/3331184.3331367