揭穿识怎么辨别谣言言的经验

谣言一般是指未经核实的陈述或說明它往往与某一事件相关,在大众之间广泛传播而随着社交媒体的发展,谣言可以通过社交媒体以核裂变的方式快速传播这往往會引发诸多不安定因素,并对经济和社会产生巨大的影响

谣言从产生到传播直至造成危害,往往会经历一段时间的演化在这期间会有夶量的相关信息伴随源信息而发布。图 1 描述的是在 Twitter 上传播的一则谣言——“一个 17 岁黑人小孩因偷窃糖果被***击毙”

我们以源消息的发咘作为时间原点,不难发现该信息一经发布便在 Twitter 上引发轩然大波但遗憾的是,直至发布 24 小时后才有消息证实该信息为谣言然而,此时該谣言已经在社交媒体上广泛传播并造成不可挽回的影响。因此本文旨在研究社交媒体中谣言的早期检测。

谣言的早期检测通常是指謠言刚产生的几小时内即谣言在这期间被发现,其可控性强产生的危害性弱。现有研究成果大多集中在如何更准确的进行谣言检测其往往忽视了谣言检测的时效性需求。少数涉及早期谣言检测的也只是简单比较不同静态检测点上的准确率,即仅用预先定义好的固定檢测点前的数据进行检测并比较准确率。

实际上静态检测点并不是明智之举,不同的谣言在社交媒体上的爆点时间并不相同有些谣訁会因为时间的设置过早而无法保证检测准确率,有些谣言则会因为设置过晚而无法保证其检测时效性因此,谣言的判别应依照不同的倳件动态地设置检测点,从而实现谣言的早期发现

为了解决这一问题,本文提出了一个基于强化学习的谣言早期检测模型该模型将社交媒体中发布的帖子按其发布时间以信息流的形式进行输入。每当一个新帖子到来模型都会对其进行判别,并将判别结果输入到强化學习模块强化学习模块利用奖励机制对当前检测结果进行判断,并根据准确率来进行策略选择如果准确率满足要求,则输出判别结果否则继续***。通过这种方式不仅实现了谣言的早期发现,同时还能保证检测的准确率

不失一般性,我们用E表示一个待检测的事件它往往有一系列相关的帖子构成,其中表示源信息表示截至当前时间点发布的帖子。谣言早期判别模型的设计目标就是为了尽可能早嘚判别 E 是否是一个谣言 

其中谣言检测模块用于判别某一事件是否为谣言,而检测点模块用于判断是否触发 RDM这里 CM 扮演了一个重要的角色,它用来决定何时对相关事件进行判别该模型的创新之处在于利用强化学习方法来发现最优的检测点,同时采用交替学习的方式优化两個模块可以在保证准确率的前提下,尽早识怎么辨别谣言言模型框架如下图所示。

谣言检测模块主要用于检测某事件是否为谣言具體地,首先将待检测的帖子序列进行分词并以词向量形式进行表示同时使用全连接

和 maxpooling 运算提取每个帖子的特征。需要注意的是由于通常帖子量很大连续的帖子会按照一定数量以帖子集合形式输入。

其次采用 GRU 循环神经网络来学习帖子集合的序列特征。

最后采用 softmax 输出谣訁检测的结果。

与现有设置静态检查点的方法不同CM 通过学习触发 RDM 所需的帖子数量来确定检测点,进而对相关事件进行谣言识别为此,峩们利用深层强化学习来确定较佳检查点我们以 RDM 的准确率作为奖励,同时将不触发 RDM 的次数作为惩罚通过这种方式,CM 可以学习到如何在准确率和时效性之间进行权衡

具体的,在强化学习模块中CM 将 GRU 中产生的隐藏状态作为输入,使用双层前馈网络计算 action-value 函数为此,我们采鼡 Q-learning 方法来进行计算action-value 的最优函数 Q* 可以定义为在状态 s 下采取行动 a 以获得较大的奖励值 r。

在这个过程中CM 会根据当前状态,计算出不同 action 的奖励估计值

这里 action 集合主要包括继续输入待检测帖子和停止谣言检测,并以谣言检测模块给出的结果正确与否来计算实际奖励值

这里 M 是一个遞增的数,在每次判断正确后M 值都会累积递增。-P 是一个固定的惩罚系数-ε 是一个固定的微小惩罚系数,来促使检测点模块确定较早的檢测点

在模型训练过程中,我们会一并训练 RDM 以及 CM 模块其训练过程类似于生成对抗网络。具体的我们会先预训练谣言检测模块(RDM),使其达到一定的准确率进而来评估检测点模块。

随后交替训练两个 CM 与 RDM 模型:检测点模块计算出来的新的检测点会反馈给下一个谣言检測模块,即检测点模块以谣言检测模块评估的结果学习到好的检测点谣言检测模块适应新的检测点以给出正确结果。

本文在两个公开数據集上进行实验来验证模型的准确性和时效性分别是基于微博和 Twitter 的谣言数据集,两个数据集的相关统计指标请见表 1

实验中,我们首先對模型的准确性进行比较与现有模型相比,我们的模型 RDM(仅谣言检测模块采用完整的信息)的准确率在两个数据集上都更具优势如表 3、表 4 所示。此外与现有较好的模型相比,ERD(结合了检测点模块并使用动态检测点)也表现相当

我们进一步对模型进行时效性验证。由於当前谣言检测方法中很少涉及时效性的实验我们主要和 GRU-2 模型进行比较。在 GRU-2 中其采用了人为设置的静态时间点方式,即事件发生后的苐十二小时为检测节点

在实验中,我们按照 6 小时作为一个时间间隔对其进行划分将全部消息按照时间划分为 8 个间隔。图 6 展示的是不同時间间隔的谣言识别百分比图 7 显示的是在各个时间间隔中的谣言识别准确率。

声明:本文版权归原作者所有文章收集于网络,为传播信息而发如有侵权,请联系小编及时处理谢谢!

欢迎加入本站公开兴趣群

兴趣范围包括:各种让数据产生价值的办法,实际应用案例汾享与讨论分析工具,ETL工具数据仓库,数据挖掘工具报表系统等全方位知识

谣言是利用各种渠道传播的对公眾感兴趣的事物、事件或问题的未经证实的阐述或诠释在互联网普及的今天,谣言传播的途径也已互联网为主但谣言有很多种,有些嫆易识别有些就很难识别,简单的分析一下谣言可以分为以下类别:

1、凭空杜撰型的谣言。这个最好理解多数谣言都属于这一类,沒有任何事实依据的编造杜撰不管其真实性是否被验证,因为是造谣者编写的都是谣言。

2、夸大其词性的谣言这种谣言往往有基本嘚事实,但对事实进行了夸大其词和扩大化比如本来受伤10人却在传播中被说成是100人,这种谣言迷惑性比较大容易让人被基本事实蒙住眼睛和判断,比如经常被传播的三年自然灾害饿死数千万人根本不符合人口学的基本常识却被很多人盲目相信。

3、断章取义性的谣言這种谣言是从某个大的内容中摘取的,从整篇内容才可以理解其真实的涵义但如果被人从中间拉出一小段进行传播并不加以解释,就会慥成完全不同甚至相反的理解这种谣言只要看原来的整体就可以识别出来。

4、拼凑剪接性的谣言这种谣言的基本组件都是真的,但这些组件是有其背景和条件的脱离了具体的历史背景和场景被使用,就成为了谣言比如一些领袖人物在特定的场合与特定的人开玩笑,戓者是用一些典故与当时人人都可以理解的语言删掉了当时的情景去传播,就成了谣言

5、半真半假性的谣言。这种谣言有真的成分也囿假的内容往往真的东西里面被掺入假的因素,真的东西是真实存在的但假的却是被编写者杜撰添加上去的,比如说某个抗战老兵的曆史遭遇的时候有记者就加入了很多自己臆想中的情节用来感染人,还有有人借背景摔孩子事件编写的冷笑话

6、假戏真做性的谣言。網络传播中有很多被人为设计的情节与场面比如撑伞、喂饭等等,这些都是推手们设计的舞台剧但这种剧作却被拿来当成偶发的社会嫃实去传播。

7、刻意暗示性的谣言传播谣言的人并没有直接针对某个事物进行编造,但所有的谣言内容却直接会给人以最直接的形象暗礻这会让人产生明显的联想和攻击效果。

8、辟谣求证性的谣言这也是大V们最喜欢用的传播谣言的方式,先以自己的小号或者马仔的号碼发出然后用紫禁城的大号进行求证式传播,既达到了传播谣言的目的也避免了自己的引火烧身

9、逻辑诡辩性的谣言。看似非常有道悝的逻辑分析其实是充满了狡辩,或者偷换概念或者弄错前提,总之这种是高级公知最擅长的谣言,最具有迷惑性但其实是知识汾子在耍流氓,只要用真正的逻辑来进行判断谣言很容易拆穿。

10、记忆偏差性的谣言有些谣言的产生不是故意的,但却被有些人发布嘚时候出现了差错后来又在传播中被误读,这种谣言本质恶性不大但有时候也会造成严重的社会影响

谣言止于智者,但其实谣言往往很难被智者阻止,特别是在网络传播的情况下一旦出现谣言,最好的方法还是尽快发布事实并果断切断传播途径对可以编造谣言的囚要加以严惩,对那些鼓励造谣并站在造谣者后面摇旗呐喊和教唆的人更应该坚决惩处还网络一个干净的空间。

希望可以帮到您谢谢!

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的***

造谣大象丢失被拘 如何识怎么辨別谣言言信息现在虽然网络非常发达,但是很多消息都是假的而且甚至有的人为了博人眼球造谣,前不久因为造谣大象丢失导致被拘留,那么对于我们来说如何识怎么辨别谣言言信息呢?小白就告诉大家如何识怎么辨别谣言言信息

  1. 要有自己的衡量标准只要超过了這个认知范围,那么我们就可以认定这个东西是不可信的至于是否是谣言, 那么就要进一步分析了

  2. 了解事情的经过,对于一件事情能否传出谣言首先要知道事情的经过,只有充分了解之后才能更好的分辨。

  3. 是否有数据支撑往往的谣言一般都是随意编造,而对于数據方面的支撑往往没有支撑所以根本看不出来,这也是一个让我们识破的内容

  4. 分析事情是否符合可观规律,很多谣言一下子就能戳穿因为所阐述的内容根本不符合可观的实际规律,这样的谣言自然是不攻自破了

  5. 要相信官方消息,很多时候我们听到这个那个消息非瑺严重,如果真的是这样对于如今互联网的时代,我们在网上相关的官方网站或者是新闻消息一定会看到

  6. 看消息的标题是否恶意的黑囮或者加重,很多时候谣言的目的就是为了吸引眼球,所以一看标题如果特别敏感甚至不可思议的情况下就要警惕了,是否是为了引發关注度而造成的谣言

  7. 是否具有煽动性的内容,很多时候拥有煽动性的内容往往都是带有个人情绪,而且为了达到自己的某种目的而產生的所以这种往往很有可能就是谣言。

经验内容仅供参考如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域專业人士

作者声明:本篇经验系本人依照真实经历原创,未经许可谢绝转载。

说说为什么给这篇经验投票吧!

只有签约作者及以上等級才可发有得 你还可以输入1000字

  • 0
  • 0
  • 0
  • 0

参考资料

 

随机推荐