设为首页 | 加入收藏 | 关注我们
网站首页 > 科技 > Nature:删帖、屏蔽关键词能阻止网络极端言论?也许效果适
  • Nature:删帖、屏蔽关键词能阻止网络极端言论?也许效果适
  • 2019-10-30 08:20:46 来源:灵源孟埔新闻网
  • 本质:删除帖子和屏蔽关键词能阻止互联网上的极端评论吗?也许效果适得其反。

    原件:郭瑞东集智俱乐部2019-09-17

    晨雾/换乘

    作者郭瑞东

    导言:

    随着社交媒体的普及,极端言论的传播变得更加容易。今年8月发表在《自然》杂志上的一项研究表明,在极端言论蔓延的小世界网络中,关键词屏蔽等传统监管方法不仅无效,而且可能适得其反。

    自古以来就有人说极端的话,比如《乱世佳人》中三k党的出现,它在美国南部仍不时露出尖牙。互联网和社交媒体的普及使得极端言论更容易传播。任何人都可以在facebook上开一个公共账户,让极端言论在短时间内触及数万人。这使得监管者面临的问题更加困难。

    传统智慧告诉你首先要关注主流社交媒体,但8月底《自然》杂志的一篇文章指出,这样做会适得其反。

    极端信息的传输网络是复杂的。

    这篇自然文章标题中的关键词是隐性弹性,即隐性弹性。这是生态学中的一个术语,它描述了一个生态系统在被外界冲击后,由于其网络结构而迅速恢复到其先前状态的能力。本文将社交网络中的极端言语视为生态系统中的一个物种。首先,它指出极端语音在不同平台之间的传播是一站式的——有些极端语音可以一次从一个地区传播到另一个地区。

    在下图中,vkontakte(以下简称vk)是俄语世界的主流社交媒体。在图中,红色代表vk平台之间传输的仇恨言论,蓝色代表脸谱平台之间传输的仇恨言论,绿色代表跨平台传输。

    图1:不同平台之间极端信息的复杂传输网络。

    下图显示了欧洲部分的比例。

    从上面的例子中,我们可以生动地看到极端言论的传播网络是分散的,即一个小世界的网络,它找不到一个核心节点来一劳永逸地解决问题。在这项研究中,作者侧重于一般的极端言论,而不是具体的话题,如伊斯兰国、新纳粹等。文章指出,这些言论的共同点是充满极端和仇恨,尽管仇恨的目标不同(他们可以是移民、同性恋者等)。)。

    基于自动图像识别(例如识别血腥暴力的照片)和文本主题分类,再加上人工筛选,作者给出了一个由768个节点(散布极端言论的账户)和578个边组成的网络。

    极端信息传播网络

    有一个无标度特性

    在更精细的尺度上,下图显示了60多个与三k党有关的极端言论。右边的每个黑点代表社交媒体的用户,每个白点代表与三k党相关的细分主题。每个主题将形成一个集群,相关人数从数万到数万不等。用户之间也将有一个集群,集群用户的数量从一个到数百个不等。在左边的宏视图中,不同集群的大小代表相关用户的数量。群集越远,用户对这两个主题的关注就越少。

    图2:60多条与三k党有关的极端言论

    图3:在群集的大小被标准化之后,

    计算不同大小的极端语音话题簇对应的用户数量分布,

    显然可以看到指数分布。

    网络的无标度特性意味着这种网络更有可能被嵌套,嵌套网络在受到外部攻击时可以快速恢复。

    在不同平台之间,当一个平台禁止某个主题的极端信息时,对应于该主题的用户可以迁移到其他主题,并且经常使用其他单词或“词干”来“加密”极端信息,这使得英语自动监控算法更难检测到新信息。如果仅仅按照常识,没有注意极端言语传播网络的特点,简单的信息筛选只会使极端言语像野草一样无法杀死,这也是隐藏复原力的标题总结的发现。

    根据该数学模型

    不同平台不同监管水平引起的反应

    该数学模型可以定量地解释在什么情况下会出现什么样的预期结果以及应该采取什么样的应对策略来优化。本文提出的模型假设传播极端观点的不同用户将在社交平台之间选择最短路径,并在不同平台和主题的极端观点之间迁移,但这种迁移是有代价的。受空间的限制,模型将不再详细解释,而仅简要描述模型得出的结论。

    假设有两个社交媒体,甲对极端言论有更好的监督,乙缺乏监督。下图的纵轴是平台b上不同主题的极端语句之间最短距离(连接所需的最小用户数)的平均值,横轴是不同主题集群之间的总连接(用户之间的边和极端主题之间的边)。

    通过该图,该模型指出,如果极端语音仅在平台a上被监控,当平台b的用户和极端语音之间的连接数大于某个阈值时,将导致不同主题上的极端语音之间作为一个整体的进一步的距离,从而使得进一步的攻击更加困难(更加分散)。

    图4:仅阻止特定平台上的极端言论

    导致极端言论在网络上进一步扩散

    四种不同

    对极端言论的回应

    本文的另一个主要贡献是从两个维度区分处理极端言语的四种策略,以及这四种策略在数学模型模拟条件下各自的效果。由于篇幅所限,本文仅概述了这四种策略,并在本文的补充材料中进行了详细分析。

    图5:处理不同维度极端言语的四种策略

    横轴表示干预的粒度,纵轴表示干预的方式(自上而下或自下而上)。

    文章指出,为了达到对极端言语的最佳控制效果,需要权衡这四种策略。

    摘要

    如何应对极端言论带来的挑战

    由于人群的两极分化和国家的反对,互联网上各种极端言论也日益增多,极端言论的控制已经成为一个世界性的问题。三k党、新纳粹、isis等国外的恶性肿瘤思想甚至发展成为严重影响社会保障的危险因素。

    在传统的纸质媒体时代,如果你想创办一份宣扬极端观点的报纸,你只需要几个核心成员就可以做到,并对某些极端思想造成毁灭性打击。但是在社交媒体中,传统智慧不再起作用,而是会产生更大的副作用。至于极端思想的形成,其影响因素也从社会网络的邻里实体关系转移到了虚拟空间。这使得算法的影响显而易见,也使得先前不可行的自下而上的方法(例如上面提到的最后两种策略)可行。然而,由于极端言论的多样性和复杂性,人们仍然需要在许多方面进行合作来控制它们。

    除了适用于控制极端言论之外,该案文的结论是否也适用于其他"隐藏网络",如儿童色情制品的传播、非法贩运人口和从传销组织招募人员?对于这一点,作者没有给出明确的答案,但这是一个值得研究的问题。我个人的猜测是,对于所有非法信息传输网络,毛拉三个洞穴中的个人在攻击某个平台时很难达到预期的效果。

    正是因为本文得出的结论具有“反常识”的特点,才有可能应用于更广泛的领域,对现实中重大政策的制定具有具体的指导意义。

    来源:微信公众号鸡翅俱乐部2019-09-17

    id:swarma_org

上一篇:人民日报评论员:把协商民主贯穿履行职能全过程 下一篇:平常易出汗一定要注意,可能是缺钾,多吃这食材,身体更健康