国际视野下治理虚假新闻的技术手段及相关模型 -pg电子娱乐平台

2023-03-08上传
暂无简介
文档格式:
.pdf
文档大小:
1.84m
文档页数:
5
顶 /踩数:
收藏人数:
0
评论次数:
文档热度:
文档分类:
论文  -- 
17专题导语假新闻由来已久,但由于近年来社交媒体的低门槛和广泛应用,以及深度伪造等新技术的加持,社会原有的甄别及防范机制难以及时做出反应,假新闻掀起一波又一波浪潮,逐渐泛滥成灾,严重冲击了全球的政治、经济秩序,成为人类公害。在中国知网平台上以“假新闻”为主题搜索相关论文,可以看到目前国内对假新闻的研究主要集中在网络舆论和政治传播等维度,关注假新闻生成原因、扩散机制、社会危害、监管治理等方面。其中治理对策偏重于法律监管和行业自律,技术探讨相对较少。对比同时期相关的外文文献,发现其更关注具体的打击假新闻的技术手段。相对于法律法规、道德约束、媒介素养等需多方联动、长久发力的治理措施,当下以技术为主导参与假新闻治理更加实际、可操作性更强。本文通过分析目前打击假新闻的常用方法以及主要检测技术,探索人工智能参与假新闻治理的国际经验,以求为国内打击虚假新闻、净化媒体环境提供参考和借鉴。早期治理假新闻的常用方法早期治理假新闻的常用方法包括:事实核查、来源验证、评论核查、新闻内容特征核查、用户参与度以及个人资料与文章、读者、发布者之间的关系核查等。其中,事实核查和来源验证是打击假新闻最普遍的做法。英国“第四新闻频道”在2010年就创建了打击假新闻部门“事实核查”(factcheck);2011推出事实核查博客网站realitycheck;2015年,bbc建事实核查团队“现实核查”;2016年事实检查机构fullfact推出自己的监控系统,用于掌握每个谣言的生命周期。目前,打击假新闻的普遍做法是在核查后的信息上打标签。譬如facebook和twitter等社交平台和以googlenews为代表的搜索引擎对可疑内容标记上“正在由第三方机构进行事实核查”,这些内容不被平台优先推荐,处于新闻流的末端。facebook还设置了24小时举报功能,以尽可能早地发现不实信息。《世“dcodex”事实核查数据库,利用颜色编码系统,让读者了解某一网站的可靠性,如绿色代表高度可靠,黄色代表谨慎阅读,红色则意味着该网站会发布虚假信息或完全编造的故事。讽刺性网站标记为蓝色,而一些不能被验证的网站则被标记为灰色。建了事实核查网站pagellapolitica。这些核查工作有力地遏制了假新闻的传播,但因信息数量的急速增长,核查需要更多的技术支撑。近年来假新闻治理的研究方向有统计表明,目前散布假新闻的账户中,三分之一到三分之二是社交机器人账户。假新闻在生产传播过程中运用的主要技术包括算法技术(algorithmic)、深度伪造技术(deepfake)、机器学习技术(machinelearning)等。其中,算法推荐指引着流量的流向,用户分析实现精准化与智能化,平台在“流量思维”驱使下,造假、造谣屡禁不止。而深度伪造技术和机器深度学习、自动决策技术让信息实现了图像与视频的自动生产,新闻生产分发日趋机器化、智能化,加大了信息的可操纵性。随着人工智能变得越来越复杂,机器人制作、分发的新闻成了假新闻的重灾区,捉襟见肘的人工核查已经不能有效打击海量且日益隐蔽的假新闻,打击假新闻的研究目光转向了自动化技术。《世界报》的事实核查团队就一直在与数据科学家合作,探索如何利用自动化技术及时发现假新闻。2019年华盛顿大学和艾伦人工智能研究所的研究者提出了一种名为grover的鉴定模型。它从google新闻上5000不同媒体撰写的新闻中进行学习,在此期间接收了120千兆字节的真实新闻文章,并用这些文章进行训练,最grover分辨人和ai写的故事的正确率是92%。在此之国际视野下治理虚假新闻的技术手段及相关模型(《中国传媒科技》杂志社,北京100031)要:伴随着人工智能、社交媒体、大数据、vr/ar等技术的进一步发展,假新闻混入信息的汪洋大海,无孔不入,难以辨别,引发了全球的传播危机、社会危机,已经成为一个不容忽视的议题。本文通过梳理目前治理虚假新闻的技术手段,总结国际经验,以求为国内打击虚假新闻、净化媒体环境、营造清朗的媒体空间提供参考和借鉴。关键词:假新闻治理;事实核查;人工智能;假新闻检测技术;深度伪造中图分类号:g210文献标识码:a文章编号:1671-0134(2021)08-017-05doi:10.19483/j.cnki.11-4653/n.2021.08.003本文著录格式:李净.国际视野下治理虚假新闻的技术手段及相关模型[j].中国传媒科技,2021(08):17-21.专题18前,最好的假新闻识别器正确率是73%。grover之所以能如此有效地发现虚假内容,是因为它也非常善于自己制作内容。以彼之道还施彼身,用技术抵御“技术‘制造’”,是目前我们治理假新闻的最佳手段。假新闻治理的技术路径治理假新闻的具体技术路径在于如何更好地掌握规律、制定规则、确立模型,给算法提供正确指引,让人工智能能够更有效地甄别虚假和低俗内容并控制其传播。这方面虚假新闻检测技术跑在最前面。虚假信息检测技术是指通过自然语言处理、社交挖掘、跨模态分析等智能处理方法,发现并利用信息的内在特征、产生机理与传播规律,识别并干预假新闻的传播。其中运用的技术包括传统的机器学习算法(比如逻辑回归算法、支持向量机和随机森林等算法)、深度学习(包括、卷积和递归神经网络)和其他模型(矩阵分解和贝叶斯推理等模型)。下文从新闻内容特征、预测性检测、可解释性检测等方面选取最新的检测模型,逐一介绍。3.1基于内容特征的虚假新闻检测技术根据内容特征的不同,可分为基于文本的、基于图像的,以及基于多模态的虚假信息检测。3.1.1以文本为对象的检测基于文本的检测是虚假信息检测最常用的方法。大多数研究利用文本内容和传播过程中产生的社交上下文(基于用户行为可信度或基于传播网络或语义和情感度fakenews》利用文档的风格,对不同来源的数据分类,为新闻的可信度进行打分,从而检测假新闻。早期采用提取语言学特征、主题特征等特征的方法,[7-9]近年来使用深度模型自动学习数据高层特征的方法,[10]基于社交上下文的方法主要包括基于用户行为可信度的方法,[11]以及基于传播网络的方法。[12-15]论文“基于主题与情感联合预训练的虚假评论检测方法”抽取评论的语义和情感上下文特征,并进行联合训练和优化。[16]3.1.2以图像为对象的检测面向图的异常检测工作最早发表于2003常检测是指在一个大图或海量图数据库中寻找包含陌生或异常模式的结构(包括节点、边或者子图),研究对象可分为静态图和动态图两类。静态图上的异常通常是指图中有明显偏差的节点、边或子图。动态图则因为会随着时间变化,产生新的节点或边的增加和删除,所以异常通常是导致变化或事件发生的topk个节点、边或子图异常检测通常基于图的结构信息检测(包括节点与节点之间、节点与子图之间,以及子图与子图之间的异常);[18-20]基于子空间选择,检测在节点特征的子空间中的异常,[21-23] 以及基于概率统计等进行统计学分析, [24-27] 获取图的统计信息进行检测;动态图经常是先获取 图的概要,然后通过聚类和异常检测来确定概要中的异 常,例如文献。 [28-29] 同时利用深度学习方法检测图像也 正在被不断探索研究。 [30] 目前在业界,针对图像的检测,微软运用了face x-ray 技术,提出通用的检测不同模型生成的合成图的 方法,核心是去学习换脸的边界,方法泛化性能优良。 芝加哥大学的fawkes 技术,可为私人照片提供人眼不可 见的像素级保护,避免用户被未知第三方人脸识别模型 检测并追踪。脸书推出名为“rosetta”的ai 系统,用于 帮助计算机理解并分析每天发布在平台上海量的图像与 视频。 3.1.3 以音频为对象的检测 语音伪造常见方式为:语音模仿、录音重放、语音 合成和语音转换, [31] 检测主要运用的技术是卷积神经网 及其变种。工作方向集中在以下几个方面。 (1)利用音频的声学特征。选取可区别真实语音和 伪造语音的声学特征。如todisco 等人将常数 变换倒谱系数(constantqcepstralcoefficients,cqcc) 应用于语音 鉴伪中,sahidullah 等人用线性滤波代替了梅尔刻度滤波, 提出了线性频率倒谱系数(linearfrequencycepstrumcoeffi cients,lfcc),更关注高频段特征。(2)设计可以学习到真伪语音的区分表示的分类 模型。高斯混合模型(gaussianmixturemodel,gmm) 是之前最常用的分类模型。随着深度学习技术的进 展,卷积神经网络(convolutionneuralnetwork,cnn) 的性能比直接使用 gmm 更好。例如具有最大特征图 (maxfeaturemap,mfm)激活功能的轻量型卷积神经网 络(lightconvolutionneuralnetwork,lcnn),通过竞争学 习的方法,不只能分离噪声信号和信息信号,还能起到 特征选择的作用。以上两种方法都被证明有效,说明使 用适当的前端声学特征和深度学习模型都很重要。 [32] 3.1.4 基于多模态的检测 多模态(multimodality)的虚假新闻检测难度比较大, 也是当前研究的热点方向。文本、图像和视频等共同构 成多模态信息,彼此互相支持,辅助证明,增加了可信 度也增强了辨别真假的难度。譬如使用deepfakes 又譬如之前德美研究人员研发的一项实时运动捕捉技术,可以将任何演员的面部表情转换成特朗普和普京等政治 人物的视频片段、自动替换视频中人的发言内容。英伟 达的新版stylegan,图像部分属性(style)实现解耦的 能力催生了大量利用其进行图像编辑的工作,如非常火 爆的图像创作工具 artbreeder (https://www.artbreeder. com);香港科大的interfacegan,提出潜在空间结构 19 专题 gan 生成空间的方法,可泛化迁移到所有gan 生成的各 种人脸样本空间,包括属性编辑、风格转换等。这些新 技术的采用加大了多模态假新闻核查的难度。 目前基于多模态的检测方法一般采用通用的循环神 经网络(recurrentneuralnetwork,rnn)和卷积神经网络 (convolutionalneuralnetwork,cnn)分别捕捉虚假新闻文 本及视觉模态表现层面的特性。 [33] 具体的检测模型研究有:通过使用文本和视觉特征 提取器,并联合两类特征训练的检测器;使用可变自编 码器学习文本和图像的共享表示,从共享的潜在表示中 分别重构文本和图像,从而捕获两种形式之间的关联性; 分别学习文本和图像表示后,计算文本和视觉表示之间 的相似性,识别模式之间的“不匹配”;又或是在模型 中加入3 种类型的模块(文本、 图像和用户个人资料), 结合用户评论的情感,判断文章/ 帖子真假;还有利用外 部知识图谱学习基础知识,再结合文本和视觉特征进行 检测等,不一而足。 [34] 在业界,成立于2017 年的旧金山 人工智能基金会ai foundation 开发的reality defender 统,借助对图像、视频和其他媒体内容的扫描,利用人工智能驱动的分析技术帮助人们识别由人工智能算法生 成的内容,以检测潜在的假新闻。 3.2 可解释性检测 可解释性检测是虚假新闻检测研究中的新领域。公 众质疑某些信息是否是出于某种政治或经济目的被打上 可疑或虚假标签,为什么被打上某种标签?依据是什么? 因此解释一篇文章为什么被打上某标签也成为研究新方 向。论文《defend:explainable fake news detection》提 出了具有可解释性的假新闻检测模型defend,在社交媒

君,已阅读到文档的结尾了呢~~

相关文档

热度:
页数:9
热度:
页数:5
热度:
页数:24
热度:
页数:2
热度:
页数:4
热度:
页数:4
热度:
页数:14
热度:
页数:25
热度:
页数:10
热度:
页数:3
热度:
页数:4
热度:
页数:3
热度:
页数:6
热度:
页数:3
网站地图