地震报道由机器人撰写?用“自动化新闻” 或许更贴切|前沿

上网导航 2023-09-07 381 0条评论
摘要: “机器人新闻”一词以讹传讹,实际反映了公众乃至新闻从业者对新闻技术现状的误解。...

8月8日四川阿坝州九寨沟县发生7.0级地震,中国地震台网一条“由机器…编写”的微信推送引发了人们对“机器人新闻”的讨论。

对“机器人新闻”一词的认知偏差,实际反映了公众乃至新闻从业者对新闻技术现状的误解。RUC新闻坊曾编译哥伦比亚大学研究报告,解读算法撰写新闻的行业趋势与前景。此次地震报道使大家对机器人新闻的关注热度提升,故重刊此文,以帮助大家对此领域有更深的理解。

新闻撰稿软件不是机器人!

地震报道由机器人撰写?用“自动化新闻” 或许更贴切|前沿

“说来挺搞笑的,好像每一篇报道文章都臆想出了一副机器人或者机械手臂在电脑上打字的画面。我不知道为什么。我只能假定大家都知道其实并不是那么回事,他们知道我们做的只是软件,是吧?”为美联社等媒体提供新闻写作软件的美国科技公司Automated Insight的CEO,Robbie Allen在一次电话采访中如是说。

这恰恰是美国知名网络杂志Slate资深科技记者Will Oremus担忧的问题:一个个新闻头条中的“机器人”字眼已经使许多人满头雾水。

在其文章中,Oremus援引牛津英语词典,将机器人定义为“一种可以自动执行一系列复杂动作的机器,尤指经过计算机编程的机器。”乍看之下,这个定义宽泛到足以容纳新闻软件,乃至所有其他软件。然而词典进一步在“机器”一词的定义中指出其为“应用机械动力的器械。”按照这样的定义, Automated Insights公司推出的新闻撰稿软件显然不在此列。

作为研发无人机的公司3D Robotics的CEO,Chris Anderson也认为新闻撰稿软件“不是机器人”。他指出,机器人能够感知其周围世界。机器人也拥有某种形式的智能,即使这种智能是初级的。此外,机器人能依据周边环境做出反应。按此标准,新闻撰稿软件不属于机器人。

“自动化新闻”或是更贴切的表达

如果“机器人新闻”的说法站不住脚,我们又该如何定义这种使用软件写新闻的趋势呢?美国哥伦比亚大学下属的数据新闻研究中心Tow Center于2016年1月发布的《自动化新闻指南》采用术语“自动化新闻”来概括这一媒体行业的新动向。

《指南》指出,“自动化新闻”指在初期算法编程完毕后,不经人为干预,软件或算法即可自动生成新闻故事的过程。因此,一旦算法生成,从收集和分析资料,到实际的撰写和发布新闻,新闻生产的每个环节都可以自动完成。

自动化新闻也可以被称作算法新闻。自动化新闻适用于某类特定的新闻:这些故事以事实为主,且存在有效的、结构化的、可靠的数据可供使用。此种情况下,算法能够生产大批量的新闻内容,并针对每个读者做出个性化处理。算法比人类新闻记者更迅速、成本更低廉,而且很可能更少犯错误。

自动化新闻的简史与现状

自动化新闻的概念看似新鲜,实则在新闻领域亦有迹可寻。该行业趋势发源于近半个世纪前的天气预报领域。一篇早期研究描述了一种能够处理天气预报模型数据(风速、降雨量、气温等)的软件。该软件可将数据按照重要性排列(例如数值是否超过或低于某个阈值范围),并使用事先写好的约80个短语生产出一篇“措辞严谨的天气预报”。

另一个已经长期采用自动化模式的领域是以信息速度论高下的财经新闻。举例来说,路透社和彭博社等机构都从新闻稿件中提取关键数据,将它们嵌入事先写好的模板,为其客户自动生成新闻提醒。

地震报道由机器人撰写?用“自动化新闻” 或许更贴切|前沿

近年来,福布斯、非营利性新闻调查网站ProPublica等纷纷开始采用自动化新闻技术,2014年美联社使用Automated Insight创建的“语言大师”(Wordsmith)平台来撰写公司季度财报,这一消息更使自动化新闻前所未有地走进公众视野。

在Tow Center发布的《自动化新闻指南》中,列出了目前在全球范围内研发自动化新闻软件的11家公司。其中5家在德国(AX Semantics; Text-On; 2txt NLG; Retresco; Textomatic),2家在美国(Narrative Science; Automated Insights),2家在法国(Syllabs; Labsense),1家在英国(Arria),1家在中国(腾讯)。

值得注意的是,这些公司并不把自己当做新闻机构,他们的公司名称不与新闻搭边,其产品也并非专门致力于生产新闻内容。实际上,他们的技术可以用来处理任何行业的任何数据。其中有些公司的主要业务还包括研发软件以撰写产品说明,证券组合分析,或者医院的病情摘要。

自动化新闻的意义与影响

《自动化新闻指南》援引现有研究,分别从新闻记者、新闻机构、受众和社会四个角度对此进行了解读。

地震报道由机器人撰写?用“自动化新闻” 或许更贴切|前沿

1. 新闻记者:应当更关注那些算法完成不了的任务

自动化新闻经常被看作是针对传统新闻业的威胁,因而也毫无意外地吸引众多记者的关注。有两项研究分析了针对自动化新闻的新闻报道以及博客文章,揭示出新闻记者对这项行业趋势的看法。

研究发现,新闻记者通常认为自动化新闻产品的写作质量较差或者最多是“差强人意”。他们还强调人类的复杂的叙事能力是人类写作的竞争优势。这种论调多少带有误导性。首先,“讲故事”原本不是新闻记者视为至关重要的职业技能。他们通常强调的恰恰是算法更胜一筹的那些能力,例如客观性、简洁、速度。更重要的是,新闻记者的争论忽略了以下事实:自动化新闻在重复性、常规化且基于事实的新闻故事中最为有用。在此类作品中,写作质量并非至关重要。例如,在浏览财经新闻时,读者倾向于快速获取信息。此时复杂、精妙的写作手法反而费力不讨好,使得读者理解信息更加困难。

《指南》建议,新闻记者应当更关注那些算法完成不了的任务。未来,人类和自动化新闻可能会紧密结合,形成路透社数据新闻总编Reginald Chua所说的“人机联姻”(man-machine marriage)。这种观点认为,算法将负责分析数据,寻找有趣的新闻题材,撰写新闻初稿。记者则负责为稿件增添深度分析,采访关键人物,并在幕后进行报道。

新闻记者也将在自动化新闻生产流程中扮演新的角色。例如,美联社近期聘请了一位“自动化”编辑,其工作为尝试辨别出可以转为自动化的生产流程。开发新闻算法的一大挑战便是定义出算法应当遵循的条件与规则。此类工作要求记者具备分析性思维,创造性,并且对统计学有一定的了解。

2.新闻读者:新体验,新诉求

《自动化新闻指南》从阅读体验和信息透明两个方面,阐述了这一新趋势对读者可能产生的影响。

针对自动化新闻的一项尖锐批评是:此类新闻缺乏精致的叙事,阅读体验较为枯燥乏味。而涵盖德国、瑞典和荷兰的几项实验调查均显示:首先,记者撰写的新闻比自动化新闻在可读性方面评分更高。其次,自动化新闻在可信度方面评分更高。最后可能也是最关键的一点是,受众对人类新闻和自动化新闻的质量评估差异很小。

《指南》指出,上述研究涉及的主要是财经和体育新闻,尽管读者认为记者的文章的确比自动化产生的文章更有可读性,但他们本来就不太喜欢阅读该类新闻。

总结现有研究,《指南》认为,自动化新闻在常规化、重复性的新闻领域足以与人类记者的写作质量抗衡。同时需要注意,该研究结果并不适用于其他新闻题材。有些新闻议题不单单包含基本事实,此时记者通过提供解读、推理和主观意见来发挥己用。目前还没有自动化新闻能够处理如此复杂的问题。

在富有争议的报道领域,例如采用自动化新闻作品分析投票数据来分析候选人赢得选举的机率,读者或某些利益群体很可能会质疑新闻故事的基本事实,或者抨击新闻故事采取的视角。与之相似,如果算法针对每个读者生成个性化的新闻故事,用户也许会希望知道算法有多了解他们的需求,或者他们看到的新闻与其他人有何不同。

此类问题目前仍限于学界讨论。用户是否对算法透明度有要求还尚未可知,毕竟很可能极少有读者了解算法在新闻界所起到的关键作用。

结合现有研究,《指南》认为:首先,我们需要更好地理解用户对算法透明度的需求,以及如何能使公开信息服务于公众利益;其次,需要寻找不干扰用户体验的信息公开方式,特别是针对那些对此类信息不感兴趣的读者。

3. 新闻机构:责任与挑战

《自动化新闻指南》从源数据管理、数据处理、产品呈现和法律责任四个角度概述了新闻机构可能需要应对的变化。

首先,新闻机构不仅需要拥有修改和公布源数据的法律权利,而且要确保这些数据足够准确。新闻机构需要执行数据管理和核查的流程,自动完成或者由编辑人工完成均可。

其次,如果基本数据或算法存在错误,自动化过程可能在转瞬间生成大量疏漏百出的新闻故事,从而对机构的名誉带来灾难性的影响。新闻机构因此需要在发布自动化新闻之前进行彻底的测试。专家建议最好在作品发布前由编辑事先进行核查。

第三,针对最终的新闻成品,专家建议自动化新闻的写作风格需遵循机构的官方风格指南,并且应当能够针对不同的故事采取多样的措辞。新闻机构也必须维持最起码的透明度,表明某个新闻故事是算法自动生成的,比如添加信息说明数据来源,以及该内容的生产方式。

最后,还需明确法律责任。如同其他任何数学模型,生成自动化新闻的算法也依赖数据和先验的假设,两者均可能存在偏差或疏漏。此类错误可能导致意想不到的结果,最终造成新闻故事包含不准确或错误信息。

出错时,新闻机构也许会迫于压力公开自动化背后的源代码。至少,他们需要解释这篇错误新闻是如何生成的。从法理角度看,算法不能对错误负责。责任应当由自然人担负,可能是发布者,也可能是导致算法或数据出错的具体员工。

4. 社会:公众舆论的未来

自动化新闻很可能会使新闻的数量大幅度增加,使得用户在寻找与自身最相关的信息时遇到更多困难。为了解决信息超负荷的问题,搜索引擎和诸如“谷歌新闻”的个性化新闻聚合应用,其重要性都会与日俱增。

搜索引擎供应商宣称能够通过分析用户数据(如定位、搜索历史记录等)提供令读者最感兴趣的内容。由此可能导致 “过滤泡泡”假说。该理论认为,由于算法只提供给用户他们喜欢或者赞成的内容,个性化会导致个体越来越多接收同类信息。结果人们更难接触与他们观点不同,兴趣相左的信息,这将为民主社会中公众舆论的形成带来隐患。

尽管这个理论十分流行且颇受关注,现有的实证研究却无法证明“过滤泡泡”真实存在。绝大多数研究发现搜索引擎提供的结果根本没有,或者仅仅有非常细微的用户个性化效应。但随着自动化新闻重要性日渐提升,个性化信息的潜在影响将继续作为学界研究的重要领域。

自动化新闻数量增加和完善,要求未来的研究必须着手解决更加宽泛的议题。我们能否相信,算法这一机制能够促进新闻信息的核查与平衡,辨别重要的新闻议题,并且为民主进程中公众舆论的形成设立共同议程?更重要的是,今后的研究需要了解,如果算法替代新闻业成为政府监督者,这一趋势对民主意味着什么。

尽管将自动化新闻的普及还尚待时日,其拥护者认为该领域将会迅速增长。Alexander Siebert是研发自动化新闻技术的德国公司Retresco的创始人,他认为在五年内自动化新闻将与人类撰写的新闻别无二致。美国公司Narrative Science的创始人之一Kristian Hammond预测,未来10年内,超过90%的新闻将会走向自动化。

上述观点的确是利益相关方的一家之言。 但随着美联社等知名新闻机构率先试水,追随者想必会接踵而至。

感谢您的阅读!

本文第一节《新闻撰稿软件不是机器人!》,摘译自Slate文章:《Why Robot?》。原文链接:

其余内容摘译自哥伦比亚大学数据新闻研究中心Tow Center2016年1月发布的报告:《自动化新闻指南》。原文链接:

译者:张楚楚

美编:张楚楚

相关文章:

腾讯Dreamwriter:自动化新闻发展之路 | 媒体调研报告之六

地震报道由机器人撰写?用“自动化新闻” 或许更贴切|前沿

文章版权及转载声明:

作者:上网导航本文地址:https://www.90xe.com/post/3850.html发布于 2023-09-07
文章转载或复制请以超链接形式并注明出处技术导航

分享到:

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏