以人为本: 人工智能技术在新闻传播领域的应用

[本文是清华大学自主科研项目“智能时代的媒介价值观引领研究”的阶段性成果]

(陈昌凤:清华大学新闻与传播学院教授,常务副院长;霍婕:清华大学新闻与传播学院研究生)

【摘 要】

人工智能技术在新闻传播领域的应用已经渗透到新闻操作流程的方方面面,如果从传统的流程方面来分析,可以看到至少包括新闻采写、新闻编辑、新闻分发与评论管理各方面技能技术的更新。人工智能  给人类的新闻传播业带来了大革新。本文围绕人工智能,重点探讨了它在新闻传播领域的应用,并对未来的人工智能技术应用——互动新闻进行了前瞻式展望。

人工智能的本质是人类思维的模拟。

人类的技术是随着人类的现实需要而创造发展出来的。人类自知本身的不足之处,比如人类每天都需要 8—12 小时的自我维护,包括吃饭、锻炼、睡眠、清洗、培训或再培训等等,人类会疲倦、会出现各种状况, 因此便想出了超越人类能力体力的各种技术、机器来代替。这样技术就成了人类能力的延伸。第一个已知的书面引用“计算机” (computers)一词的是在 1614 年,当时这个词被用来描述做数学计算的人类。人类工作者作为“计算机”从事研究和军事情报工作已经有千百年了。①正如凯文·凯利在《失控》中提出过的逻辑,那就是科技的发展具备的是生物学的逻辑。生态学家汤姆·雷从自然界的生命现象中学习了重要的原理, 后来编写了计算机人工生命模型。②

人工智能(Artificial   Intelligence)的核心是模拟、延伸和扩展人的智能,斯坦福大学的 Nils J. Nilsson 教授将它定义为:人工智能就是致力于让机器变得智能的活动,而智能就是使实体在其环境中有远见地、适当地实现功能性的能力③。对于“智能”本质的认知,心理学、神经科学、生物学、统计学、语言学等学界有颇多争议, 大多数学者认为“智能”是一个复杂现象, 而现阶段人工智能技术的发展还远达不到“智能”的地步。人工智能技术的发展依赖科技的飞速进步。在过去的十余年内,随着云计算、大数据和神经网络等技术的发展, 以深度学习为代表的机器学习算法在计算机视觉、语音识别等多个领域获得巨大成功,引发了广泛关注。

人工智能的运用:初级产业化

人工智能虽然是人类思维的模拟,却不具备人类的价值观,比如对人的尊严、真理和非暴力的追求,对正义的信守。④人工智能的本质意义几乎被完全忽视了;而它的功利性意义,却被人类放大和大力追逐,因为它带来了权力、效益和控制力的增加的机会。

人工智能的发展分为三个阶段:专用人工智能、通用人工智能与超级人工智能。目前的人工智能研究还处于第一阶段,主要研制解决特定问题的专用人工智能。此类人工智能应用领域明确、建模简明可行。目前专用人工智能在一些领域已经能够超越人类智能。如在围棋比赛中战胜人类顶级选手的AlphaGo、在德州扑克比赛中战胜人类职业玩家的Deep⁃ Stack都是专用人工智能产品。

人工智能技术已经走出实验室, 成为新一轮产业革命的核心驱动力。人工智能技术不仅仅能在常规劳动中替代人、提升生产效率,还能拥有一定的决策水平,因此在医疗、教育、养老、环境、司法等领域得到广泛应用,大大提升了公共服务的水准,催生新产业的同时刺激了传统行业更新迭代,从整体上推动了社会生产力跃升。近些年,人工智能研究与产业化正处于爆发期,广阔应用前景对资本产生了巨大吸引力,2017 年全球新成立人工智能创业公司逾 1100 家,人工智能领域共获得投资152 亿美元,同比增长141%。⑤

人工智能成为许多国家发展的重要战略。在新一轮科技革命中,多国竞相争夺主导权,围绕技术发展出台政策规则、加大资金和人力投入,通过加速技术与产业的发展抢占先机。2016 年,白宫发布《美国国家人工智能研究与发展战略规划》(National  Artificial  Intelligence  Re- search and Development Strategic Plan)的文件,将人工智能上升到美国国家战略高度;2017 年,我国出台了《新一代人工智能发展规划》, 抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势;同年,加拿大亦将人工智能列入其“新经济六大支柱”;法国和英国都在大力开拓、争做人工智能强国。

人工智能学家库兹韦尔把奇点看作“我们的生物思维和生物存在与技术合并的高潮,将带来一个无区别化的世界……人与机器之间无差别,或物理现实和虚拟现实之间无区别。”⑥ 斯坦福 One  Hundred Year  Study 项目的人工智能研究小组则预测到,在未来的十五年内, 纯粹的深度学习会遭遇不可避免的局限性,因此会有更多针对人类意识系统的研究和开发,许多学者的兴趣点在于创造出可扩展的互动方式搭建起人类智能与人工智能之间的互联桥梁。

人工智能运用于新闻业:不仅仅采写编评

2014 年3 月,在洛杉矶的地震中,美国洛杉矶时报网上发布的第一则地震的报道,是由一个机器人写就的。⑦ 美联社 2015 年在运用Automated  Insights  与Zacks Investment Research 两公司的智能技术后,很短时间内就写出了 3000 条智能新闻。⑧ 人工智能带来了新闻传播业的大革新。

1“.  新编辑室”:重建操作流程 人工智能技术在新闻传播领域

的应用已经渗透到新闻操作流程的方方面面,如果从传统的流程方面来分析,可以看到至少包括新闻采写、新闻编辑、新闻分发与评论管理

各方面技能技术的更新(见表1)。

特别值得注意的是,人工智能的流程已经超越了传统新闻的格局,过去未有过的人脸识别、声纹识别、图像识别、大数据搜索等,都可以用到新闻传播和用户体验的各个环节中; 而互动新闻、用户运用工具参与探索和互动,都完全突破了传统新闻业的形态和思维。

新闻采写阶段人工智能技术的影响最为直接。在新闻选题策划方面,记者通过大数据的方式获取新闻线索早已不是什么新鲜事;在具体操作层面,以语音识别技术及文本转化为代表的技术为记者工作提供了诸多便利,缩减了诸如整理采访录音等低效繁杂的工作。在未来则会进一步研发出人工智能机器人作为记者的个人助理,可以帮助记者管理稿件,组织采访并回复电子邮件等。除此之外,最受瞩目的一点是直接以“机器人记者”代替“人类记者”的自动化新闻写作的技术,这一技术的成果主要体现在三个方面。

首先,新闻出稿数量的大幅增加。美联社长期与Automated In⁃ sights 合作进行财务数据分析并编制季度报告,在使用Wordsmith 程序后,美联社实现了自动分析数据并生成文章的流程,每季度生成报告总量由300 个上升到3000 个, 完成了数量级的跃升 。腾 讯的Dreamwriter 每天可以创作约2500 条金融、科技和体育新闻,远超普通记者的工作量。第二,报道速度大大加快,机器人可以用极短的时间自动标记照片、自动化产生文本故事、实时录制视频等等,在一些时效性要求较强的领域(如金融)具有显著的优势。第三,自动化新闻写作的形式更加多样。目前技术覆盖面已经不仅仅限于文字信息,图片和视频的识别、编辑能力在迅速增强。如路透社与 Graphiq 合作,使用人工智能系统来构建和更新数据可视化,该工具可以飞速访问、更新、处理数据,并且能够把它们嵌入新闻报道中实现可视化的实时更新,省去了记者重复制图的麻烦。目前今日美国(USA  TODAY)也使用自动化视频软件进行视频类新闻信息的制作。

自动化写作已突破实验阶段, 被正式运用于各大媒体的实际工作之中。学者研究证明,在工作具有高度常规化、可预测性强并且数据可以容易且一致地进行量化的情况下,普通读者分辨作者是人还是智能程序非常困难,因为读者所接收的核心信息是完全一致的。

美联社生动地将这种智能化手段的应用称为“增强新闻”。华盛顿邮报网在2016 年5 月10 日报道中就已经用到了增强现实的技术(Augmented Reality)。美联社全球自动化和人工智能策略的联合主管 Francesco Marconi 说“自动化的关键不在于机器取代人的工作,而是更大程度释放了资源,让记者的精力专注于他们擅长的事物之上⑨ 。”对于商业媒体而言,以最有效的方式增加受众和产出是他们的重要目标。

以华盛顿邮报的写作机器人Heliograf 为例。在 2016 年美国大选过程中,Heliograf 一共撰写了 850 余篇文章,其中有 500 多篇点击超过50 万。这一过程是如何实现的呢?首先,华盛顿邮报的记者会为机器人创立相当数量的各种叙事模板,如对选举结果的报道可能会 是“ 民主党获取了众议院的控制权”,也可能会是“共和党获取了众议院的控制权”。其次,在事件发生之前,记者启用Heliograf 进入到当前特定事件结构化数据集之中, 随着事件进行,收集到的数据不断增多,Heliograf 会对数据加以自动识别并进行统计和判断。最后,系统将具体数据和预先存入的叙事模板相结合并生成文本、发布故事。

在新闻编辑方面,人工智能技术拥有不同于人类编辑的独特能力。2018 年,斯坦福大学人工智能专家与一些媒体人合作建立了一个名为“Knowhere”的新网站,这个网站是基于机器学习进行新闻倾向性改写与编辑的人工智能网站。当输入一条新闻时,人工智能系统会对其内容进行阅读分析与属性判断, 几分钟后自动编辑生成政治倾向分别为“左”“右”以及“公正”的三篇文章,读者可以通过点击不同的属性进行阅读,设计者希望借此消除一些“回声室”的影响。

新闻分发方面更是成效突出。2016 年是算法编辑超越人工的拐点之年 ,据 美国皮尤研究中心《2016 美国社交媒体平台新闻使用报告》显示,Facebook 已成为人们阅读新闻的最大入口。在中国,今日头条等平台凭算法优势在内容分发领域异军突起,累计激活用户数超7 亿,月用户时长超20 小时⑩,使用人数众多、用户黏性大,成为普通民众阅读新闻、了解信息的重要途径。此类算法分发平台的运作模式多为“ 收集数据、算法预测、个性化推送”,整个操作过程几乎不需要人工编辑参与。

网络信息的爆炸式增长导致严重的互联网信息过剩。由此带来的信息过载与选择困难成为大多数人面临信息消费时的核心痛点。因此, 无论是社交属性的媒体还是新闻属性的媒体,为了迎合市场需求、解决用户痛点目前大多仰仗算法进行信息分发,以用户需求为核心进行“私人订制”。以今日头条为例,今日头条是一家具有媒体属性的科技公司,该公司完全不生产新闻但是成功包揽了许多专业媒体乃至自媒体的信息分发渠道。今日头条依靠算法建立起精准的用户画像并据此产生针对每个用户个性化信息流,同时借助广告、电商实现流量变现。按照2018 年初今日头条召开“让算法公开透明”分享会的内容将其的算法运作原理总结为图1。

由图1 我们可知,“今日头条”整个算法框架输入的数据源是三个方面的:信息特征、用户特征以及环境特征。其设计的核心目的就是匹配用户、信息以及相应环境 。那么如何将三者实现最佳匹配,即让一个人在特定的时间地点看到其阅读兴趣最高的信息呢?这依赖于算法对三者的信息进行抽象提取并数据化的处理的模式以及匹配模式。今日头条对用户画像的依据是用户职业、年龄、兴趣标签与手机机型等数据,对环境的判断基于时间和地点的数据,对具体信息的属性判断抽象不仅受到信息内容与形式的影响,也包括信息在舆论场中传播力大小。在这一过程中,算法后台的Storm 集群实时收集各项数据并不断更新模型。

值得注意的是,由于今日头条用户与信息的体量过大,其推荐系统不是一个整体的推荐算法,而是拥有多套不同算法的推荐平台,当某一套算法受阻时,平台会切换至其他算法继续运行。同时,完全依赖依靠实时数据的算法推荐成本过高,今日头条也应用简化策略的召回模型,在成本和效果之间进行平衡,召回模型是指通过特征提取将海量内容库缩减为体量较小的内容特征库,以特征信息转入推荐模型进行处理。

对于整个系统而言,任何一个要素的调整都会影响最终的推荐结果。除去特征提取、推荐架构、算法参数、规则策略外,信息平台的内容流通、用户个体的环境与行为都会引起推送结果的转变。由于算法系统的动态性与自运转性,没有任何人能清晰判定某条新闻是否能发送到某位用户的终端,至此,新闻分发的权力由人移交至人工智能。

人工智能运用于评论管理也是一种新经验。美国纽约时报是以智能技术管理评论的先行者。2015 年 ,纽 约时报与 Google 旗下的Jigsaw 合作 The Coral Project(珊瑚计划),依靠算法对不同用户进行分级画像,以此决定哪些用户的评论可以不用经过人工审查就可以发布,同时对评论呈现的优先级进行了排序。

2017 年 ,纽 约 时 报 使 用Google 开发的人工智能系统Mod⁃ erator 对其评论区进行留言管理。Moderator 通过学习纽约时报过去 10 年评论区里人工管理的超过1600 万条评论建立起了能够优化管理评论区的算法。该算法旨在通过识别和筛除恶意评论来打造一个高质量的内容管理平台。

2.技术性失业:人员结构调整

“ 技术性失业”这一概念早在1930 年被经济学家凯恩斯提出。事实上,每一项技术的发展都会使得这一概念不断被再次提及。最早的大量技术性失业出现在工业革命时期,当时蒸汽机技术的发展与应用逐渐排斥着手工劳动,大批手工业者失业破产,英国工人曾掀起“卢德运动”,砸毁机器以示抗议。人工智能技术的本质是模拟人的思维,因此该技术一经问世就引发了巨大的失业恐慌。正如前文中提及的“写稿机器人”代替“记者”、“算法推荐系统”代替“编辑”一样,新闻工作者饭碗不保的忧虑充斥业界。

狄德罗认为,技术是为某一目的共同协作组成的各种方法、工具和规则的体系。国内也有学者认为 “技术是人的主体性的客体化”“技术是人的创造物,技术的本质不过是人的本质力量的对象化 。”技术发展的过程本质上就是逐步将人内在力量外化的过程,因此,“技术性失业”这一趋势在理论上是不可避免的,在人工智能诞生之前,机械自动化消灭了大量体力劳动职业,而在未来,机械将进一步取代人类在智能领域的工作。

从宏观角度而言,技术对人类工作的影响并非单纯地剥夺,因为每项技术在消灭一些工作的同时都会创造出一批新的工作,正如农耕时代向工业时代的转变一样,技术变革的推动下每个行业的工种、数量、职能都会发生改变。经济学家们所谓的“资本化效应”会促使企业转入需求和生产力较高的行业,进一步制造出新的就业岗位。

使用人工智能的媒体也纷纷声明启用人工智能的目的是让记者从繁杂的常规性工作中解放出来,以便进行更多彰显人类智慧的高价值工作。Bloomberg 的全球新闻产品负责人Ted Merz 在Twitter 上这样说道,“AI 可以解放我们的顶级记者,使他们专注于最有价值的新闻工作,并且真正保护记者的工作。”

随着人工智能技术的发展,尤其是NLP(自然语言处理)技术的进步,机器在语言理解和生产领域大有可为,其在新闻编辑室的角色和地位将更为重要。过去 20 年,互联网的勃兴迅速改变了新闻业生态, 大量报纸裁员、停刊、倒闭,报纸所代表的地方新闻业也因此一落千丈,地方性的新闻报道受到巨大影响。在这一现象的影响下,地方性新闻失去了活力与创造力,也导致人们对地方民主的舆论保障产生担忧。

人工智能技术将成为重振地方新闻业的重要工具。目前英国新闻协 会 与 Urbs Media 公 司 从Google 获得了技术支持,将记者与人工智能配对,利用“Radar”覆盖当地各项数据,并以此为文本生产出本地新闻。在这一过程中,人工智能系统从政府公开数据中获得信息,利用NLP 技术编写新闻,每个月都能产生 3 万份本地新闻报道�。Urbs Media 的主编 Gary Rog⁃ers这样介绍“伦敦有33个区域,对 于AI系统,可以编写的不是一个针对伦敦的新闻,而是33个不同的本地化新闻。”人工智能系统在经济、健康、犯罪、交通、教育、环境、社会政策以及人口统计的地方新闻领域已经被广泛应用,这对于地方新闻业的复兴颇具帮助。

让人类参与思维:智能时代的新闻想像力

人工智能在新闻业的运用,已经遇到了旧瓶与新酒的矛盾。如果仅仅以传统新闻业的思维来运用人工智能,那只是把这项技术当成了技能的替代品,其对“人类思维”模拟的层面并未能体现。实质上它不只是替代品,它是一种新闻思维的升级换代。

比如运用了大量智能技术的互动新闻中的诸种要素,并不是传统新闻业能够具备的。互动新闻的核心是提供充分的条件和路径,让用户自己探索、自己讲故事、自己思考并得出结论。比如2018年普利策新闻奖获奖作品《墙:不为人知的故事,意想不到的后果》(The Wall;Unknown Stories, UnintendedConsequences,出自亚利桑那共和报与今日美国网2017年9月),用交互式地图、纪录片、航拍视频、边境视频故事、创作者访谈以及虚拟现实(VR)等互动方式为用户提供了6种方式,探索 3200 多公里“美国——墨西哥”边境墙的故事。

计算思维已经大量地运用于新闻产品中,而且要设计得具备智能思维——人类思维的模拟化,这就需要足够的“新闻的想像力”,如同国际著名学者 Stephen D. Re⁃ese所论述的那样。纽约时报的互动新闻产品“租/买计算器”(TheTime’s Rent vs. Buy calculator),记者、设计者尽可能多方位地考虑了各种变量,设计出了契合用户需求的选项,由用户去自己控制,内容需要用户进行多层面领域地探究,且没有预先确定路径。也就是说,互动新闻给了用户尽可能多的自主性,让用户能够自己讲故事。这是对新型新闻形态的一个崭新诠释,其新的方式展示和呈现的数据的解释力,超越了用传统的图形、故事文本进行的信息静态展示。它改变了新闻工作的输出模式,为人们获取信息提供了一个新机会。