对机器人新闻的不同观点
乐观
机器人写新闻把传统的新闻工作者从繁琐的重复工作、危险的调研中解放出来,使他们能更好的创作故事、更深入分析事实,从而体现他们的叙事天赋,发表他们的个人观点
“计算机将在未来15年内写作90%的新闻,在5年内获得普利策奖”
悲观
(1)对机器人技术悲观
“新闻是有‘温度’的,机器人做新闻却没有‘温度’,很可能在昙花一现之后,优雅地死掉。”
(2)对人类新闻工作者的命运悲观
传统新闻工作者难以与机器人抗衡,最终被替代。
机器人新闻在以下四个方面的发展
一、机器人编辑
二、机器人写作
三、新闻传播
四、新闻采编与传播的智能辅助设备
编辑
1、机器整理的热点新闻
互联网对新闻界的冲击首先是试图替代编辑
Google News (2002-)
快速地采集各大传统媒体(4000多个新闻网站)的新闻报道
并自动地将其分类汇总
筛选出当天读者可能会共同关心的话题置于头版
互联网公司有强大的入口优势,能为传统媒体带来流量,双方基本达成合作默契
热点新闻数量有限,机器并没有发挥出大规模计算的能力
机器选出来的热点新闻未必有人类编辑敏锐独到,不足以构成对传统媒体的威胁
2、机器编排的个性化新闻
“今日头条”2012年3月创建,截至2015年10月,累计激活用户数达3.1亿,日活跃用户超过3000万;
个性化新闻计算量是巨大的,人类编辑完全无法承受
“今日头条”只是编辑筛选新闻,而不是自动生成新闻,同样不会危及传统媒体人的生计
机器人写作
1、对新闻写作过程建模
传统的新闻受限于新闻工作者的天赋、经验、创造、直觉,由新闻工作者将事实转化为故事
神秘而不可预测的过程,在多大程度上是可以量化和建模的?
2、机器写规范化新闻的步骤
a) 采集高质量的数据。
包括线上和线下。线下数据主要依靠传感数据,包括温度、声音、等,其中的重点和难点是生物传感数据。我们正在研究的还包括了生物传感以外的机械传感部分,比如软件传感技术。它可以生成无数可询问数据,与在线方式相结合,使之更有益于传媒人对于真实世界与虚拟世界的了解,包括对于其关系的了解。
目前较多使用的数据包括:每股收益、股价变化、垒球投手责任得分率以及棒球打点等;美国较多使用的有采用航天遥感技术所做的气象传感新闻,感知气温、湿度、气压的环境传感新闻,感知噪声分贝值的声音传感新闻等。我们还在扩展至感知学生学习状态的“专心宝”、感知人体健康状况的“私人医生”等等。
b)从这些数据中“计算”出哪些有新闻价值
偏离常态为新闻,即“关注异常数据”,如最小值、最大值、异数、大起大落、被超越的阈值等。
c)选择故事的“角度”
角度通常由专业记者根据各自领域的报道逻辑和路径为其量身定做叙事模版
李茹:一项体育赛事的报道角度可能是“拉锯战”、“英雄式个人表演”、“强大的团队合作”或者“咸鱼翻身”等等
算法还会按照重要性对各种可能的角度进行排序,并由此形成文章的整体结构。
d)将数据嵌入模板生成句子
对同一类事件可以写出花样繁多的模板
可以利用自然语言处理技术自动抽取模板
凡是有数字的地方都应该有故事,机器作者的价值在于作为数字与故事之间的翻译从数据到新闻
例:《洛杉矶时报》关于地震的自动报道
系统根据震级判断是否具有报道价值
比如6.0级以上地震会自动发布报道
3.0级至6.0级则会将报道发送至编辑,由其决定是否值得追踪报道
3.0级以下则不会收到消息,因为多数情况下,这意味着不值得大惊小怪。
例:从Social Meida上发现新闻价值
谷歌的德国工程师托马斯·斯坦纳开发的Wikipedia Live Monitor
实时监控维基百科上287种语言的词条寻找短时间内狂热编辑的条目,如果很多人在用不同的语言编写同一个事件的词条,则说明有重大事件正在发生
继而检查Facebook、Google+和Twitter,判断是否真的有大新闻发生
据斯坦纳所说,他的程序第一时间发出了关于波士顿马拉松爆炸案与马航失联航班的新闻
机器人的优势
完成人无法实现的多种功能。尤其是数据发现和挖掘、处理能力。
(1)速度快
比人更善于应对突发事件,比如一旦地震,机器可以从地震局的大数据中第一时间采集到异常波动,抢先发出灾难来临的新闻;
(2)不知疲倦
人可以熬夜到清晨,而机器永不停歇;
(3)没有个人的偏见
除非事前或事后进行了人工干预,否则机器写出的新闻就是结构化数据的一种文本形式的可视化表现,基本上不会歪曲数据;
(4)节省劳动力
把记者从数据处理上解放出来,做深度报道和目击者报告
(5)不遗漏任何事实
(6)从“追踪”到“发现”——自动发现有价值的新闻话题
新闻价值体现在反应社会和经济的变化的观察上:从大数据中发现变化,预测趋势,对危机及时预警,制定相关对策
人类写手受视野限制,受时间和精力的限制,常常会忽略颇有价值的新闻话题
新闻价值的自动评估:如何从大数据的异常变化中自动发现能够引起公众普遍讨论的新闻话题
(7)对新闻产品或广告进行客观评估
(8)个性化
逐步提高机器人写作的水平
1)加入对规律的表述
“战马在北京的剧场反映比在上海好”
2)加入情感表达
“60%的球迷都非常喜欢Joe,它太棒了!”
3)加入对原因的分析
“Joe争夺头马失败反映不佳,可能是因为东方观众对于英雄的观念有别于西方”
4)加入文学性的描述
“战马Joe高大的身躯,温情的眼眸”
描述性分析;预测性分析;策略性分析
三、新闻传播
(1)预测用什么样的文风(口气)写一条新闻,这条新闻可能传播得更远;
(2)自动发现哪些人,尤其是哪些大V可能会对这条新闻感兴趣,甚至帮助传播,如果激活这些人的阅读和转发的能量,让新闻实现最大范围的覆盖;
(3)传播不但要广泛,而且希望得到读者正面的评论
我们做文本情感分析时已经开始做情感预测,即预测某个人或某个群体读到某条消息后可能产生什么样的情绪反应。
(4)传播效果的事后自动分析,包括量和质两个方面
量:覆盖了多大范围的人群
质:覆盖的人群都是什么样的人
这些人对该条新闻产生了什么样的反馈(褒、贬、中性)
- 新闻采编与传播的智能辅助设备
智能辅助设备的重要性
在新闻采集和传播的各个环节,智能辅助设备的介入都可以提高新闻的生产与传播效率,甚至获得传统新闻媒体所无法获取到的新闻数据,以及无法想象的传播效果。
(1)采访机器人
无人机航拍,极大地拓展了新闻采集的视野
剧场生物传感器,监测观众情绪变化
(2)听新闻
让语音合成的自然度达到让读者愿意听新闻而且感到很舒服的效果
(3)基于语音识别的新闻采访自动转写技术
“语音转写”,比“语音听写”难度大很多
语音转写能够把访谈录音自动转换为文本,并对文本进行自动的润色编辑,大幅度提高记者的成稿速度
聚焦“社会媒体大数据(Social Media Big Data)”
- 中文信息处理领域:自然语言处理、信息检索
- 计算机其他领域:数据库、数据挖掘、多媒体、可视化、高性能计算等
- 社会科学:传播学、社会学、管理学、金融学、语言学、心理学、文化学等
- 社会媒体处理的产业应用:舆情分析、社交应用
小结:
机器将凭借其不断发展的智能,在新闻的编辑、写作、传播等各个环节上发挥越来越重要的作用,为传媒工作者提供更多的支持、补充,更将深刻地融入社会生活的方方面面,突破原有的传媒疆界,增强人的功能,并替代越来越多的人类脑力劳动。
未来将是人机共生、人机协同的局面。