报道中的少数活跃专家,构建了我们眼中的AI世界

我们对于人工智能的理解,往往来自于媒体的报道。因此,人们也期待科技记者能更好地帮助公众理解人工智能新技术,并监督科技行业承担责任。不过,此前的研究表明,人工智能报道存在诸多误区,比如经常放大对人工智能价值和潜力的利己主张、将人工智能主要定位为私人商业问题、忽视有关人工智能潜在影响的争论等等(Brennen et al. 2019)。          

为了避免向公众传达错误的信息,专业的科技记者通常需要去寻求专家的意见。这些专家究竟是谁?他们和业界是何种关系?媒体在人工智能这类专业程度较高的报道中,是否做到了信源采集的多样?           

本期我们编译了一篇2019年12月17日发布在牛津大学路透新闻研究中心的研究文章,来对上述问题进行解答。作者J. Scott Brennen等人发现,人工智能报道的信源集中在极少数知名学者上。记者总是会回到那些既有技术上的专业知识,又擅长做受访者的人身边。           

                       

围绕人工智能的公众讨论仍在演变,一些是炒作,一些是歇斯底里,一些是深思熟虑的辩论。当下,评论员、记者、政治家和公众正就人工智能的诸多话题展开讨论,从自动化的好处与风险,到人工智能在地缘政治和战争中的作用,再到算法歧视的潜在偏见。           

新闻媒体在塑造这场不断演进的讨论中起到了很大的作用。新闻报道和评论不仅为公众讨论提供空间,还提供并影响了证据、论点、价值和意义。同样,那些将新闻内容作为依据和主题的人,通过叙述案例、提供证词、分析背景及评价声明等方式影响着报道和评论。           

在有关科学技术的新闻中,学术研究者常充当主题和信源,为报道提供有用的一手经验和专业的技术理解。对于像人工智能这类主题的新闻,报道会受到行业炒作(Chuan et al. 2019)和未来预期(Natale and Ballatore 2017)的严重影响。学术研究人员提供的独特而独立的视角,往往不同于行业人员、政治家和决策者们。具体来说,学术研究者可以对人工智能的能力、局限性、风险和潜力进行详细而现实的评估。           

此前研究发现,人工智能新闻报道约17%信源来自学术界(Brennen et al. 2018)。本文进一步关注在英国和美国充当新闻报道信源的学者是谁。具体就是,对英美两国各150位引用程度最高的人工智能领域学界专家的新闻提及量进行研究和建模。数据揭示了三个重要发现:           

新闻报道的提及集中在极少数知名学者身上:这两个国家被提到次数最多的十位学者,在样本中被提到次数占总次数的七成以上。           

最常出现在新闻报道中的研究者,不一定是被学界引用最多的,但其中许多人都与业界有着密切的联系。两个国家中共有16%的研究人员隶属于行业,这些人在新闻报道中被提及次数占总次数的64.8%,却只占学术引用的18.3%。有业界背景的研究人员在新闻报道中被提及的可能性会翻倍。在研究样本中,未发现学术引用量与报道提及量的显著相关。           

在新闻报道中出现频率最高的学者主要是男性,而人工智能领域的学者,绝大多数出现在新闻中的是男性。样本中女性只占到6%:报道提及量占6.7%,谷歌学术被引用量占4.2%。           

鉴于学术界关于人工智能研究的广泛性和多样性,记者提到并强调一系列最杰出的学者,为人工智能的实际能力、局限性和风险提供一手专业知识,将对于公众讨论有很大的影响。但与此同时,随着学界越来越多的人工智能研究者隶属于企业,这对研究者公开地分享并论述工作的情况产生怎样的影响,目前还不清楚。           

概况           

过去的几十年中,各个领域的科学家和科学组织越来越愿意与公众交流他们的研究成果(R dder et al. 2012)。这一趋势在人工智能领域同样适用。在一次采访中,牛津大学计算机系主任Michael Wooldridge,也是本次研究中报道提及次数最多的英国人工智能学者,在计算机科学领域漫长的职业生涯中观察到类似的变化,写道:“我想我角色的一部分是做一名人工智能领域的评论员。”          

关于科学的公众参与研究已经总结了一些原因,来解释科学家们为何自述参与自身领域公众讨论(Besley et al. 2018)。一些研究者觉得向公众传达他们的研究是一种义务或责任,尤其当他们的研究有公众资金支持的时候(Sharman and Howarth 2017)。利兹大学人工智能教授David Hogg在接受采访时表达了自己的感受:“有一种想要准确地描述现状、限制以及其(人工智能)工作方式的欲望,我希望公众能够更好地理解这一领域。”           

伦敦国王学院社会和文化人工智能高级讲师Kate Devlin表示,消除公众对于人工智能普遍存在的误解是她的动力所在。在一次采访中她向公众描述自己的工作时提到:           

我努力让大家认识到实际情况要比媒体报道微妙得多。我个人的目标是打破神话,所以我喜欢参与进来并告诉大家,好吧,可能你认为是这样的,但那是一个极其错误的观点以及它背后的真相其实是这样的。所以这就是标题背后的真相。          

数十年来对于消息来源的研究表明,记者经常会找官方,或是精英人士作为信源。有关科学、技术和健康的报道也不例外,在这些领域中,科学家们的作用不仅限于讲故事,还能影响文章的写作和框架(Nisbet and Lewenstein 2002)。随着几乎没有对应领域专业知识的“杂学家”们越来越多地报道科学、技术与健康方面的内容,相关机构和精英人士的影响力便越来越强(Dunwoody 2008)。然而,人们对于计算机科学或人工智能报道中的学术信源还知之甚少。          

方法          

为了更清晰地了解在人工智能新闻报道中出现了哪些学者,我们找到了新闻提及最多的英美两国各150位人工智能学者。          

为了做到这一点,我们首先在谷歌学术找到了自我介绍是人工智能、机器学习、深度学习或神经网络方面的专家且有学术电子邮箱地址的账户;而后,我们建立了一个时间跨度为1980年9月5日至2019年9月14日,涵盖英国34个、美国80个主要新闻机构的数据库,来统计这些学者被报道提及的次数。搜索方式为学者的名字或变体,加上一组与人工智能相关的关键词。          

此外,我们还利用公开信息,包括机构网页、简历、新闻报道和谷歌学术页面来确定每位学者的专业领域、职业年限、性别和行业归属等。最后,我们使用负二项回归用收集到的五个因素对新闻报道中的提及次数进行建模。值得注意的是,这种方法意味着我们的研究并不是对所有人工智能领域学者的研究,而是对该领域最著名的学者的研究。此外,我们还对英国的科技记者和人工智能研究者进行了一系列采访以便更好地解读我们的发现。          

结果          

01          

学术引用与新闻报道提及          

                    

图1 新闻报道提及与谷歌学术引用         

数据显示,总体来看谷歌学术中被引次数最多的学者与新闻提及次数最多的学者并不相同。值得注意的是,如图1所示,许多被引用最多的学者却很少被媒体提到。英国和美国在谷歌学术被引最多的十位学者,尽管分别占样本总学术引用量的27.4%和20.2%,却只占新闻提及总数的7.5%和3.6%(见表1)。这也是我们统计模型的关键结论:没有发现谷歌学术被引次数与新闻报道提及次数之间的关联。          

           

           

表1 选定内容的描述性统计

         

02           

行业隶属关系          

在所有指标中,与业界的关联度与新闻报道次数密切相关,我们的模型也因此将与业界的关联度确定为新闻报道次数的最强预测因子。模型表明,平均而言,与业界有关联的人工智能学者获得的报道提及次数是无关联者的34.6倍(英国)和20.6倍(美国),虽然这个模型有着较大的不确定性。          

从另一个角度来解读,与业界有关联的研究人员(英国20人,美国29人)在英国和美国的报道提及率分别是56.6%和71.9%,却只占到谷歌学术引用率的15%和19.3%(见图2和图3)。           

                    

图2 英国新闻中隶属于业界的人工智能学者          

                     

图3 美国新闻中隶属于业界的人工智能学者          

虽然这些数据并不能清晰地解释所观察到的业界关联度与新闻报道提及之间的紧密联系,但两个更为广泛的趋势可能会提供一些新思考。          

首先,许多公司——尤其是大型科技公司——在公关与沟通上投入了很多努力去推动行业相关研究、倡议及活动的报道。一位英国科技记者在采访时表示,自己每天至少会收到一封会提到人工智能相关内容的电子邮件。同时,有迹象表明,企业的这些努力是有效果的(G pfert 2007)。虽然在采访中一些记者强烈否认参考通稿来撰写新闻稿,但也有一些人经常这样做。当记者面临着开支缩减、时间紧迫和资源匮乏等问题时,我们有理由相信,有些记者会从写行业的通稿转去写更容易的内容,同时也会更多的以企业提供的资料作为信源(Sch fer 2017)。          

第二,大型科技公司一直在招募杰出的人工智能研究者。此前,企业们还对研究部门大规模裁员,而今一些公司已经为学界人士提供双重职位以吸纳人才。一位英国记者观察到:          

DeepMind(谷歌旗下人工智能企业)用资金拉拢大家,最后让该领域的每一位学者都在DeepMind工作,这是有问题的……谷歌的威力之大令人担忧,虽然他们的初衷是好的。          

对一些学者而言,加入企业意味着要暂离学术职位;对另一些学者而言,这意味着他们要把时间分配给学界和业界。根本上,这种趋势可能意味着新闻报道提及和学术引用也许正推动着行业隶属关系的变化,而不是被其所影响。         

03           

性别差异          

这些数据还表明,在人工智能的研究和新闻报道领域都存在明显的性别不平衡。在我们分析的300名引用量最高的研究人员中,只有18名是女性,占6%。这18位女性在谷歌学术论文的引用中占4.2%,在样本中的新闻报道提及量占6.7%。值得注意的是,美国和英国的数据略有不同:我们的样本里,8位美国女性占所有美国新闻提及的11.4%,10位英国女性占新闻提及的1.4%。          

这些发现与最近所做的努力矛盾。为了增加人工智能研究的代表性,最近正确保将女性研究员纳入会议小组和与政府协商的专家团队。同样,许多从事人工智能的社会影响研究的智囊团和研究小组都由女性领导;近来还举行了一系列重要会议,讨论女性对人工智能发展的贡献。         

的确有迹象表明,一些媒体已开始逐步增强女性作为消息来源的代表性。在一次采访中,一位英国科技记者证实,他们的媒体已经开始在发表文章中追踪信源的性别,来帮助记者多加留意引用信源的“无意识偏见”,因为“你总是会回到某些人”。同时,模型发现相较男性,美国女性学者有多于4倍的概率成为新闻报道信源。          

04          

聚集程度          

新闻提及高度集中在少数学者身上(见图1)。英美两国前10名学者分别占所有提及量的76.9%和70%。值得注意的是,他们只占谷歌学术引用量的9.1%和7.9%(见表1)。           

在这两个国家,只有12位学者被新闻提及超过30次。这些人加在一起,占所有报道提及量的64.1%,但仅占学术引用量的5.9%。值得注意的是,12人中有10名是男性,有11人曾在大学院系里当过教员(尽管其中两人不是计算机科学家,而是哲学家)。最后,12人中有9人和行业有着紧密的联系。           

与这些常被引作信源的学者相比,样本中61.7%的英国学者和56%的美国学者根本没被任何新闻提及。尽管如此,这些人仍然占了样本中所有谷歌学术引文的54.7%和52.1%(见表1)。样本中的所有学者都是领域的领导者,都有可能从事值得报道的重要研究,或者作为独立、准确和及时了解研究状况的重要信源。           

这些数据表明,记者一次又一次地回到极少数学者身边。增加信源的多样性,即使从一个公司开始,都能够帮助给正在进行的人工智能研究带来新的、更深入的理解。           

现有的研究和对英国科技记者的采访,为新闻信源和主题的集中性提供了一些见解。           

首先,因为记者日常报道中面临巨大的时效压力,他们有强烈的动机采纳那些被证明会说“快速、有用和有趣引语”的信源。开发新的信源既费时又冒险——他们可能提供有用的话,也可能不会。一位驻英国的科技记者观察到:           

这在新闻业属于典型,尤其在广播电视业,一旦你发现一个人的举止似乎可信,也很会说话,你就可能总是黏着他们(stick to them),也许你应该寻找其他的声音。           

同时,一些在小报或本土数字媒体工作的记者在采访中表示,他们必须完成日常的流量目标。当试图在严格的期限内满足流量目标时,做可靠的话题会有压力。一位科技记者观察到,“不知道哪些能起作用;你会把一大堆素材丢墙上摆着(throw stuff at a wall)。”知道哪些话题和主题会吸引流量,是作为一名科技记者的专业知识之一。           

同时,记者经常去其他媒体和新闻稿找报道主题和信源。这样做有助于确保记者不会错过重要和受欢迎的故事,同时为他们自己写作文章提供一套简单可靠的信源。           

更进一步,一些记者承认使用发表在其他新闻文章或通稿中的引文。一位英国小报科技记者这样描述了这种做法:           

所以,你不是偷,但你基本上消除了和偷之间的红线,因为你不像是在复制粘贴,你是用你自己的方式写,但使用别人收集到的信息。           

这种做法意味着,一旦一名研究人员出现在一篇文章中,他们很可能就会出现在许多其他文章中,因为记者们会重新整合现有文章来为自己发稿所用。           

结论和建议           

这一分析不应视作对出现在新闻报道中的科学家的批评。同样,尽管现有研究表明,一些学者可能对在媒体发声犹豫不决(Dudo 2015),但这里描述的诸多模式似乎更代表新闻实践的一种机能。由于记者面临着显著的时间和资源压力,他们有强烈的动机去寻找那些提供现成故事和框架的消息来源,或者那些被证明是快速、可靠和有趣的消息来源。           

也就是说,记者会回到那些既有技术上的专业知识,又能做专业受访者的人身边。并且面对这些压力,许多记者都写一些“容易写”的报道,要么关于行业举措,要么直接从行业新闻稿摘引。尽管大学新闻机构正日益专业化(Scha fer 2017),但许多仍然无法复制行业新闻机构的努力。           

这些数据虽然仅仅提供了作为新闻信源的人工智能研究者的部分图景,但也提示了这一现状的原因。尽管人们越来越期待科技记者帮助公众理解新技术的影响和潜力,并监督科技行业承担责任,但我们的研究表明,科技报道仍然深深依赖于行业。           

在之前的研究中,我们发现英国33%的人工智能报道的独有信源来自业界,只有17%来自学术界。在本文中,我们证明大量出现在人工智能新闻报道中的学者也与产业有着密切的联系。          

这并不总是个问题。但鉴于之前非批判性的、行业主导的科技报道,未能在社交媒体平台发展过程中质疑其权力和影响力,值得问一句:对人工智能的报道将从一开始就更具独立性、知识性、调查性,还是存在着科技新闻报道重复同样错误的风险?随着人工智能在各个行业得到推广和支持,重要的是,科技记者不仅要批判性地询问业界对人工智能潜力的断言,还要质疑基于人工智能而建造的系统的道德、风险和偏见。          

鉴于目前在行业内外开展的人工智能研究都有着巨大的多样性,记者将很容易为他们的报道寻求新的和多样化的信源,包括更大范围的独立学者。增加信源和报道主题的多样性,可以帮助提供更广泛、更丰富和潜在更批判的观察,以了解围绕人工智能的许多紧迫的公共问题和机遇。

相关文章