nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
提要:今天用户在数字信息世界面临的一个巨大困扰是,他们虽然每天接触到海量的信息,包括新闻信息,但这些信息大都是碎片化的,他们凭一己之力难以完成碎片化信息的鉴别、过滤与整合,这在很大程度上影响着人们对各种事件、话题的了解,也影响着他们对现实世界的认知。虽然整合碎片信息是媒体的职责之一,但在各种压力下,真正能很好完成这一任务的媒体仍非常有限。
而大模型的特长之一正是内容的整合与深度加工,它们可以快速获取分散的信息碎片,并将碎片化的信息整合成有条理的答案,描绘一个事件、现象或话题进展的全程、全貌,或揭示各要素间的内在关系。未来大模型还有可能以图片、视频等多模态形式进行内容的加工或整合。当然,大模型要形成高质量的整合内容,需要以专业的新闻语料库为保障。
相较于ChatGPT,DeepSeek对新闻业带来的影响或许并没有发生本质变化。但是,对于中国的内容生产者及相关平台来说,作为国产大模型的DeepSeek的“可获得性”更强,且它更多依赖中文语料库,在实时联网的情况下可以整合最新的信息,它生成的内容多数时候更贴近中国用户需求,因此得到迅速推广与应用,它带来的冲击也更为现实。但DeepSeek在新闻业的应用前景,以及对可能风险的防范,取决于新闻业如何为其寻找合适的“着陆点”。
一
碎片整合与个性化加工:DeepSeek在新闻业的关键“着陆点”
即使DeepSeek生成的文字逻辑清晰、文采斐然,也不代表它在新闻内容的原创能力上可以超越或取代人类,特别是在现场报道、深度调查等方面。这一点与此前已经出现的各类“自动写作机器”一样。如果将DeepSeek的应用重心放在新闻的原创生产方面,不仅可能导致假新闻的进一步泛滥,也会削弱媒体人的能动性。
从现实需求来看,新闻业对DeepSeek等大模型的核心应用方向或者说“着陆点”,不应是新闻的原创性生产,而是新闻的深加工。
今天用户在数字信息世界面临的一个巨大困扰是,他们虽然每天接触到海量的信息,包括新闻信息,但这些信息大都是碎片化的,他们凭一己之力难以完成碎片化信息的鉴别、过滤与整合,这在很大程度上影响着人们对各种事件、话题的了解,也影响着他们对现实世界的认知。虽然整合碎片信息是媒体的职责之一,但在各种压力下,真正能很好完成这一任务的媒体仍非常有限。
而大模型的特长之一正是内容的整合与深度加工,它们可以快速获取分散的信息碎片,并将碎片化的信息整合成有条理的答案,描绘一个事件、现象或话题进展的全程、全貌,或揭示各要素间的内在关系。未来大模型还有可能以图片、视频等多模态形式进行内容的加工或整合。当然,大模型要形成高质量的整合内容,需要以专业的新闻语料库为保障。
大模型对内容的深度加工整合,也可以看作是一种定制化的内容加工。今天个性化推荐算法虽然已经普及,但它们仍然是在已有的“大锅饭”方式生产的内容中挑选适合不同用户的内容进行推荐。如果人们需要的某些内容没有生产出来,需求就无法得到满足。而DeepSeek等大模型则可以由用户提出需求——即提出问题,再进行内容的生成,这是完全由用户的个性化需求驱动的定制化加工,是真正“小炒式”生产的内容。
尽管大模型在选题策划、内容优化等方面也可以成为内容生产者的助手,但这些仍属于“锦上添花”式的应用,如果能解决碎片整合、个性化加工这样的问题,对内容生产者和用户才是真正的“雪中送炭”。
二
内容分发渠道再迁移:大模型应用的下一步挑战
如果DeepSeek等大模型能通过深度的、个性化的内容整合与加工来吸引用户,那就会成为越来越多的用户获取新闻资讯的主要渠道,甚至逐步成为一个新的内容分发平台。
互联网兴起之后,从门户网站、搜索引擎到社交媒体、综合性移动应用等每一代平台都成为了媒体内容的分发渠道,也对媒体自营的渠道产生了巨大的冲击。算法分发平台普及后,算法对内容流向与流量的调控更为突出,媒体自营渠道的影响力进一步被削弱。但算法无法完成内容的整合,这也是大模型类平台兴起的契机。
大模型提供的内容会超越人们日常的信息获取渠道,特别是社交渠道,这有助于打破人们现有的社会圈子、社会位置的限制来获取信息、知识,也可以使不同圈层的人获得的信息差有所减少,当然,其前提是人们能平等地接触与使用这些智能应用。与人形成紧密互动的大模型,也会越来越了解一个人的习惯、性格,它所提供的信息也可以不断迎合用户的偏好。但究竟是否要向这一方向发展,则取决于开发者与应用者的意愿。像今天的算法分发一样,大模型类的内容分发平台是会强化还是破解信息茧房,最终还是取决于开发和应用思路。
除了大模型本身的平台,接入了大模型的搜索引擎也会赢得更多用户的认同,它们在内容分发中的作用会进一步上升。
三
构筑专业新闻语料库:媒体的以“退”为“进”
对媒体来说,在智能时代要继续维护传统的渠道甚至是新闻客户端这样的新媒体渠道会越来越艰难,大多数媒体或许不得不退守为单纯的内容生产者,而不是延续媒体一贯以来的“产销一体”角色。但在这种退守中媒体也需要谋求适合智能时代的“进”。
目前,构筑专业性语料库是媒体主要的“进攻”方式。高质量的专业性新闻语料库是DeepSeek等大模型在新闻业发挥作用的前提,这样的语料库需要集成准确、高水平的新闻报道,而非网络空间参差不齐的一般语料。专业性新闻语料库的建设者必须是有专业水准的媒体或其他具有良好声誉的内容生产者。虽然在大模型的整合答案中未必能完整体现媒体单篇报道的内容,但如果能成为大模型答案中列出的参考资源,媒体的报道仍有机会被更多用户看到,媒体的品牌效应也可以得到一定的累积、延续。减少在自营渠道上的维护成本后,媒体也可以集中力量来保证高质量的新闻内容生产。
但仅凭一家媒体的力量要构建专业性语料库并不容易,众多媒体的合作,才会使语料库更为丰富、完整,也才能增加媒体与大模型开发者的角力“砝码”。
从新闻内容的深度整合、加工这个环节“着陆”的DeepSeek,可以发挥其优势,提升新闻生产与服务水平。同时,新闻业需要建立一种新的机制,即通过专业性语料库构筑新闻生产的“新门槛”,保证智能应用的加工、整合的水平,应对大模型可能造成的虚假新闻泛滥等问题。在新闻业应用的大模型算法,也需要针对新闻内容生产的特殊性,来进行一定调整。而对媒体来说,坚守高质量的原创性新闻生产,仍是立身之本。
作者系中国人民大学新闻学院教授
来源:中国社会科学网
责任编辑:张赛
新媒体编辑:张雨楠
如需交流可联系我们