DeepSeek震惊世界新闻业的精准效能

known 发布于 2025-08-11 阅读(229)

【摘要】DeepSeek的上线引起世界IT界和新闻业的轰动,但也激起美国官员和一些国家政府的恐惧,这款智能模型在这些国家被禁用。相反,西方广大用户却热烈拥抱它,使用它增强收发新闻与信息的技能。DeepSeek-V3的强大功能和应用场景火爆出圈,吸引了大量用户的青睐。

【关键词】DeepSeek;新闻业的新宠;精准效能;诋毁的落空

2025年1月20日,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索公司”)正式发布DeepSeek-R1大语言模型,向全球网络发送聊天机器人界面移动程序,超越了美国OpenAI的ChatGPT APP。DeepSeek的迅速崛起引起世界AI界和新闻业的震动,认为美国智能技术被中国抛在后面,美国AI公司的股票立刻遭到重创。[1]而后,DeepSeek-V3于2月3日又陆续上线国家超算互联网平台。令世界AI界吃惊的是,DeepSeek-V3的训练仅用了2个月,花费557.6万美元,而美国的ChatGPT-4训练成本约为1亿美元,训练时间长达6个多月。智能信息技术广泛用于新闻媒体和网络用户,DeepSeek-V3的语言处理与推理能力,为媒体生成内容提供了快捷、全面的服务,各国媒体和用户体验到新闻和信息传播的精准效能。

一、DeepSeek引发全球媒体的热议

2024年11月20日,DeepSeek-R1预览版正式上线,仅仅发布一周,在世界火爆出圈,外媒用“震动硅谷”来形容它对美国智能行业的冲击。英伟达声明说,DeepSeek-R1模型是“一项出色的人工智能进步”,“展现了难以置信的成就”。此话刚刚落地,英伟达股价立刻跌去17%。从特朗普到美国政界都感到了前所未有的危机,DeepSeek却迅速引起全球新闻界的热议,纷纷讨论DeepSeek-R1和DeepSeek-V3的推理、代码生成、多模态语言交流的高效与灵活。DeepSeek-V3作为我国全面开源的大模型,打破了西方闭源技术的垄断,吸引了全球智能技术开发者与媒体企业的关注,微软Azure、亚马逊AWS、英伟达等国内外平台纷纷接入,推动了AI信息技术的飞跃和升级。

自ChatGPT问世以来,人工智能一直占据着新闻头条,但DeepSeek以极其低廉的价格提供开源版本,点燃了世界科技界和媒体的热点。DeepSeek远超媒体对ChatGPT应用程序的关注,在全球约有7万次媒体报道,仅在美国就有近2万次,2025年1月26日全天,美国媒体就出现了6.3万多次报道。[2]在西方,每个新闻与公关从业者都对DeepSeek作出强烈反应,美国总统就职典礼后,有关DeepSeek的新闻占据了主导地位。美国媒体对DeepSeek的报道大多持积极态度,也不乏令其担忧的声音,纷纷议论它对美国人工智能行业的颠覆性影响。美国媒体对DeepSeek报道的关键主题是:

(1)对OpenAI、谷歌、Meta和Anthropic等人工智能领军企业和智能媒体构成挑战,DeepSeek成为智能媒体发展的转折点,引发智能公司和新闻界重塑竞争格局。

(2)将DeepSeek训练过程、资源利用和基础设施的高效性,同美国人工智能模型的训练方法和昂贵成本进行了对比,认为它碾压了美国智能技术及其媒体的效率。

(3)大量新闻反映DeepSeek掀起全球市场波澜,投资者对其重振人工智能经济的潜力作出肯定。

(4)DeepSeek对开源人工智能的承诺被广泛讨论,认为它可能成为行业游戏规则的改变者,将加速全球人工智能的发展;另一些新闻则强调开源模式的广泛采用可能带来风险,并提出质疑。

(5)新闻报道也指出DeepSeek的弱点是由于网络用户需求过大,可能导致对各类机构的服务中断,引发相关的安全问题。

美国媒体报道的这五个主题,界定了DeepSeek对人工智能技术的明显突破,承认它将成为推动智能行业广泛变革的催化剂。

DeepSeek之所以引起美国媒体狂潮般的报道,是因为它不是美国智能技术的复制,而是具有6710亿参数、14.8万亿词元(token)的大模型,为全球人工智能、互联网与各类媒体的信息传播树立了里程碑。美国Meta公司首席AI科学家Yann Lecun表示,DeepSeek-R1在AI领域正在超越美国公司的产品,标志着开源大模型在某些领域已经接近或超越越闭源模型。Meta公司CEO扎克伯格则认为,DeepSeek展现出的技术实力和性能令人印象深刻,中美之间的AI差距已经相差无几。微软首席执行官萨提亚·纳德拉在达沃斯世界经济论坛上进一步论证:“DeepSeek的新模型令人印象深刻,尤其是在高效开源模型以及推理计算方面,算力效果非常出色。我们应当非常、非常认真地对待来自中国的这些技术进展。”谷歌前首席执行官埃里克·施密特强调,DeepSeek的崛起标志着全球人工智能竞赛的转折点,证明中国可以用更少的资源与大型科技公司竞争。[3]据日本《日经亚洲新闻》2月5日报道,谷歌首席执行官桑达尔·皮查伊和美国超威半导体公司(AMD)首席执行官苏姿丰称赞深度求索公司作出了重大贡献。皮查伊认为,DeepSeek能够应用于更多用途,为美国科技巨头开拓了“机遇空间”。苏姿丰指出,DeepSeek用新方法和更少的基础设施实现(AI的)训练和推理能力,让人们能够继续挖掘AI资源,拓展了AI的应用领域,使其为更多的网民使用。美国科技公司英伟达NIM、微软Azure、亚马逊AWS等智能云平台已引进DeepSeek上线,支持用户访问DeepSeek-R1模型。

人工智能DeepSeek对媒体传播新闻产生的惊人效益也引起了欧洲媒体和科学家的注意,他们同样兴奋地表达了自己的评价。德国广播电台在一篇新闻中写道:“来自中国的AI语言模型DeepSeek改变了技术行业,美国科技公司的优势似乎被打破,这对欧洲的发展意味着什么?德国和欧洲也在开发人工智能,但是尚未开发出强大的语言模型。”这家媒体的记者采访了科学家拉斐尔·拉古纳·德拉维拉(Rafael Laguna de la Vera),他表示,欧洲仍有能力迎头赶上,这并非不可能。“DeepSeek现在已证明,比美国竞争对手更高效、更低成本、更节约资源。”[4]英国BBC在一则报道中称,中国新推出的人工智能应用程序DeepSeek以惊人的速度震撼了科技行业、市场以及美国在人工智能领域的优越感。英国《金融时报》将DeepSeek描述为“震惊国际科技界的黑马”,其性能已与资金雄厚的OpenAI等美国竞争对手的模型相媲美。英国《经济学人》在一篇文章中表示,中国AI技术在成本效益方面的快速突破,已经开始动摇美国的技术优势。

DeepSeek算力的优化及普及,使每个用户都能在家用设备和手机上,搜索一切媒体的新闻和信息。DeepSeek的性能还表明,这个技术不再是高端研究机构的专利,而是每个人都可随时接收或向网上发送新闻的工具,它以令人称奇的覆盖空间带来强劲的新闻传播效应。在苹果AppStore社区中,现在DeepSeek的用户已超过长期霸榜的ChatGPT,有160多个国家或地区下载使用它,仅俄罗斯就有超过500万人使用,DeepSeek已成为全球公民不可割舍的交流新闻与信息的巨大容器。

二、DeepSeek竭尽职守的新闻服务

美国新闻学者对DeepSeek聊天机器人进行了多次测试,考证网站上这款移动应用程序的细节和效用,多家媒体对它的链接与新闻报道赞叹不已。最值得注意的是,DeepSeek欣然承认,它能分享所有的新闻和文章,并绕过订阅付费墙。如果是纯新闻,不涉及版权问题,DeepSeek以四种不同设置,迅速呈现系统与更新、“搜索”新闻或信息、浏览网页与“深度思考”。在第四种设置模式(深度思考)下,它首先以推理汇集全面的新闻信息,回应媒体或用户的需求。美国人工智能尼曼实验室撰稿人安德鲁·戴克(Andrew Deck)说:“在我的标准模式测试中,DeepSeek确实在几个场合没有出示来自何种新闻出版物的内容,似乎莫名其妙、不知从何接入而将其呈现出来,实际链接的是《大西洋月刊》(The Atlantic)和《政治报》(Politico)等主要媒体的新闻梗概。尽管DeepSeek通常不提供新闻源的出处,相反,却在推出的文本中直接注明标题、作者或新闻发布日期,并标注署名。然后它建议我自己在新闻发布商的网站上搜索那篇文章,促使我分享了《华尔街日报》2018年对唐纳德·特朗普参与向斯托米·丹尼尔斯和凯伦·麦克杜格尔支付封口费一事的调查。”DeepSeek这样回答我:“如果你想找到原文,我建议你在《华尔街日报》的网站上搜索,或者通过新闻档案搜索。”“如果你遇到了付费墙,考虑检查免费文章配额或限制访问,您需要进一步的帮助,请告诉我!”[5]这说明DeepSeek为了防止擅自转载媒体分析性新闻而造成侵权,设置了巧妙的策略,让受众去寻找发出新闻的出版物来阅览原文。

DeepSeek重视转载新闻并遵守著作权法而采取周到的措施,同时为了受众阅读方便,提供了更加具体的新闻出处与收受方式。DeepSeek在另一条回答中建议安德鲁·戴克找一家当地的图书馆,那里可能有《华尔街日报》的免费电子版。当网络搜索被关闭时,DeepSeek经常鼓励用户离开这个平台——退出它的界面,寻找更可靠的消息来源。安德鲁·戴克说,在解释新闻内容时,DeepSeek明确表示,它对人们提问的回答可能侵犯版权,转发的文章很可能有付费墙,如果不对用户说明这一点,既可能违反规定,也可能给用户带来麻烦。DeepSeek经常建议用户自己搜索文章,只是告诉用户新闻作者的名字和发表时间,帮助他们搜索,这就不会遇到付费墙,毕竟有些媒体每月提供有限数量的免费新闻和文章。这款聊天机器人有时明确地告诉新闻用户:“我不能绕过付费墙提供未经授权的信息,尊重版权的订阅很重要。”对其他类似的聊天机器人(包括ChatGPT、Claude和Perplexity等)的访问,很少提醒人们注意新闻出版商要求付费,更不会公开讨论侵犯版权问题。DeepSeek负责任地为用户提供访问方式,对选择新闻媒体的付费做出说明,西方的智能网站很少如此提醒用户。安德鲁·戴克认为,DeepSeek的聊天机器人看起来很像谷歌搜索页面,在滚动中弹出窗口后可预览链接,包括每个新闻事实的出口、标题和摘要。大多数情况下,在DeepSeek上分享原创新闻,至少能找到20个来源,最多能找到50个来源。相比之下,ChatGPT通常通过提示,让用户共享15个新闻来源。目前,虽然正确的新闻事实通常是由DeepSeek给出的,但它有时会被生成的大量信息所掩盖。DeepSeek聊天机器人在引用和标注新闻出版商的出处方面,有相对较高的标准,更直接、更准确地将用户推荐给新闻发布者。随着用户对DeepSeek训练实践的了解不断加深,认识到这家人工智能推理模型更加民主化,更加尊重新闻发布者的版权,不断坚守对知识产权和新闻出版行业的规范。

美国人工智能专家兼记者凯伦·郝(Karen Hao)曾为《华尔街日报》(The Wall Street Journal)广泛报道人工智能和中国动态。他谈到DeepSeek的成功时,对记者说,传媒行业的未来意味着什么,这将如何影响全球新闻业?回答是:禁止这一模型是不可能的。他们只是把它放到网上,你不能对完全开源的东西实施禁令。对于世界各地的人工智能研究人员和开发者来说,DeepSeek非常鼓舞人心。“我希望DeepSeek能够引领新一代人工智能公司进入这个领域,提供更便宜、更节约资源的产品,这样我们就不会沦落到一个为了发展这项技术而消耗能源的奇怪世界。”“如果你想要完成的任务需要高度精确,并且是面向用户,比如你写的一篇文章或制作的一段新闻视频,那么你就不应该在那里使用GenAI(生成式人工智能),因为GenAI不是一个高度精确的工具,而是应当使用DeepSeek。当DeepSeek模型发布到开源人工智能平台上时,世界各地的人工智能开发者开始复制和完善他们的模型。”[6]DeepSeek不仅推动了智能技术的改进,也使各类新闻媒体链接智能APP更加方便和快捷。

美国新闻界也有些人唱反调,认为DeepSeek-R1带有偏见,深受中国审查制度的限制,新闻与信息被过滤,媒体使用它可能丧失受众的信任。数字媒体奥多(Ordo Digital)的创始人乔恩·阿卡里诺(Jon Accarrino)旁敲侧击地说:“新闻编辑室必须优先考虑透明度,解决潜在的偏见并在其AI集成策略中保持人类判断。新闻机构在考虑采用诸如DeepSeek-R1之类的AI工具时需要谨慎行事,以应对新闻诚信和公众是否信任的重大风险。同任何AI技术一样,DeepSeek-R1存在有关新闻透明、偏见和人类判断的作用与道德等重要问题。”阿卡里诺这一荒谬的观点,纯属主观揣测,他不得不承认DeepSeek在美国上线后受到用户的普遍肯定,产生了巨大影响。他自圆其说并出尔反尔地写道:“不管喜欢与否,为了获得市场份额的战略,DeepSeek-R1作为开源AI模型发布,可免费下载,这使该模型很快变得非常流行。”“虽然DeepSeek-R1的高级推理能力和成本效益很有吸引力,尤其是对深受预算束缚的新闻组织,但其内置的审查制度和潜在偏见对新闻完整性构成了重大风险。新闻机构继续探索AI诸如数据分析和内容优化之类的任务和潜力时,必须实施严格的保障措施以保护编辑客观性并保持受众的信任。DeepSeek不会以任何有意义的方式促进这些目标。”[7]最后几句毫无根据的否定,只能说明阿卡里诺的偏见十分顽固,即使他亲身体验到美国用户对DeepSeek的钟情,也不愿意承认这一事实。

三、DeepSeek传播新闻的机理与智能参数

DeepSeek作为一款新型的智能搜索引擎,不仅能汇集、呈现无限新闻文本,而且具有自然语言处理(NLP)、计算机视觉(CV)和多模态的信息融合技术,为媒体和用户提供更精准、高效和个性化的搜索与写作体验。它的写作能力跃居前沿,在汇编代码语法与转换为处理器(GPU)的具体指令方面,超过了英伟达编程模型的算力;在图像识别、语音识别、自然语言处理等深度领域比英伟达的程序更为简捷、快速。作为搜索新闻、编写和分发新闻的这些技能,DeepSeek的运作有更加显著的提升,从模型方法、框架系统到基础设施表现出的优化也更加突出,算力效能明显增强,捕获和传播新闻的信息量远大于美国公司的智能参数。

DeepSeek之所以能轰动世界,因为它的推理或语言表达具有严密的逻辑,再现信息的每一步都提供了内在联系与前提。DeepSeek-V3作为新一代的大语言模型,就像一个主讲人或咨询机构,每一步呈现的信息都给下一步推出的事实、含义、对话或解答做出铺垫,让人们看到大小事件的全貌或具体景象(称为颗粒度granularity)。这种逻辑在推进中,把完整的新闻事实纳入一个过程,每个环节都显露出整个事件的必然发展。DeepSeek-V3对新闻的呈现,依据面临的状况采取相应策略,寻求足够的根据推出下一步动态和场景。这种逻辑推进与判断,建立在推理模型的四个要素之上,保证了新闻的精准性。这四个要素是:(1)搜索(Search)所有事实与相关事实,常用的方法有两类,一是进行广度与深度搜索,二是按一定顺序搜索,全面掌握相关事件。(2)运用推理的初步能力,对搜集到的信息经过提示、比较、鉴别,调整所有内容,在检查、验证其真实性并修正错误后,分解信息的各个部分,将面对的问题作出分析和论证。(3)肯定上述论证,对事件的发展作出回应和解决方案(Reward Design),并从信息环境获取更多的事实充实新闻内容,引用有关人士对这一事实的评价和相关数据,再现真实的场景和事件过程,对新闻作出分析或结论。(4)仿照(Learning又译学习)客观事实记述事件,优化模型参数,以逐步深入和全面克隆的方式展示事件。经过以上四个要素连续演进与互动,达到对新闻事实的完整叙述。

DeepSeek-R1发布新闻有两个模型。第一个是R1模型,在性能上达到OpenAI o1的正版水平,与后者不同的是,DeepSeek-R1的思维链透明,所有技术细节都向用户与媒体公开,提高用户的体验。在数字、代码、自然语言推理方面,DeepSeek强化了模仿(学习)技术,极大增强了推理判断能力。DeepSeek-R1利用模型压缩技术,通过训练较小的模型模仿大模型,又可将大模型的知识转移到更小、更高效的模型中,分离出6个小模型,参数分别为1.5B、7B、8B、14B、32B、70B,保证了生成和传播新闻的准确率。DeepSeek生成新闻的第二个模型是R1-Zero,汇集更多的计算资源,生成大量精准和有用的数据,进一步提升信息的准确性和可靠性。该模型形成强化的信息循环,从一个基模为起点,由大量网络信息促成“热身运动”(Warm-up),搜集某条新闻的大量报道,汇集社会对新闻事件发出的多种角度、多个立场,作出整理和归纳。新闻与信息传播实践证实,该模型的低计算量为76%,高计算量为88%,舍弃的大部分是内容相同或相近的信息。R1-Zero的模型参数达到671B,GPT-3的参数则是175B,比GPT-3模型的容量大得多,包括61层语言编码与解码结构(Transformer),对整合或翻译不同语言的新闻信息发挥了灵活、快速的作用。R1-Zero模型具有长思维链,推理路径较长,还可修复以前的不当推理。但它搜集、提供的新闻内容冗长,可读性较差,还可能把多种文字或有声语言混杂在一起输出,这个缺点有待改进和消除。R1-Zero不只是为用户提供新闻和各种信息,还是一种写作工具,它的开放性给人们生成文章提供了丰富的资料,是一种没有约束力的写作或创作工具。DeepSeek-R1-Zero的运作表明,它生成的代码和评价指标(pass@1)从最初的15.6%提升到71.0%,最终达到86.7%,把强大的推理能力用于各种文本的写作,只要给出几个提示词就可写出很长的文章。

为了提高模型传播新闻和信息的精准度,DeepSeek采用一套训练计划,把以上两种模型和训练模块的神经网络头部和信息插入同一个节点,让用户迅速共享大数据参数。DeepSeek采用了英伟达的精度计算方式(FP8),计算信息及其核心矩阵通过增加累积的尾数量以及在线量化策略,防止离线搜集信息的可能性。任何人工智能的运作都离不开算力、算法和数据的巨量化,克服算法的缺陷,强化算力的突破,把大数据视为智能新闻的基石,提高了传播新闻的精准度和效率。媒体利用DeepSeek技术生成和发布新闻,须持有开放态度,需要熟练掌握和运用这一模型架构、硬件设施和软件设计。

四、批驳科技霸权对DeepSeek的亵渎与攻击

DeepSeek的脱颖而出,首先征服了西方新闻界的傲慢,有些人垂头丧气地发出哀鸣。有人认为,这是“苏联发射第一颗人造卫星斯普特尼克号的时刻”,美国的智能研究面临一场绝望的挑战。美国总统特朗普2025年1月27日对众议院的共和党议员说:“中国公司发布的DeepSeek是一颗重磅炸弹,对我们人工智能企业是一种警告!”据央视新闻报道,当地时间1月28日,美国白宫新任新闻秘书卡罗琳·莱维特在首次新闻发布会上谈到DeepSeek,声称白宫正在努力“确保美国人工智能的主导地位,特朗普已签署行政命令撤销对人工智能行业的一些繁琐的监管”。同一天特朗普又对美国记者说,“美国公司需要全神贯注地投入竞争以求胜出”,“中国制造的人工智能也可能是积极的,推动更多美国数字技术的发展。我认为这对我们来说也是一件好事。我们总是有想法,我们永远是第一”。[8]

美国政府的一些具体管理官员态度恶劣,无中生有地对DeepSeek进行诽谤。特朗普的人工智能顾问大卫·萨克斯(David Sacks)却指责DeepSeek盗窃OpenAI数据,窃取美国的知识产权,声明“DeepSeek聊天机器人应用程序现在面临调查,在某些情况下它可能侵犯隐私,带来安全问题,在美国和其他一些国家被禁止”。[9]他认为:“中国可能利用一种名为蒸馏的技术,分离、模仿其他人工智能模型系统,美国的人工智能技术在未经授权的情况下可能被复制。”美国防火墙协会(Sophos)主管兼全球首席技术官切斯特·维斯涅斯基(Chester Wisniewski)影射DeepSeek发出威胁的言论:“就像羊驼一样,它可以玩耍,而且基本上可以拆除护栏。这可能会导致网络犯罪分子滥用,需要注意的是,运行DeepSeek需要比普通网络犯罪分子多得多的资源。”[10]1月30日,美国参议院情报委员会主席霍利提出一项《美中人工智能能力脱钩法案》,要求切断美中在AI领域的所有合作,禁止AI技术对华进出口与投资。美国商务部正在调查DeepSeek是否在使用被禁止运往中国的美国芯片。[11]毫无疑问,中国在AI领域的成就已经引起美国政府和少数企业的强烈反应。美国加利福尼亚州前内阁副秘书长杰夫·莱(Jeff Le)告诉《能量》(Capacity)杂志的记者说,“DeepSeek的崛起让国家安全政策制定者感到震惊,他们认为美国的人工智能具有优势是严重误判”;“对于那些将人工智能竞赛视为21世纪霸权关键的政策制定者来说,这一时刻代表着对美国全球领导地位的明显威胁”;“这远远超出了TikTok的影响范围。如果美国没有世界上最好的创新者和研究人员怎么办?芯片限制对解决这个问题没有帮助。这是一个直到现在都无法想象的想法”。[12]

DeepSeek挑战了美国AI技术的主导地位,从西方政界、新闻界到智能科技界都深感一场危机迎面而来。美国科技投资者马克·安德森(Marc Andreessen)称DeepSeek标志着AI的“爆发时刻”,他同1950年代苏联太空技术的突破进行了比较,深感DeepSeek给了美国一锤重击。为此,西方许多国家和组织已经禁止使用DeepSeek,其借口是所有用户数据都存储在中国,最大的担忧是向中国政府泄露国内的重要情况。格里芬媒体(Griffin Media)技术副总裁特雷弗·怀斯曼(Trevor Wiseman)说:“我建议我们在格里芬媒体的用户避免使用DeepSeek。”“我们的IT部门已经阻止了Griffin Media网络中对该工具的访问,以确保我们用户的隐私受到保护。新闻编辑室应制定有关使用新的AI工具的明确准则,最好是与IT部门协商。为了更好地为新闻编辑室提供服务,IT团队必须为记者开发安全的测试环境,以评估新闻报道的AI工具,同时优先考虑大型组织的数据安全和编辑的完整性。”[13]除媒体公司外,禁止使用DeepSeek的国家和地区及其部门包括澳大利亚政府机构、意大利全国、韩国工业部、美国航天航空局、得克萨斯州政府、美国国会、美国海军、美国五角大楼。[14]据韩联社报道,因处理信息涉及较多机密,韩国外交部和产业通商资源部决定限制登录DeepSeek平台。澳大利亚广播公司等媒体报道,澳政府(2月)4日宣布禁止在政府机构的电子设备上使用DeepSeek,称其“对澳政府技术(构成)不可接受的风险”。据中国日报网报道,DeepSeek大模型遭到史上最大规模的网络攻击,攻击源均来自美国。由于此次攻击的影响,新用户的注册变得异常繁杂,甚至有时无法完成,DeepSeek迅速调整了服务器的配置和策略,加强了网络安全防护,有效地抵御了攻击的进一步扩大。DeepSeek总部与多家网络安全公司建立了紧密的合作,采取多种措施,共同应对来自多方面的袭扰。[15]

中国有关部门对西方攻击、禁用中国的DeepSeek技术给予郑重声明。2025年2月3日,中国常驻联合国代表傅聪在纽约联合国总部举行记者会,当被问到近期全球瞩目的DeepSeek发布的模型以及中美人工智能合作问题时,傅聪强调:“永远不要低估中国科研人员的聪明才智。DeepSeek引发全球轰动和一些人的焦虑恐慌,说明技术遏制和技术限制无法奏效,这是全世界特别是美国需要学习的一课。”傅聪问道:“从华为到TikTok,再到DeepSeek,美国还想禁多少?”他表示,“我们不需要更多禁令,中美作为在当今人工智能领域最领先的两个国家,不能不合作。只有共同合作发展,才能弥合数字和智能鸿沟,特别是帮助全球南方在人工智能发展进程中平等受益”。“DeepSeek已成为全球下载次数最多的应用程序之一,但一些政府对此表示担忧。”[16]

对美国官员毁谤DeepSeek及其公司最有力的回击来自西方网络用户、软件专家和正直的媒体。大量用户和一些智能公司高度评价DeepSeek的优势,主动链接和使用,纷纷抵制对它的封杀。据欧洲新闻电视台2月3日报道,得克萨斯州禁止在政府发放的设备上使用DeepSeek,然而,这一禁令很快引起不少美国网民的反对。一名得克萨斯州的网民表示,DeepSeek是目前全世界最好的人工智能,得州的封杀令是无知和短视的。他形容DeepSeek带来的市场动荡对硅谷而言是“积极的”,因为这迫使硅谷以更低的成本进行创新。[17]对抹黑DeepSeek的所谓威胁和惊扰的言论,微软(Microsoft)和英特尔(Intel)前软件工程师、绿色软件开发专家斯科特·钱伯林(Scott Chamberlin)提出了质疑,认为它们“可能言过其实”。美国媒体CNBC称,DeepSeek在取得这样出色成绩的背后,是美国政府对中国实施的严格半导体限制的结果,这些限制使中国无法获取英伟达H100最强大的芯片。中方的最新进展表明,DeepSeek要么找到了绕过相关规则的方法,要么说明美国的出口管制并未达到华盛顿的预期效果。

科学技术专家和媒体人士长期从事辨别、遵循或宣传真理的工作,多数人对是非利害问题有清醒的认识,他们就美国对DeepSeek的非议发表了大量批驳性的言论与新闻报道。曾经扬言要起诉DeepSeek的OpenAI仅在几天后就改变了口风,据“德国之声”报道,OpenAI首席执行官奥尔特曼在东京对媒体表示,OpenAI没有起诉DeepSeek的计划,“公司将继续打造出色的产品,并以模型能力引领世界,我认为这会很棒”。奥尔特曼称赞DeepSeek“无疑是一个令人印象深刻的模型”。路透社报道称,DeepSeek的出现正在改变人工智能的格局,以极低的成本使用该项技术,能够推动其他人工智能公司改进模型并降低价格。美国伯恩斯坦研究公司的分析师估计,DeepSeek的定价仅相当于OpenAI同类模型的1/40-1/20。他说:“我认为DeepSeek对我们这样的公司来说是一个巨大的机会。”德国《时代周报》发表的新闻指出:“为什么我们仍然低估中国,这并不是中国高科技行业首次凭借创新产品征服世界——想想TikTok的全球胜利。过去十年去过中国的任何人都不会没有注意到,中国人日常生活的每个领域现在几乎都已经数字化,其普及程度常常令欧洲人感到惊讶。”[18]DeepSeek通过异构计算,将算力提升2倍多,打破了西方公司的算力垄断。从纵向看,DeepSeek大模型算力已从训练向推理转移,随着多模态应用的普及,推理算力在电脑上增速,使新闻传播的数量极度扩大,DeepSeek必将占有受众市场的最大份额。

五、DeepSeek推动媒体与智能企业的创新潜力

DeepSeek的崛起标志着AI技术已经迈入一个新阶段。在2025年春节假期这个特殊时间点,DeepSeek凭借强大的智能技术,让人们浏览丰富多彩的各种新闻。借助强大的技术动力,DeepSeek加倍地从事内容写作,新闻发送和智能推荐更加准确,进入网络的用户翻倍增长。DeepSeek的应用成为全民热点,火爆程度超乎想象,尽管服务器数次宕机,搜索功能一度拥挤不堪,但它游刃有余地满足了网民的需要。通过深度挖掘用户需求,精准推送个性化的新闻资讯,DeepSeek展现出跨场景、跨国界的应用能力。在智能化时代的发展浪潮中,探索DeepSeek技术创新的潜力,引领媒体以较高智能搜索各种新闻,为用户提供更加丰富、优质的智能化新闻服务,标志着AI技术出现又一次的飞跃。

DeepSeek展示了AI技术的巨大潜力,为智能新闻的升级找到了创新方向,也为媒体打造影响力提供了有力支撑。面对广大网络用户的使用,DeepSeek团队展现出的高水平与应变素质,为该模型的运行注入了充沛的活力和思维,引发了科技圈和资本市场的垂青。对云厂商和芯片厂商来说,投入DeepSeek模型产生的杰出效果,迎来广阔的发展空间和新一轮竞争力。随着DeepSeek不断普及和应用场景的巨大拓展,媒体作为智能领域的佼佼者,行业升级的驱动力明显增强。DeepSeek不仅促进了媒体的飞跃式发展,对各行业的机器人和自动驾驶也产生了技术内驱力。DeepSeek一旦超大规模地发展,在未来3—5年内将产生数万亿元资本的增值,在服务器和算法优化的前提下,进一步提升新闻服务的稳定性和高效性。这需要进一步加强技术研发和创新,深入拓展多重功能的应用场景,让媒体的新闻视域伸向世界每个角落。加强与国内外同类公司的交流与合作,携手研发算力快速飙升的引擎是DeepSeek公司面临和需要解决的重要课题。

根据现有技术成果推测,DeepSeek的高精度中文建模,基于庞大的中文语料库训练,除在捕捉、运用汉语方面表现出色,还具有多种语言运用能力,从而支持更广泛的新闻与信息的全球覆盖。它的强大搜索、写作和摘要功能,使DeepSeek能够查询全球所有数据库而推送新闻与信息,并向各种问寻者提供准确的答案。DeepSeek似乎不仅支持复杂的对话式人工智能,还支持集成搜索和数据检索,在企业管理和社交媒体分析方面具有潜在价值。凭借先进的自然语言处理能力,同许多网络平台的深度整合,Deepseek赢得全球新闻市场的前景异常广阔。其强大的搜索和生成框架,还可能为中国各类企业提供有吸引力的智能服务,让企业掌握本行业的产品生产和销售的完整信息。[19]为此,Meta正在研究DeepSeek模型,已经组建团队——成立了四个小组探索DeepSeek的工作原理,了解和掌握DeepSeek汇聚和传播新闻或各种信息的技术,试图改进其自身的Llama模型。Meta内部有人担心其Llama模型可能会落后于DeepSeek,Meta公司首席人工智能科学家杨立昆(Yann LeCun)表示,DeepSeek的崛起表明“开源模型正在超越专有模型”,建立在其他模型工作之上的开源性改进,肯定会从中获益。引进DeepSeek的先进之处,改进Meta的Llama 3.1模型,是Meta的当务之急。[20]扎克伯格坦言,DeepSeek做了一些“新奇的事情”,他的公司“仍在消化DeepSeek的一些成果”,将其应用到自己的AI项目中。DeepSeek完全开放,使所有模型可用于全球开源社区,各国研究人员和公司正在吸收并融合DeepSeek的技术,力求创建源自DeepSeek的新模型。例如,GitHub(面向开源及私有软件项目的托管平台)的香港团队微调来自阿里巴巴云优化的DeepSeek语言模型,使用输入数据的一小部分就获取了信息传播的满意效果,进一步降低了成本。[21]

当我们对DeepSeek的崛起加以肯定时,不能忽视它遇到的挑战。随着用户量的不断增加,保持服务的稳定性和高效能仍须进一步强化。目前,对于AI在新闻制作中的作用,很少有测试偏见或促进透明度的机制,DeepSeek的使用出现了转折点,创造了初步手段与方法。AI技术及其应用场景的不断拓展,扩大它的创新和竞争优势仍需努力探索,比如,如何使它能全部搜索世界各类媒体的新闻,如何高精度辨别发送来的全部新闻与信息的真实性,如何将其发出的指令用于机器人、机器狗、工农业生产、无人驾驶、各种飞行器以及军事武器的智能化,都是DeepSeek急需提升和优化的目标。

参考文献:

[1]Sean M. Kerner.DeepSeek explained: Everything you need to know,tech giants,Feb.4,2025.

[2]Richard Carufel.Media Insights: Examining DeepSeeks Dynamic Emergence Through Coverage Analysis,Public Relations,Jan.30,2025.

[3]DeepSeek火爆全球 彰显中国智慧[EB/OL].https://baijiahao.baidu.com/s?id=1823190355371333642amp;wfr=spideramp;for=pc.

[4]Warum die KI aus China Europa nützen kann,Deutschlandfunk,31.01.2025.

[5]Andrew Deck.How DeepSeek stacks up when citing news publishers,Facebook,Feb. 6,2025.

[6]Marina Adami.What DeepSeek may mean for the future of journalism and generative AI,Reuters Institute For The Study of Journal:sm,Jan.28,2025.

[7]Jon Accarrino.DeepSeek R1s Promise And Peril For News,Jan.28,2025.[EB/OL].https://tvnewscheck.com.

[8]Trump says Chinese AI launch is“wake-up call”,The New Daily,Jan.28,2025.

[9]Trumps AI Ambition and Chinas DeepSeek Overshadow an AI Summit in Paris,Associated Press,Feb. 9,2025.

[10]Gyana Swain.US officials probe Chinas DeepSeek AI amid security and privacy scrutiny,Computer world,Jan.29,2025.

[11]开源代码、商业利益与大国博弈[EB/OL].https://finance.sina.com.cn/wm/2025-02-12/doc-inekekxr2966550.shtml.

[12]Ben Wodecki.Behind the DeepSeek hype: Costs,safety risks amp; censorship explained,Capacity Media,Jan.29,2025.

[13]Andrew Deck.How DeepSeek stacks up when citing news publishers,Facebook,Feb. 6,2025.

[14]Sean M. Kerner,DeepSeek explained: Everything you need to know,tech giants,Feb.4,2025.

[15]DeepSeek火爆全球 彰显中国智慧[EB/OL].https://baijiahao.baidu.com/s?id=1823190355371333642amp;wfr=spideramp;for=pc.

[16]被问DeepSeek 中方代表:永远不要低估![EB/OL].https://baijiahao.baidu.com/s?id=1823109100364198205amp;wfr=spideramp;for=pc.

[17]被问DeepSeek,中方代表:永远不要低估![EB/OL].https://baijiahao.baidu.com/s?id=1823109100364198205amp;wfr=spideramp;for=pc.

[18]多家科技巨头宣布接入,世界对DeepSeek的惊叹还在持续[EB/OL].https://world.huanqiu.com/article/4LMAWkTjYjT.

[19]DeepSeek: A China-Based LLM with Global Implications,Jan.24,2025.

[20]开源代码、商业利益与大国博弈[EB/OL].https://finance.sina.com.cn/wm/2025-02-12/doc-inekekxr2966550.shtml.

[21]Brandon Rich.DeepSeek Explained: What Is It and Is It Safe To Use?Jan.31,2025.https://ai.nd.edu.

作者简介:刘建明,清华大学新闻与传播学院教授(北京 100084)。

编校:董方晓

封面人物·郭小安

郭小安,曾任教于华中科技大学,现为重庆大学新闻学院院长、教授、博士生导师,重庆大学学术委员会委员,主要研究政治传播、公共舆论。入选重庆市学术技术带头人和国家级青年人才计划,获第六届新闻传播学学会杰出青年奖。担任重庆市哲学社会科学智能传播与城市国际推广重点实验室执行主任,国家社科基金重大项目首席专家,教育部马工程重点教材《舆论学》副主编,兼任第十三届全国青联委员,第六届重庆市青联常委、教育界别主任委员,中国新闻史学会常务理事、中国新闻史学会传播学研究专业委员会副理事长,中国新闻传播教育年鉴编撰委员会副主任委员,重庆市委网信办网络内容建设咨询委员会专家,重庆日报报业集团传媒研究院学术顾问,重庆大学融媒体学生交叉创新中心主任等。在《新闻与传播研究》《国际新闻界》《现代传播》《新闻大学》等刊物发表学术文章80余篇,入选2024年中国知网高被引学者TOP1%。出版个人专著3部,获省部级奖5项,主持国家社科基金重大项目1项,国家社科基金一般及青年项目3项、国家社科基金重大项目子课题3项及重庆市社科规划重大项目等其他课题20余项。

标签:  美国 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。

iidomino cuppor