谭天?邵泽宇?司峥鸣
摘要:网络交流催生了网络语言,随着网络交流日益频繁,网络语言带给人们便捷交流的同时也产生了一些负面问题。本文在梳理了网络语言的相关概念、观点和网络语言治理研究现状后,提出把人工智能应用到网络语言治理中,建立基于深度学习的网络语言规范智能管理模式,进而构建智能把关理论,推动网络语言规范治理体系构建。
关键词:网络语言 网络语言治理 人工智能
1994年中国接入国际互联网,此后网民们为了提高网上聊天的效率以及诙谐、逗乐等特定需要而采取的方式,久而久之就形成了特定语言。随着互联网的普及,这种语言形式在互联网媒介的传播中有了极快的发展,越来越成为人们网络生活中必不可少的一部分。但是,网络语言的迅速发展也带来了许多问题,由此成为我国互联网治理的重要内容,网络语言的规范也成为社会主义精神文明建设的重要任务。
一、网络语言治理的研究
在本研究中我们将网络语言定义为:人们在网络空间(社会)交流中所产生、使用的一种满足于网络交流的约定俗成的符号样式与规范。以网络语言的生成空间为划分标准,网络语言可以分为三类:线上生成和传播的、在线下生成线上传播的、由机器即人工智能生成的。以其形态样式为划分标准,广义的网络语言可以分为三种类型:文字语言、符号语言(表情包)和机器语言(机器翻译或生成的语言)。
人们对于网络语言存在各种看法,我们认为对网络语言的评价应当一分为二,那些生动、活泼的语言理应得到广泛推广与使用。网络语言是网络文化的重要组成部分,在新媒体技术运用背景下的网络则是青年亚文化的主要阵地,作为亚文化的重要组成部分,有些网络语言也会从亚文化走进主流文化,成为交流及文化传播常用语言。比如,厉害了我的国、给力、点赞等。但是,网络语言中也存在大量消极、恶俗、哗众取宠、具有危害性、不利于交流的语言成份,以及由此产生的网络语言暴力、网络谣言等应及时从网络语言中过滤掉,这是净化互联网空间与网络语言治理的重点。
关于网络语言治理,采取行政和法律手段是目前研究的主要方向,实名制、制定相关法规、增强执法力度成为主要治理措施。陈晗婧认为,治理网络语言暴力行为必须推行实名制,追究行为人责任,加强对网络空间的言论监管,以制止网络从众行为的发生。陈丽湘认为,“媒体语言治理要统筹各方力量,使政府、社会、公众形成治理共同体,加强各主体之间的督促、衔接和协调,实现媒体语言治理的资源整合和力量融合”。[1]赵子毓在《网络语言传播与治理》一文中提出,相关部门应分层对不同网络空间进行规范,并且执法部门应加强监管与规范。谢天长在《网络语言暴力治理的法律对策》一文中,围绕网络语言暴力的法律范畴、建构网络实名制、厘清网络语言暴力中各方责任等三方面,论述了依法治理网络语言暴力的基本思路与具体做法。王羽栋认为,通过政府主导、技术手段、法律保障以及全社会协同参与四个层面的手段,形成一条层次分明、职能明确的治理路径,从而有效地对网络语言暴力问题进行治理。除此之外,给网络语言以正确的舆论引导,塑造正确的价值导向,“加强网上舆论引导,控制、减少各种噪音”,[2]从而净化网络空间。要充分发挥网民主观能动性,自觉规范使用网络语言。网络运营者应增强自律精神,网民对网络语言的使用应当有所甄别,而不是全盘接受。
然而,网络语言治理不仅需要强有力的行政和法律手段,还需要有效的技术手段支撑才能把网络语言治理工作落到实处。近来学者们开始研究智能把关,即把人工智能技术应用到网络语言把关中。阮立提出数字把关人模型,“表明未来的研究必须连接到新闻流动模式才能够充分解释数字选择过程”。[3]罗昕认为,算法的出现意味着传统把关理论面临着结构上的转型,主要包括“把关主体从人工到人工智能,把关关系从训示到迎合,把关机制从编辑到算法,把关内容从整体到碎片”。[4]然而,智能把关如何实施还需要具体而有效的操作方法。
二、网络技术助力网络语言治理
我们有足够的理由将网络技术应用于网络语言治理。首先,网络语言的产生与网络技术的发展有着密切的关系,是网络技术的具体应用。人类语言产生于具体的实践和人际交往活动中,任何社会发展形态下的语言,都与其使用的工具与技术有着密切的关系,以网络技术普遍应用为标志的信息社会更是如此,信息本身就是由语言组成的,且信息的交换主要是语言的交换,这里的信息主要是指狭义的信息,即视音频、图片、文字等不具有具体形态的事物。网络技术是网络语言产生的前提条件,正是有了电脑、手机等硬件设备,网络语言才有了产生的可能。另外,人与人之间通过网络技术在网络空间的交流是网络语言产生的必要条件。正是由于键盘、图片处理软件、人工智能技术等的使用,使得文字、图片、字母、数字之间可以任意拼贴,并赋予其意义,文字与视频可以相互转换。因此,用网络技术来解决由其产生的问题,由网络技术的发展与应用进而弥补由其带来的缺憾,可谓“用其人之道,还治其人之身”,能够迅速抓住问题的症结,指出这一网络技术应用中具体的漏洞与问题,并通过改进技术,助力网络语言治理。
其次,海量的网络语言使采用网络技术治理成为必然选择。第48次《中国互联网发展统计报告》(以下简称《报告》)显示,截止到2021年6月,我国网民规模已达10.11亿,手机网民规模高达10.07亿,即时通信用户规模高达9.83亿,网民平均上网周时长为26.9小时。网络已逐渐成为人们交流的主要渠道之一。由于现实中的人已经无时无刻处于“线上”状态,网络语言不仅对网络社会交流产生影响,同样也对现实社会互动产生影响,网络语言已经渗入我们的日常生活,人们的网络活动越频繁,使用网络语言就越多,总的趋势是网络语言翻新的速度不断加快,因此网络语言暴力、网络谣言等网络语言乱象也随着频出,单靠法律法规、人工筛选和行政手段是无法及时处理这些海量信息的,需要利用网络技术进行筛查、过滤,能够及时跟踪、评价、反馈和及时调整规范。对于网络语言的治理不仅关系到文化传承,而且也关系到社会能否有序发展,能否长治久安。
第三,网络技术可以阻断负面网络语言传播渠道,相当于建了一道“防火墙”。网络语言的产生和传播离不开日常生活所使用的语言,是将日常用语搬至网络空间,将听觉器官占主导地位的语言,转变成为以视觉器官为主的文字或各种形式的组合,是一种书写出来的言语。英国语言学家戴维·克里斯特尔在《语言与因特网》一书中比较了书写与言语的区别,进而指出网络语言不具备言语的特征,也不具备书写的特征,它是“口语和书面语言特征的集合体”。[5]正如我们所知,“完整的成熟的语言符号应该是音、形、义的有机结合”,[6]与日常交往不同,我们在网络空间将言语转化为书写时,为了加快传播速度,减少因书写时间产生的延迟,并没有严格遵循音形义的结合,比如文字符号,偏向于“音”,文字、数字、字母等书写符号能够满足传者要表达含义的读音即可,这种拼贴满足了网络交流的时间倾向。受者通过视觉器官(眼睛)与拼读器官(嘴巴)相结合,将书写出的符号解读出来,单个符号没有任何意义,必须结合具体语境,对书写符号或组合体进行解读。而快速解读必须借助技术手段。
网络语言是现实生活语言的迁移,现实生活的变化会直接影响网络语言的产生发展,而作为网络语言制造主体的个人,则是社会化的个体,无时无刻不接受来自社会各方面的好处或压力,情绪是多变的,并且难以捉摸,各个不同年龄阶段对于网络语言的应用和态度都是不同的,网络语言乱象是不可预测的。美国心理学家R·哈维格斯特提出人生六阶段理论,他将人生阶段划分为幼儿期、儿童期、青年期、成年早期、中年期、老年期。根据《报告》显示,40岁(不含)以下网民比例占到网络用户总数的53.4%,其中,6-19岁占比为15.7%,这一年龄群体的网民属于儿童期,此阶段乐于接受新鲜事物,但还没有形成完善的是非价值取向,是主要的受影响的群体。20-29岁占比为17.4%,这一阶段群体属于青年期,追求个性、标新立异,是网络语言的主要创造者,尤其是表情包和流行语,以及各种拼贴形成的网络语言。40岁及以上网络用户属于中年期和老年期,不易接受新鲜事物,且阅历丰富、精通为人处世之道,网络交流只是日常交流的拓展,更不会参与网络暴力,但对于某些网络谣言的甄别能力有待提升。30-39岁占比为20.3%,这一群体为成年早期,是个人工作、生活压力最大的阶段。
网络成为释放现实压力和负面情绪的场所,随之而来的是网络暴力和网络谣言等乱象的产生。而网络具有开放性的特点,每个用户都可以参与到生产和传播之中,因此无法从产生网络语言乱象的源头治理,也就是不能控制每一个网民不发生负面行为,但是,可以运用网络技术阻止其传播,没有传播的生产等于不存在,不会给他人及社会造成不良影响,这样,既达到了宣泄情绪的目的,又保证了良好的网络环境秩序。
第四,网络语言治理与人工智能应用研究已取得一些进展。网络语言治理与人工智能应用研究主要集中在网络敏感词治理和网络谣言治理两大方面。一方面,网络敏感词治理。针对目前网络技术环境与网络信息传播的方式,刘耕提出了一种“敏感信息关键词库”。[7]薛鹏强“对传统的DFA过滤算法进行改进只须建立一次敏感信息决策树,即可实现对网络信息的多次过滤,当敏感词语料库发生更新时,可以实现对敏感词的决策树的实时更新”。[8]付聪通过“分析汉字的结构和读音等特征提出了一种中文敏感词变形体的识别方法。有效提高了敏感词审查的准确率和效率”。[9]周昊提出“针对模糊匹配的汉字相似度对比算法,提出一种综合考虑读音及字形特点的音形码汉字相似度改进算法,添加了精度参数来设置匹配精度,以此完成敏感词检测”。[10]王冲构建了“敏感句子与敏感词词典,并通过规则及相似度匹配策略对特征明显的对话进行意图识别”。[11]吴珊通过“对文本内容中敏感词过滤方法及相关技术的研究,解决了敏感词过滤技术中的人工干扰、分词障碍等关键问题,提高了文本中敏感词过滤的准确性和有效性”。[12]另一方面,对于网络谣言治理研究,郭全中认为,“资讯平台应进一步完善AI算法,给予真实、高质量的信息更多的权重”。[13]任哲在人工智能治理网络谣言传统模型的基础上进行改造,“在人工智能自然语言处理技术的辅助下,将谣言技术监督环节细化为谣言识别和谣言治理两个环节,从提高精准度和覆盖率两方面谋求突破”,[14]并指出人工智能技术助力网络谣言治理的同时也存在一些局限性。刘彦认为,“完善网络信息的大数据监管机制,建立网络谣言大数据库,并结合人工智能技术在更广阔的范围内实施网络舆情分析研判、网络舆情监测预警、网络舆情控制应对、网络舆情辨识评估”[15]米源提出采用半监督学习的图卷积神经网络,可有效利用无标注数据,“通过在有标注节点上训练模型,更新所有节点共享的权重矩阵,将有标注的节点信息传播给无标注节点,同时解决监督学习模型泛化能力不强和无监督学习模型不稳定的问题”。[16]
目前,有些技术已经成功地运用到各种互联网和新媒体产品中,通过这些技术,机器能够精确知晓用户需求,并提供个性化推送与服务。同样,也可以对那些扰乱公共秩序的网络语言进行识别、过滤。然而,上述技术大多依据是机器学习——标记数据和有监督学习,即必须有人的干预,通过人对样本进行标注,机器才能学会识别某一对象。对于小批量数据而言,这种方法是可行有效的,一旦数据增多,需要的人工支持和干预相应增加,其准确性也会受到一定程度影响。因此,我们提出基于深度学习的网络语言规范智能管理模式。
三、基于深度学习的网络语言规范智能管理模式
深度学习是机器学习领域中一个新的研究方向,更接近于人工智能的目标,“是学习样本数据的内在规律和表示层次,它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据”。[17]与传统机器学习算法依靠人工标记辅助相比,深度学习算法不仅能够处理海量数据,可以做到传统人工智能算法无法做到的事情,输出结果会随着数据处理量的增大而更加准确。而且其本身还能生成一些新的数据,使机器自己学会一些概念,具备一定的人类学习和思考能力,故而可以取代人类一部分工作。
随着互联网的深入发展,特别是移动互联网、物联网、元宇宙等的产生和发展,网络语言的使用会更加频繁,产生的数据更为庞大。据IDC发布的《数据时代2025》预测,2025年,全世界每个联网的人每天平均有4909次数据互动,是2015年的8倍多,相当于每18秒产生1次数据互动,全球每年产生的数据将从2018年的33ZB[18]增长到175ZB,相当于每天产生491EB的数据,目前美国的平均网速为25Mb/秒,一个人要下载完这175ZB的数据,需要18亿年。[19]面对灿若繁星的巨量数据,传统机器学习算法已经落后于互联网的发展速度和规模,完全不能满足信息传播、把关的需求,严重威胁到了网络安全建设,“会对语言安全、文化安全、意识形态安全带来负面影响,需要高度警惕”。[20]网络语言规范不仅是语言生态文明的治理范式,也是国家发展战略的文化需求。将深度学习算法用于网络语言治理,不仅可以提升网络语言检测的准确性,维护网络社会与现实社会的稳定,而且还可以将人类从繁重的工作中解放出来,从事更多具有创造性的活动。
对此,我们把人工智能和把关人理论结合起来,尝试应用人工智能技术建立网络语言规范智能管理模式,以供网络语言规范的社会治理使用。
(一)建立生态语言学视域下的网络语言语料库
“网络语言是语言生态环境下语言多样性的体现。”[21]网络语言因应网络而产生而发展,“自由创造、使用和传播,但使用中约定俗成”是其典型特征。“网络语言不再作为单一的网络术语而存在,它以实时或相对延时的形式,以文字、数字、字母和符号为主要载体,存在于具有共享性与开放性的网络聊天室、网络社区、博客中,是网络语言中最为活跃和网民们约定俗成的表达方式。”[22]针对网络文字语言中变异字、变形字等不规范的网络语言,应根据国家汉语语言规范标准,建立大规模网络语言语料库,这是进行网络语言规范智能管理的前提条件。2014年,我国第一部全面贯彻《通用规范汉字表》的语文词典《现代汉语规范词典》再版,其中收录了诸多网络流行词,如“吐槽”“失联”“正能量”等,而一些不符合语法规范生造的缩略形式的网络热词没有被收录,仅少数网络语言能够进入主流媒体和主流文化。多样性的网络语言的规范需要制订明确的标准体系,因此,我们应该参照国家汉语语言规范标准,通过建立网络语言语料库,收集当下流行的网络语言语料,并在此基础上建立和完善网络语言规范体系。
大规模语料库的平台建构可从生态语言学视域中的多层次研究路径入手,对其进行宏观的系统性分析研究。“对积极的、有利于网络语言生态环境形成的语篇进行定性或定量分析,分析其概念意义、人际意义和语篇意义的具体特征,系统凝练出有利于网络语言生态文明建构的语篇特点。”[23]在生态语言学的视角下,从具体的词汇、语法、章句的微观,到语境的语篇意义、概念意义、人际意义等的中观,再到社会、文化等宏观的网络语言生态环境进行多层次的深入研究,为网络语言规范制定全面而具体的标准体系提供参考。
(二)多模态的网络语言语义语境的自动匹配
网络语言是极其复杂多变的,要用人工智能进行治理,必须让机器不断学习。网络语言不只是变异字、生僻字等语言符号的呈现,标点符号、数字谐音、表情符号、视频、图像等多模态的表现形式体现了网络语言多样性的特征。对于这些网络语言,通过深度神经网络可以构建一个学习网络语言的模型。通过这个模型,可以对网络语言的文本、图像等信息进行学习和分析。基于深度神经网络的模型,可以对多种信息来源或形式(即模态)进行横向和纵向分析,对自动学习和深入学习有很大帮助。通过建立起的网络语言学习模型,机器可以判断哪些网络语言可以传播,哪些网络语言属于消极、负面的,并且不予通过和传播。
基于大规模网络语言语料库的标准,对于失范用语、非规范的网络语言可以进行分类与识别。基于深度神经网络的模型可以自动学习网络语言的深层表示,对文本、图像等多模态信息特征提取,进行多模态融合模块建构,包括模态间信息交互模块、模态内信息增强模块的信息传播。使用深度学习模型对于文本、视觉、声音等多元异构数据的深层特征的数据体,进行自动学习与深入学习具有极大的优势。网络语言使用需要语义语境的界定,满足网络空间交际场景的不同需求,加强全民语言对网络语言的引导示范作用。如“逼格”“V5”“YYDS”等,在特定行业领域作为一种具有正向意义的网络语言在使用,但在其他场景是不规范用语。人们进行信息检索、使用语言及语义理解天然具有偏好的特征,因此,可以利用语义语境进行自动匹配。针对文本相似性度量进行匹配的任务,“主要通过生成基于WordNet的知识学习生成任务引入语言学知识,并与外部任务进行联合训练。”[24]提高文本匹配性能。此外,利用语言偏好信息进行双边匹配任务,“语言偏好信息下稳定匹配的定义和稳定匹配约束条件,通过将双边主体的语言偏好信息转化为匹配满意度,在考虑稳定匹配约束条件的基础上,以最大化每方主体的满意度为目标,建立双边匹配模型”。[25]通过网络语言语义与其所处的现实语境进行匹配,为最后的内容识别提供依据。
(三)网络语言中不规范内容的识别与检测
随着社交媒体的飞速发展,人际传播、大众传播、网络传播等融合传播是势不可挡的传播现状。在网络语言中存在大量语言暴力、低俗语言以及各种随意拼贴的不通用的语言等不规范语言内容,特别是在社交平台的评论中,针对某一事件或某一人物,出现长期或短时的大规模暴力、低俗语言现象,甚至会延至线下,对社会造成不良影响,影响公共事件进程。另外,如有关政治术语和敏感词的网络语言,基于意识形态和文化安全的考量,都是属于规范治理的内容。因此,社交媒体的网络语言规范化管理同样需要重视,并加以监督过滤与引导。因为社交评论数量的大数据特征,构建初始数据集,采用Python程序进行数据清洗,应用深度学习分类模型建立网络语言分类样本集,经过清洗标注后得到网络非规范用语小样本数据集,选择不同的分类算法选取最优模型,进行内容识别与检测,以可视化形式呈现。在选择分类模型时可以比较选择,如长短期记忆网络(Long Short-term Memory,LSTM)是“深度学习中针对股票、文本这样的序列数据提出的模型,很适合用来解决文本分类问题”。[26]传统二分类法是初级分类,进一步使用细粒度情感分析对网络暴力、低俗用语中的每一层级再做细致分类,探析成因、影响因素、事件节点等多维度的影响要素及结果,从而更有针对性地进行评论语言网络空间净化,引导网络语言正向传播和健康发展。
综上所述,我们可以建立起网络语言规范智能把关模式,基本原理和流程如下图。
四、基于深度学习的智能把关理论
我们认为,智能把关理论是基于智能把关活动提出的,智能把关是建立在对网络大数据进行的识别、分析、学习的基础上进行的把关活动,它在一定程度上改变、代替、补充了传统把关方式。智能把关理论是研究者在新技术、新形势下,对传统把关理论的扩展、补充,具有把关主体隐蔽多样、把关标准动态变化、把关算法不断优化等三个方面的特点。
(一)把关主体隐蔽多样
传统把关理论认为,把关人是多种多样的,“守门行为出现在媒介组织内部”,[27]包括新闻采集和新闻加工两个部分,他们决定了在大众传播中哪些信息可以传播,以及如何传播。传统机器学习算法的信息把关人是由人工和机器一起组成,基于深度学习算法的智能把关方式同样是由机器和人共同组成,不同于传统机器学习算法的是,这里的人工往往是能够编写、控制算法的人、媒介组织、行政机构,“凸显了平台和媒体机构的价值观念。不同的媒体平台对不同算法规则的设计和使用体现了该平台对信息的选择标准”,[28]且一般情况下用户感受不到人工的存在,只有在传播出现异常的情况下,比如违反国家法律、道德,包含敏感词、网络谣言等,而导致的传播中断,用户才能感受到他们的干预。因此,智能把关理论与模式下,对媒介组织、行政机构人员的信息化素养提出了更高的要求。
科技赋能助力网络空间治理,而网络语言治理是一项长期复杂的社会系统工程。且当前研究主要集中在文字语言,相比而言,音视频、图片、符号语言等网络语言治理难度较大。在当今网络社会中,大众传播、组织传播、群体传播、人际传播等融合传播,愈发模糊传播边界。因此,本研究并未严格区分传播类型,尤其是因应社交媒体所产生的社会影响,将大众传播、群体传播、人际传播等产生的网络语言规范治理把关模式作为本研究重点,利用深度学习技术方法与应用建构内容分类、内容识别、语义语境自动匹配等模式。在进一步的研究中,可以将包括政府、社区、社会组织、网络媒体、个人等主体作为具体的研究对象进行细化分析,进行多层次的治理模式探析,建立健全科学化、规范化、标准化的评估机制和指标体系。
(二)把关标准动态变化
随着把关主体产生变化,把关标准也产生了相应的改变,变得更为客观。首先,信息的选择标准更为客观。在传统媒介组织把关下,信息能否进入传播渠道不仅主要取决于对信息价值的判断,与新闻编辑、媒介组织等个人或组织的喜好和情绪也有一定的关系,不管是信息价值还是喜好和情绪,都是个人或组织的主观表现。也就是说,信息传播不完全由其质量决定,也与把关人的水平、好恶、情感有关,把关活动成了主观的、感性的、情感的、非理性的活动,与信息本身的关联度不大,也会衍生受贿、腐败、官僚主义作风等不良行为,这些都不利于信息的流通,阻碍了传播活动的正常进行。基于深度学习算法的智能把关能够规避这一问题,机器没有情感,远离了喧嚣的生活和人情世故,不会因为长期工作而烦恼厌倦。把关标准一旦形成,只要人们设计的算法没有问题,没有出现不公正或偏袒的设计,机器的判断就是完全客观的,值得信赖。
其次,信息的识别标准更为客观。传统模式下,与信息的筛选一样,信息的编辑、修改、排版等同样也取决于个人或组织的喜好,虽然媒介组织内部有一整套把关标准,但往往“结果不是难以把握,就是有所疏漏”。[29]智能把关可以解决这一问题,基于深度学习算法的把关标准一旦形成,把关问题就交给机器去完成,可以提高把关效率,提升把关精准度。媒介组织以及相关机构只需在出现某些极为异常情况时,对算法进行适当调整即可。
第三,把关标准是动态的。传统把关标准一旦形成,在一定时间内很难改变,如上所述,智能把关标准是客观的,但是,现实生活往往是不断变化的,因此,把关标准应当具备动态性,应随着现实的变化而迅速做出相应对策。机器学习、深度学习等技术与应用在不断更新变化,能够解决问题的应用方法也愈发多样,能够及时跟踪、评价、反馈和及时调整规范治理体系。故而,能否发现问题成为智能把关的关键。深度学习能够高效地学习异构数据特征之间的交叉信息,如Deep FM的模型架构,可用于点击率(Click-Through Rate,CTR)预测。因此,在进一步的研究中,通过深度学习模型应用于网络新词、热词的排行榜、使用率的预测,可作为网络语言规范推荐与引导的利器。此外,随着智媒场景时代的到来,万物皆媒、人机共生、自我进化的特征催生媒体变革,要处理好技术的科学逻辑与人文伦理的关系,更要确立主流价值观引领智能传播的观念,建设多种治理引导传播机制,推动网络社会健康有序新发展。
(三)把关算法不断优化
网络语言治理中的人工智能应用,不仅限于智能把关,也可以用于算法推荐,“算法的运用将用户的需求体现在算法程序的设计上,促使用户成为无形的把关人,用户需求以及对应的个性化信息成为信息选择的主要标准之一”。[30]我们可以把网络语言规范纳入算法推荐权重中,符合规范的大力推荐,反之不推荐或禁止。最近,国家网信办发布了《互联网信息服务算法推荐管理规定》,规范互联网信息服务算法推荐活动,是维护国家安全和社会公共利益,促进网络语言规范健康发展的重要举措。把关和推荐一抑一扬,构建了更加全面和完善的网络语言治理体系。
智能把关模式与理论扩展了传统把关活动和理论的内涵,改变了把关活动的行为模式,不仅提升了把关的客观性、准确性,做到与时俱进,还为用户创造了便捷的接收信息方式,有助于净化网络空间,打造和谐、绿色、可持续发展的网络环境。但是,当今互联网平台算法大行其道,不少网民已习惯从 APP 中接收推送、获取信息,在商业逻辑和算法的加持下,各类 APP 的信息供给“投其所好”单一同质,使受众困于“信息茧房”而不自知。“具有舆论属性或者社会动员能力的算法对社会秩序有较大的影响力,但是,不能将算法看成是一个纯技术手段,其所属平台必须履行社会责任,接受公众监督,以社会效益优先,平衡好社会效益和经济效益的关系。对算法推荐服务提供者而言,接受互联网信息服务算法监管,是民众呼声也是行业发展的需要”。[31]另外,算法逻辑下的人力缺失,也带来了一些负面效应,出现“反转新闻层出不穷,极大地扰乱了公众认知,在舆论引导上走向偏差”[32]“用户阅读浅薄化和低俗化”[33]“主导意识形态面临着凝聚力弱化、权威失落、引导乏力和认同窄化的风险”[34]等问题。因此,网络与新媒体平台不能只看重经济利益,应将社会效益与平台发展相结合,增强社会责任感,树立正确的价值导向,赋予技术以正确的价值理念,从技术层面来解决因技术发展而产生的一系列负面效应和问题。
结语
“作为一种历史必然性出现,人们呼吁语言满足社会对它的要求,它反映了社会状况,并为社会的进步做出了积极贡献,这是语言与社会之间的辩证关系”。[35]网络语言是独特的网络文化,随着互联网的飞速发展与社会影响,其仍在不断创新变化中,成为中国文化软实力不可分割和难以忽略的一部分,“强国必强语”。文化软实力集中体现了一个国家基于文化而具有的凝聚力和生命力,以及产生的吸引力和影响力。伴随网络语言的发展对语言文化的影响,语言与文化的影响相辅相成,尤其是外来语及不同文化的语言词汇,也加入本土语言传播中对传统文化带来冲击,“食洋不化”、肆意扭曲,语言文化规范问题事关重大。当前“网络空间与现实空间深度融合,网络问题向政治、经济、社会、文化等领域传导渗透,成为影响各国主权、安全和发展及国际关系调整的重要变量”。[36]在新网络安全理念下,网络语言问题已是社会问题。作为“精神家园的互联网”所产生的传播力与影响性,尤其是网络失范用语对青少年容易造成不知本义、张冠李戴、错误认知的负面影响,这是亟待解决的文化危机。因此,我们要持续推进“中国语言”的文化力量,夯实国家文化软实力的根基。“创新是媒体融合发展的强大动力,规范则是网络语言承载健康内容有效传播的根本保障”。[37]在人工智能赋能网络语言治理的同时,还须提高全民网络语言素养,通过政府积极的教育引导,促进公民网络用语规范意识的提升,推动网络语言规范治理体系构建。
本文为国家社科基金项目“西部县级融媒体中心社区传播力研究(19XXW003)阶段性成果。
注 释:
[1]陈丽湘:政策网络视阈下的媒体语言治理初探[J].中国广播电视学刊,2021(06):42.
[2]金君俐:网络语言暴力的成因和对策初探[J].新闻实践,2009(04):64.
[3]阮立,朱利安·华勒斯,沈国芳:现代把关人理论的模式化——个体、算法和平台在数字新闻传播领域的崛起[J].当代传播,2018(02):91.
[4]罗昕,肖恬:范式转型:算法时代把关理论的结构性考察[J].新闻界,2019(03):10.
[5] [英]戴维·克里斯特尔:语言与因特网[M].郭贵春、刘全明 译,上海:上海科技教育出版社,2006:31.
[6]邵培仁:传播学[M].北京:高等教育出版社,2012:183.
[7]刘耕,方勇,刘嘉勇:基于关联词和扩展规则的敏感词库设计[J].四川大学学报(自然科学版),2009(05):667.
[8] 薛朋强,努尔布力,吾守尔·斯拉木:基于网络文本信息的敏感信息过滤算法[J].计算机工程与设计,2016(09):2247.
[9] 付聪,余敦辉,张灵莉:面向中文敏感词变形体的识别方法研究[J].计算机应用研究,2019(04):988.
[10] 周昊,沈庆宏:基于改进音形码的中文敏感词检测算法[J].南京大学学报(自然科学版),2020(03):270.
[11] 王冲,张虎,王鑫,刘全明:融合敏感词规则和字符级RCNN模型的用户意图识别[J].2020(03):160.
[12] 吴珊,李英祥,徐鸿雁,张仕霞,施宜军:基于改进的Trie树和DFA的敏感词过滤算法[J].计算机应用研究,2021(06):1678.
[13] 郭全中:互联网时代的网络谣言治理研究[J].新闻爱好者,2018(06):31.
[14] 任哲,李永凤:人工智能参与网络谣言治理的未来图景[J].青年记者,2018(02下):79.
[15] 刘彦,王晶:公共卫生事件的网络谣言监管困境与治理策略[J].学术前沿,2020(11下):160.
[16] 米源:基于图卷积网络的谣言鉴别研究[J].计算机工程与应用,2021,57(13):161.
[17] 陈先昌:基于卷积神经网络的深度学习算法与应用研究[D].硕士学位论文,浙江工商大学,2013年:I.
[18]1PB=1024TB,1EB=1024PB,1ZB=1024EB,1YB=1024ZB.
[19]不可思议的数字:互联网每天到底能产生多少数据?
[20]成丕德:净化网络语言[J].新闻战线,2018(12):3.
[21]梁海英:从生态语言学视角研究网络语言[N].中国社会科学报,2019-12-10(009).
[22]高莹:语言文化学视角的俄语网络流行语发展与规范[J].现代交际,2021(03):94.
[23]梁海英.从生态语言学视角研究网络语言[N].中国社会科学报,2019年12月10日第009版.
[24]周烨恒,石嘉晗,徐睿峰:结合预训练模型和语言知识库的文本匹配方法[J].中文信息学报,2020(02):63.
[25]张迪,孙涛,陈晔,万良琪:基于语言偏好信息的稳定双边匹配决策方法[J].运筹与管理,2019(02):60.
[26]洪巍,李敏:文本情感分析方法研究综述[J].计算机工程与科学,2019(04):750.
[27] 邵培仁:传播学(修订版)[M].北京:高等教育出版社,2012:129.
[28] 段俏:浅析算法技术对新闻业的解构与反思[J].出版广角,2018(09下):69.
[29] 邵培仁:传播学(修订版)[M].北京:高等教育出版社,2012:131.
[30] 段俏:浅析算法技术对新闻业的解构与反思[J].出版广角,2018(09下):69.
[31] 谭天.加大力量破解“信息茧房”[J].中国新闻出版广电报,2021-08-31(5).
[32]彭东:算法逻辑下传统媒体把关机制的坚守与变革[J].青年记者,2018(10下):52.
[33] 郑钦方:算法推送时代把关人角色的转变及应对[J].青年记者,2018(09下):31.
[34] 张林:智能算法推荐的意识形态风险及其治理[J].探索,2021(01):176.
[35] 高莹.语言文化学视角的俄语网络流行语发展与规范[J].现代交际,2021(03):95.
[36] 全国干部培训教材编写指导委员会组织编写.全面推进中国特色大国外交[M].北京:人民出版社,党建读物出版社,2019:193.
[37] 任静,其其格,张洪霞,刘东.新媒体时代网络语言的吸纳与规范[J].中国广播,2016(05):51.
(谭天,广州华商学院特聘教授、未来媒体研究院院长、暨南大学教授;邵泽宇,广州华商学院讲师;司峥鸣,哈尔滨工业大学副教授)
谭天:暨南大学新闻与传播学院教授、新媒体研究所所长,中国社科院新媒体研究中心特聘研究员、央视CTR媒体融合研究院专家、广州华商学院特聘教授、未来媒体研究院院长。