大语言模型建构中国古典诗歌传播新范式

known 发布于 2025-09-09 阅读(344)

摘要:中国古典诗歌颇具文化特色,其富有文化负载词和情感内涵,因此极具翻译难度。近年来,大语言模型高速发展,其能否凭借情感计算能力准确地翻译文学文本,并借此推动中国古典诗歌甚至中华文化的传播,已成为当今研究的热点课题。现以大语言模型为基础,选取代表性诗歌《关雎》和《如梦令》进行分析,将不同语言模型之间的译文进行比较,总结语言模型普遍的语言能力和思维模式。不同的大语言模型在处理中国古典诗歌时各具特色,目前来看,想要完全通过大语言模型实现中国古典诗歌的高效传播仍任重而道远。

世界文化交流本该是双向的输入与输出,但过去的中外文化交流并不十分对称。统计数据表明,从1900年到2000年的100年间,中国翻译的西方文、史、哲、政、经、数、理、化等书籍近10万种,而西方翻译中国的书籍种类尚且不到500种。

如今新兴技术日新月异,以ChatGPT为代表的智能工具拉开了人机交互新时代的序幕,深刻影响着跨文化和跨语际的交流沟通、知识和文化的交融方式与速度。

本研究将以大语言模型为基础,以中国古典诗歌的英译作为主要线索,选取代表性诗歌《关雎》和《如梦令》进行分析,将不同语言模型之间的译文进行比较,总结语言模型普遍的语言能力和思维模式,判断语言模型推动中国古典诗歌传播的可行性,并以此为基础提出今后的发展建议。

对《关雎》的翻译与分析

《关雎》是中国古代第一部诗歌总集《诗经》中的第一首诗,是脍炙人口的传世名篇,具有极高的文学价值。以下将选取《关雎》中的经典片段进行分析。

文心一言译文版本分析

The ospreys call out,on the river island they rest.

关关雎鸠,在河之洲。

A modest and virtuous lady,a gentlemans perfect match.

窈窕淑女,君子好逑。

The marsh plants grow in profusion,floating left and right.

参差荇菜,左右流之。

A modest and virtuous lady,in dreams and waking I seek her.

窈窕淑女,寤寐求之。

Unable to find her,in waking and dreams I yearn.

求之不得,寤寐思服。

Ah,how I long!Tossing and turning all night.

悠哉悠哉,辗转反侧。

The marsh plants grow in profusion,I gather them left and right.

参差荇菜,左右采之。

A modest and virtuous lady,Id make music with her on lute and harp.

窈窕淑女,琴瑟友之。

The marsh plants grow in profusion,I pluck them left and right.

参差荇菜,左右芼之。

A modest and virtuous lady,Id delight her with drums and bells.

窈窕淑女,钟鼓乐之。

首先,从总体来说,文心一言对《关雎》的翻译忠于原文,大致遵从简洁中正的风格,在一定程度上保留了原文的意境,体现了原文想表达的男女之间纯真无邪的情感。同时,从译文中也能看出,文心一言在尽力传达原诗的情感和柔美的节奏。从这一点至少能得出,语言模型在对诗歌这种特殊文体进行翻译时,会有意识地对诗歌的情感和格式进行理解与处理,尽管许多地方处理得还不是非常到位。

其次,从细节方面来说,“关关”为雎鸠的叫声,而文心一言将其直接处理为“call out”会在一定程度上失去原文的意境,这里其实像理雅各和亚瑟·韦利一样直接音译为“guan guan”较为妥当。另外,文心一言将“雎鸠”一词翻译成为了“osprey”,这里的处理与理雅各对该词的处理如出一辙。然而,“osprey”原义指的是一种鱼鹰,是一种食鱼的巨鸟,放在这里显然不是很妥当。相比之下,许渊冲将“雎鸠”译为“turtledoves”是一种很恰当的处理,因为“turtledoves”一词除了有“斑鸠”的意思之外,还可以表示“情人”,十分符合《关雎》一诗的主旨。文心一言对“淑女”“君子”这类意象的处理相对妥当,大致上可以表达出原文的意境。“好逑”一词意为“好的配偶”,翻译为“perfect match”也较为合理。“参差荇菜”一句中的“参差”仅用以形容荇菜生长得不整齐,而文心一言的译文中使用的“grow in profusion”则是着重表达荇菜生长得茂盛,并没有直接体现“参差”,算是对文章的过度理解,从而导致在翻译中缺失了原文意义。而“荇菜”本身作为一种水生草本植物,多生长在池沼之中,这里译为“marsh plants”虽易于理解,但略偏笼统。在众多译文版本里,笔者认为亚瑟·韦利将此处处理为“floating-heart”最为贴切,其既准确地表达了水生的浮游植物这一本义,又自带双关,极具画面感,表达了男女之情。中间一段着重表达了君子对淑女求而不得、难以入眠的场景。其中,译文用“in dreams and waking”和“tossing and turning”分别表达“寤寐”和“辗转”,贴切地形容了这一情景。最后一句,译文采用异化策略将“琴瑟”一词用类似的西方乐器“lute and harp”来表达其实无可厚非,只是在原文中,“琴瑟”同时还表示亲密的关系,如果这样处理,会导致原文意义缺失,并且此句整体的处理也没有完全体现“友之”所想表达的具体情感。

最后,关于句式与韵律方面,考虑到中英文诗歌翻译在韵律方面的巨大差异。该语言模型对《关雎》韵律的处理算是尽力而为,从“rest”“right”“night”等词能够体会到原文的韵律美,也不难看出译文通过句子的重音和语调变化来保证诗歌的节奏感,这也确实是在有意识地遵从原文的句式。但是,其仍然无法完全复制原文的韵律特点,对于不熟悉中文诗歌韵律的英文读者来说,这样的翻译相对而言是易于欣赏和理解的,然而,对于期望更深入地体验原文韵律美的读者来说,该翻译很难满足他们的全部期待。

GPT译文版本分析

相较之下,以下GPT-4对《关雎》的翻译有许多异同之处。

Ospreys cry above the waters isle.

In pairs they frolic,a love to reconcile.

A maiden fair,embodying virtues grace.

A match for the gentleman,in heart and face.

Lush reeds and rushes grow on every side.

For this modest maiden,my longing cannot hide.

In dreams I seek her,yet awake to find her not.

In restless yearning,my heart becomes distraught.

Oh,my aching thoughts,through the night they race.

Turning,tossing,yearning for her embrace.

Lush reeds and rushes,harvested Id bring.

To play with my maiden,the lute and zither strings.

Lush reeds and rushes,plucked with tender care.

With drums and with bells,her joy wed share.

In music,in love,two hearts so entwined.

Like the ospreyscall,our spirits aligned.

GPT同样将“雎鸠”这一意象译为了“osprey”,但其将“关关”这一雎鸠的叫声处理为“cry”有些过分解读原文意义。“a maiden fair, embodying virtues grace”比文心一言更加准确地表达了“窈窕淑女”的形象。“a match for the gentleman,in heart and face”在语法结构表达上略显不自然,容易给读者带来阅读上的困扰,不过也可以看出GPT在处理此类诗歌翻译时在有意识地遵循原文的节奏,只是处理得不是很妥当,有些得不偿失。

在后文中,GPT将“参差荇菜”处理为了“lush reeds”,意为“茂盛的芦苇”。可以看出,GPT与文心一言一样,将“参差”一词理解为“长得茂盛”,而将“荇菜”处理成了“芦苇”。如果说文心一言仅仅是用词没那么完美的话,GPT则是对于此意象进行了错误理解。

但也不是说文心一言的翻译质量一定比GPT更高,不难看出,GPT在句尾的押韵上下足了功夫。例如,从“isle和reconcile”“grace和face”“side和hide”等可以看出,GPT在译文韵律美的处理上要比文心一言更加优秀。

两大语言模型的差异分析

比较、总结文心一言与GPT之间的翻译可以看出,二者都能够理解原文的整体内容和思想表达,并通过自己的处理方式将其翻译出来。文心一言在具体内容,如意象方面,处理相对贴合原文,译文较为朴素、忠实且具体;而GPT尽管对原文意象的理解较为偏颇,但在韵律和节奏等文章整体处理上具有独到之处,译文整体上具有华丽的韵律美。

单从《关雎》的诸多细节处理中可以得出,语言模型的译文版本基本可以译出原文的意思,但都只能达到最基础的效果。换句话说,语言模型只能勉强“达意”,却无法“传神”,它们的译文版本仍与译者的标准译本有着较大的差距。《诗经》在海外传播的译文版本众多,而语言模型的译本在质量上无法优于甚至持平先前的标准译本。所以,通过语言模型传播《诗经》文化的想法仍无法立即实现,语言模型仍需持续学习。

对《如梦令》的翻译与分析

李清照的作品《如梦令》抒发了对春光短暂、年华流逝的无奈。其篇幅虽短,但内容与结构却十分新巧,以景衬情,意味深长。此处选取该词进行对比分析。

原文:昨夜雨疏风骤,浓睡不消残酒。试问卷帘人,却道海棠依旧。知否,知否?应是绿肥红瘦。

GPT译文版本:Last night,a brisk wind following a fine rain,deep sleep did not dispel the lingering wine.I ask the lady rolling up the screen,yet she replies the crabapple remains the same.Do you know,do you know?It ought to be the time when green grows lush and red fades thin.

文心一言译文版本:Last night,the rain was light and the wind was strong,Deep sleep did not dispel the lingering effects of wine.I ask the one who rolls up the curtain,but she says the crabapple blossoms are still the same.Do you know,do you know?The green leaves should be lush,the red flowers thin and few.

总体来看,两个版本的译文都在竭力忠于原文,在大意和句式结构上都力求与原文对应。在此基础上,二者在对某些细节的处理上又带有自己的理解。

“雨疏风骤”,语言模型将其分别处理为“a brisk wind following a fine rain”和“the rain was light and the wind was strong”。从结果上看,二者似乎都准确传达了原文意思,而相较之下,可能很多人会觉得文心一言的版本处理得质朴无华,不如GPT版本。但细细推敲便会发现,GPT版本的处理并不妥当。从常识的角度来说,每逢下雨天一般都是先刮风再下雨,而GPT此处的处理违背了常识,处理为了“风跟随着雨”。其实这般处理可以理解,形成错误的根本原因不在于其对常识的缺乏,而是其过度拘泥于句式表面,根据“雨疏风骤”呈现的顺序刻板地认为是雨在前风在后。所以在细品之后,反而是文心一言此处的处理稳妥无误。

而说到拘泥于内容表面,还有一处值得一提。“不消残酒”按照正常的理解应是“还没醒酒”或是“酒意未消”。所以,此处的“酒”理应像文心一言一样处理为“the lingering effects of wine”,或是像茅于美译文版本中处理为“the taste of wine”也可以。但是,像GPT仅仅是处理为“the lingering wine”,很容易让读者产生误解。从贴近原诗含义的角度来讲,GPT的处理要比文心一言稍逊一筹。

而在“卷帘人”一处中,先前许多的译者版本有着不同的处理。茅于美将“卷帘人”一处处理为“asked my chambermaid as she rolled up my screen”,以时间状语从句的形式再现了“卷帘”一词的精妙,点破了黑夜至晨的时间变化;而在徐忠杰的版本中,此处则处理为“curtain-drawer”,十分简妙,更多地让读者想象当时的情景。值得一提的是,在GPT的译文版本中,此处处理为了“the lady rolling up the screen”,其中“lady”一词比较具有西方色彩,更易为海外读者所接受。虽没有明确表达,但“卷帘人”确实具有“仆人”的含义,用“lady”一词并不十分妥当。此处又体现了GPT对篇章内容深层含义理解的匮乏和考虑不周。

“却道海棠依旧”中的“却”一字,在此处虽具有一定的转折意味,但却是一种轻微的、温和细腻的转折。从语言模型的译文处理上来看,文心一言所用的“but”过于直接,放在此处有失意境。相较之下,GPT将其处理为具有轻微转折之意的“yet”更为妥当。考虑到此处转折意味之轻,甚至可以考虑不体现“却”一字,这一处理在先前译者的版本中也并不少见。

总的来说,单从这一首词的译文质量上来看,两个语言模型的译文版本各有千秋。GPT在对语言的运用和句式的处理上十分优秀,其不仅对句式对应和句尾押韵十分重视,也在语言的优化上花费了许多心思。只是,GPT过度拘泥于篇章的表面意思。理性上讲,GPT毕竟是西方发明的语言模型,其不仅具有根深蒂固的西方思维,也具有极强的西方语言色彩,这一点从“lady”一词中暴露无遗。所以,当GPT带着其固有的西方思维分析和处理中国文化典籍时,便会屡犯错误,这一点和中西方的语言差异有着很大的关系。

仅从本研究着重探讨的ChatGPT和文心一言来看,二者的译文版本各有优缺点。而这些优缺点是语言模型在处理中国典籍翻译时所固有的特点。例如,西方产出的智能产品GPT训练时的语料模型大多以西方材料为主,在翻译时自然而然地带有西方的文学与翻译思维,在英译时对句式与音韵的处理有着独到理解,对类似于中华文化负载词等带有鲜明民族特色的词句意义理解不足。而文心一言本质是对网络资源的网罗与汇总,一方面,国内的网络资源辅以中文为主的训练材料,使其对中国古籍的含义理解远胜于GPT;另一方面,也正如前文所提,文心一言适合长文本和情感文本的处理,所以,虽然其训练时间少、算力基础薄弱,但也能译出与GPT质量相当的译本。

客观地讲,尽管二者的译文都有出彩之处,但总体译文质量仍尚未达到中国古典诗歌传播的期望标准,有些部分并不如译者的处理版本。虽然人工智能的更新迭代十分迅速,甚至可谓是日新月异,但其对文学翻译的处理水平究竟提升了多少犹未可知,未来即将推出的GPT-5是否能够改善研究中发现的GPT-4处理不到位的问题还是个谜。仅就研究过程中的发现来看,若想在传播中国古典诗歌时兼顾规模与质量,单靠此类大语言模型是完全不够的。目前所推测的理想情况为,结合多种大语言模型的优缺点,综合各模型给出的译文版本,加以高水平译者的译后编辑,才有望实现高效率传播中国古典诗歌。

本文由中国民航大学研究生科研创新项目“ChatGPT等人工智能的大语言模型对推动中国古典文学作品翻译与传播的可行性研究”(项目编号:20233YJSKC10006)资助。

标签:  译文 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。

iidomino cuppor