ChatGPT在中文古文翻译中的实际表现如何
在人工智能技术快速迭代的当下,大型语言模型对古文典籍的翻译能力引发学界广泛关注。以ChatGPT为代表的生成式AI,既能流畅处理现代语言,又需面对文言文特有的语法结构与文化意蕴的双重挑战。近期多项研究通过对比实验揭示,这类模型在古文断句、语义转换等基础任务中已展现实用价值,但在处理哲学隐喻及文化专有项时仍显乏力,折射出机器翻译在古典文本处理中的机遇与边界。
断句与标点准确性
《大唐开元礼》未点校本的测试案例显示,ChatGPT在古文断句任务中呈现出规律性偏差。当处理“诸卫各勒所部列黄麾仗屯门及陈于殿庭”这类复杂句式时,模型倾向于将军事部署动作误判为连续动作,而社科专家吴丽娱的标注则准确区分了屯兵与布阵两个独立环节。这种差异源于模型对古代职官制度认知的局限性,其训练语料中缺乏足够的典章制度平行文本。
在祀礼流程描述场景下,ChatGPT对量词与祭器的对应关系处理存在系统性错误。例如将“太尊实以泛齐”误解为容器与液体的简单对应,而忽略《周礼》中“六尊”礼器的等级制度。腾讯AI Lab的研究指出,模型在低资源语言任务中,对专业术语的联想依赖通用语料库的统计规律,导致历史语境还原度不足。
语义转换与信息重构
将未标点古文转化为现代汉语时,ChatGPT展现出较强的上下文推理能力。面对《大唐开元礼》中长达百余字的仪轨描述,模型能准确识别“通事舍人引就次”中的“次”指代休息场所,并补充“本司入奏”的主体为礼部官员。这种信息补全能力得益于transformer架构对长距离语义关系的捕捉,但过度依赖概率预测也可能导致臆测性补充,如将“鈒戟近仗”误译为常规兵器而非仪仗用具。
在文本概括任务中,模型对《开元礼》郊祀流程的提炼存在选择性偏差。研究显示,ChatGPT更关注可见的仪式动作(如“协律郎入就举麾位”),而对礼制象征(如“山罍为下实以三酒”中的等级隐喻)理解浅表化。这种特征与耿芳等学者提出的“语域调整优先性”理论相符,模型倾向于保留表层叙事逻辑,弱化文化符号的深层意指。
文化意象传递效能
哲学典籍翻译构成特殊挑战。《道德经》英译测试中,ChatGPT-4能将“道可道非常道”转译为“The Tao that can be spoken is not the eternal Tao”,但在处理“玄之又玄”时却直译为“mysterious and more mysterious”,丧失原文本体论层面的递进关系。山东大学典籍翻译研究中心发现,模型对道家“无状之状”等悖论修辞的转化,常陷入字面对应与哲学阐释的两难。
文化专有项的处理暴露出知识图谱的缺口。当翻译“騶虞”“黄琮”等礼器时,ChatGPT多采用音译策略,而专家译本则会补充“白虎瑞兽”“六瑞玉器”等文化注释。哥伦比亚大学汉学系研究指出,这种差异导致译本在跨文化传播中丧失关键语境信息,使目标读者难以构建完整认知框架。
技术局限与改进路径
训练数据偏差是核心制约因素。OpenAI披露的语料构成显示,中文古籍在总训练数据中占比不足0.3%,且集中于《四书》等常见典籍。这导致模型对出土文献、敦煌写本等特殊语料的处理能力薄弱,如面对秦汉简牍中的通假字时误译率高达47%。微软亚洲研究院建议,引入对抗训练机制,通过构造古文今译的对比学习任务,可增强模型对古今语义映射的敏感性。
回译测试揭示出系统性误差累积问题。将ChatGPT生成的英译本再次转译回古文时,会出现语义偏移现象。例如“守宫设太常卿”被重构为“宫监置太常官”,虽符合基本职官逻辑,却混淆了唐代“守宫署”与汉代“太常卿”的时空差异。这种时空错位提示,需要建立历朝职官制度的时空知识约束模块。