《基于自然语言处理的翻译策略识别研究》旨在从翻译技巧的角度出发,为这一问题提供多维度的思考与解答。《基于自然语言处理的翻译策略识别研究》的主要内容是中央高校基本科研业务费专项资金项目(2024MS094)的研究成果。
翻译技巧,作为翻译学和语言学研究领域的核心议题,历来备受学界重视。面对难以直译的词汇或短语,译者常常运用诸如语义对等、宽泛化、具体化处理以及调整句子结构等多种翻译技巧,以期达到更加精准和自然的翻译效果。尽管如此,在自然语言处理领域,翻译技巧研究却相对匮乏。基于这一背景,《基于自然语言处理的翻译策略识别研究》提出了两个核心研究问题:我们是否能够自动识别翻译技巧?而这种识别能力又能否推动自然语言处理领域其他任务的发展?
为了深入回答这些问题,我们首先对翻译学界的丰富成果进行了系统的梳理与总结。从Vinay和Darbelnet的经典翻译理论,到Newmark的翻译层次理论,再到Chuquet和Paillard的翻译策略,以及Molina和Hurtado Albir的翻译技巧分类,我们汲取了前人的研究成果,为《基于自然语言处理的翻译策略识别研究》的研究打下了坚实的理论基础。
在此基础上,我们选取了TED Talks英法平行语料进行短语级别的翻译技巧标注,并制定了详尽的标注指南。为了验证研究假设,我们构建了一个短语级别的翻译技巧数据集,并采用四种不同的自动分类方法进行实验:传统的机器学习分类器、基于深度学习的CNN和MLP、结合上下文语义特征的ELMo和Context2Vec以及微调预训练跨语言模型XLM。实验结果表明,自动识别翻译技巧