![]()
作者简介 丁国旗,男,外国语言学及应用语言学博士,浙江农林大学暨阳学院副教授,主要从事认知语言学、语料库翻译学及数字人文等方面的研究。主持完成教育部和浙江省人文社会科学研究项目各一项,已出版学术专著一部,在《外国语》《中国翻译》《外语研究》《外语与外语教学》等期刊发表论文多篇。 目录 第一章 引言 第一节 研究背景 第二节 研究内容与意义 第三节 本书的结构 第二章 语义研究中的语料库方法 第一节 语言使用和语料库 第二节 语言形式的本质 一 语言的象似性 二 语法即意象 第三节 语言的意义、可译性及语料库的应用 一 意义的体验性 二 意义的主观性 三 意义即是概念化 四 语义的百科性 五 意义的可译性 六 意义的语料库分析案例 七 小结 第三章 语料库创建及研究方法 第一节 语料库的创建与加工 一 语料库结构和选材 二 对齐 三 分词与赋码 四 语料库基本信息 第二节 研究方法与工具 —— WordSmith & AntConc 二 Notepad 三 PowerGREP 四 TextPro 五 ReNamer 六 R 七 Python 八 Gephi 九 D3.js 十 Photoshop 第三节 小结 第四章 频率、关键词、搭配、语义韵 第一节 频率 一 原始频率 二 词语过滤 第二节 关键词 一 参照词表 二 借助参照语料库或词表的关键词分析 三 TF—IDF 第三节 搭配 一 quanteda 二 tidytext 第四节 语义倾向和语义韵 一 语义韵的定义及研究现状 二 更广意义上的语义韵 三 情感分析与数据驱动的语义韵研究 四 中英翻译及原创散文语义韵分析 第五节 小结 第五章 英译中散文词类对比 第一节 相关研究 第二节 理论前提 一 刻画 二 名词与动词 第三节 材料与方法 第四节 数据与分析 一 词类分布及差异 二 词类相关性分析 三 中译动词的回归分析 第五节 讨论 第六节 小结 第六章 语义研究:词语关联 第一节 tidytext 第二节 词语关联 一 英文散文 二 中译散文 三 中文散文 第三节 翻译对等词 第四节 小结 第七章 语义研究:词语嵌入 第一节 word2vec词语嵌人原理 第二节 t-SNE 一 英文散文 二 中译散文 三 中文散文 第三节 语义网络 一 英文散文 二 中译散文 三 中文散文 第四节 小结 第八章 语义研究:主题分析1 第一节 主题建模及其研究现状 一 主题 二 主题建模的定义与简单原理 三 研究现状 第二节 材料、工具与步骤 一 语料库 二 主题建模工具 三 分析步骤 第三节 结果与讨论 第四节 小结 第九章 语义研究:主题分析2 第一节 研究现状 第二节 材料、工具与步骤 一 语料库 二 中文分词 三 主题建模工具 四 分析步骤 第三节 结果与讨论 一 tidytext语义相关性分析 二 Gensim神经网络分析 三 dfrtopics主题模型分析 第四节 小结 第十章 结语 第一节 本书的发现 第二节 本书的不足和对未来研究的建议 附录 附录1 斯坦福大学的分词和赋码工具使用方法及代码 附录2 借助参照语料库或词表的关键词分析和绘图代码(R) 附录3 文本中关键词的TF-IDF计算和绘图代码(R) 附录4 回归分析可视化代码(R) 附录5 获取翻译对等词的代码(R) 附录6 词嵌入模型训练代码(Python) 附录7 使用t—sNE降维和可视化代码(Python) 附录8 用于生成语义网络的代码(Python) 附录9 用于主题模型的代码(R) 参考文献 索引 导语 本书共收录了十章,其中研究性内容共八章,大致又可分为三个部分。 第一部分包括第二章和第三章两章。主要说明本书的理论基础和方法论。 第二部分包括第四章至第六章,主要是基于频率的分析和探索。 第三部分包括第七章至第九章,主要探讨基于概率论的语言分析模型。 岀国试图揭示中国外语教学与研究领域60年来的主题变化,同时也将演示这种主题模型在历时文本研究中的巨大优势。 内容推荐 本书以认知语言学提出的基于使用的语言模型为理论依据,以英汉原创与翻译散文语料库为基础,对比分析文学性语言中的意象和语义结构,并探索对分析结果进行可视化的方法。研究的创新性在于将语料库与数据可视化相结合,有效利用R、Python、D3.js等多种文本分析、统计计算、数据处理和呈现手段,展示了数字人文方法对英汉对比与翻译及语言历时研究的意义。数字人文是近年来在国外蓬勃发展的一个研究方向,然而在国内人文社科领域此类研究较少,专著形式的研究成果亦不多见。 |