《实战Perl--语言信息处理利器(高等院校信息技术规划教材)》编著者荀恩东、黄志娥、饶高琦、谢佳莉。
本书分为入门、提高和应用三篇。第1篇包括Perl语言的运行环境、编程准备、基本语法和数据结构等知识。第2篇重点讲解正则表达式和复杂数据结构,对它们的驾驭有助于理解P4rl语言的灵活性和实用性。在本篇的最后一章(第7章),我们将带领读者实践几个自然语言处理中的任务。第3篇是应用篇,通过对Perl扩展包和文本编码的掌握,将可以帮助我们完成更多、更复杂的实际任务。
网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
书名 | 实战Perl--语言信息处理利器(高等院校信息技术规划教材) |
分类 | |
作者 | 荀恩东//黄志娥//饶高琦//谢佳莉 |
出版社 | 清华大学出版社 |
下载 | ![]() |
简介 | 编辑推荐 《实战Perl--语言信息处理利器(高等院校信息技术规划教材)》编著者荀恩东、黄志娥、饶高琦、谢佳莉。 本书分为入门、提高和应用三篇。第1篇包括Perl语言的运行环境、编程准备、基本语法和数据结构等知识。第2篇重点讲解正则表达式和复杂数据结构,对它们的驾驭有助于理解P4rl语言的灵活性和实用性。在本篇的最后一章(第7章),我们将带领读者实践几个自然语言处理中的任务。第3篇是应用篇,通过对Perl扩展包和文本编码的掌握,将可以帮助我们完成更多、更复杂的实际任务。 内容推荐 《实战Perl--语言信息处理利器(高等院校信息技术规划教材)》编著者荀恩东、黄志娥、饶高琦、谢佳莉。 Perl程序设计语言是近年来在计算机领域十分流行的脚本编程语言。其数据类型灵活,数据结构自由多变,能很好地支持正则表达式。因而Perl程序设计语言在语言信息处理等方面得到了广泛应用。 《实战Perl:语言信息处理利器/高等院校信息技术规划教材》面向不同起点的Perl编程学习者,循序渐进地介绍Perl语言程序设计的基本概念和方法,包括正则表达式、构造复杂数据结构并用于封装、典型NLP任务的实现等;最后给出了一些Perl语言程序设计的应用实例。 目录 第1篇 基础篇 第1章 什么是Perl 3 1.1 Perl是什么 3 1.2 为什么要学习Perl 3 1.3 搭建Perl语言的运行环境 4 1.4 书写Perl代码的编辑器 8 1.5 “Hello World!”——我的第一个Perl程序 8 第2章 Perl语言基础 11 2.1 变量 11 2.1.1 什么是变量 11 2.1.2 Perl的变量类型 12 2.1.3 简单变量 12 2.1.4 字符串中的转义字符 13 2.1.5 简单变量的操作符 14 2.1.6 简单变量是数值还是字符串 18 2.2 Perl语言文法 19 2.2.1 条件语句 20 2.2.2 循环语句 22 2.2.3 在循环体中使用last和next 24 第3章 数组、哈希、文件与函数 27 3.1 数组 27 3.1.1 什么是数组 27 3.1.2 数组赋值 28 3.1.3 数组常用操作 30 3.1.4 数组常用函数 34 3.1.5 数组操作实例 36 3.2 哈希 37 3.2.1 什么是哈希 37 3.2.2 哈希赋值39 3.2.3 哈希常用操作40 3.2.4 哈希常用函数43 3.2.5 哈希操作实例44 3.3 文件45 3.3.1 文件操作一般步骤45 3.3.2 打开文件46 3.3.3 关闭文件46 3.3.4 读取文件47 3.3.5 写入文件49 3.3.6 获取文件状态50 3.3.7 文件和目录的相关操作51 3.4 函数52 3.4.1 什么是函数52 3.4.2 函数的定义54 3.4.3 函数的调用54 3.4.4 变量的作用范围55 3.4.5 参数的使用58 3.4.6 函数的返回值59 第4章 用Perl语言实现几个简单任务61 4.1 统计文件词频61 4.2 合并两个词表63 4.3 求两个词表的交集64 4.4 查词表65 4.5 汉语分词66 第2篇 提高篇 第5章 正则表达式73 5.1 什么是正则表达式73 5.2 正则表达式语法符号74 5.2.1 指定字符的集合符号75 5.2.2 字符范围转义符号79 5.2.3 字符出现次数符号80 5.2.4 锚点符号82 5.2.5 其他符号83 5.2.6 几个开关项84 5.2.7 字符串的替换操作86 5.2.8 常用的正则表达式语法符号及正则表达式88 5.3 用正则表达式解决问题90 5.3.1 判断子串是否存在90 5.3.2 提取子串91 5.3.3 字符串加工93 5.4 典型文件格式处理93 5.4.1 查词表93 5.4.2 HTML与XML格式95 5.4.3 标注语料库97 第6章 引用100 6.1 数据结构与编程100 6.2 什么是引用101 6.2.1 引用的概念101 6.2.2 取得引用101 6.2.3 通过引用访问数据103 6.3 使用引用构造复杂数据结构105 6.3.1 值为数组的数组105 6.3.2 值为哈希的哈希108 6.3.3 值为数组的哈希108 6.3.4 混合数据结构110 6.4 使用复杂数据结构封装数据111 6.4.1 使用复杂数据结构查词表111 6.4.2 使用复杂数据结构统计词性113 第7章 几个典型NLP任务的实现115 7.1 合并两个词表115 7.2 从英汉词表生成汉英词表119 7.3 统计词性语料库121 7.4 拼音标注语料库统计123 第3篇 应用篇 第8章 语料处理129 8.1 语料批处理129 8.1.1 利用@ARGV接收程序运行参数129 8.1.2 标准输入输出及其重新设置130 8.1.3 制作批处理的Perl代码131 8.2 Unicode编程135 8.2.1 Perl内部字符串的两种形式136 8.2.2 UTF8字符流处理138 8.2.3 编码转换139 8.2.4 Perl Unicode编程常见问题处理140 8.3 Unicode 编程实例142 8.3.1 GB2312、UTF8相互转化142 8.3.2 中文语料断字处理及字频统计142 8.3.3 实现语料断句处理143 8.3.4 提取复合语言模式的语料144 8.3.5 汉语分词145 第9章 语料采集与数据库管理147 9.1 Perl语言扩展模块147 9.2 安装扩展模块148 9.3 使用网络扩展模块自动下载文件和页面149 9.4 抽取页面内信息150 9.5 数据库管理152 9.5.1 ODBC接口153 9.5.2 DBI接口154 第10章 综合应用——音字转换157 10.1 音字转换方法157 10.1.1 问题表示157 10.1.2 计算候选路径的分值158 10.1.3 寻找最优路径160 10.2 训练模型参数162 10.2.1 思路162 10.2.2 在大规模语料中统计BiCount163 10.2.3 建立索引数据167 10.3 动态规划算法170 |
随便看 |
|
霍普软件下载网电子书栏目提供海量电子书在线免费阅读及下载。