串匹配在网络安全(网络入侵检测、计算机病毒特征码匹配、保密通讯,信息监控、国家互联网骨干网的有害信息防治,等等),生物计算(DNA序列匹配,蛋白质计算),拼写检查、搜索引擎、语言翻译、数据压缩,等等重要领域上有广泛应用。高庆狮、高小宇、胡玥、李莉、王培凤所著的《巨量串匹配基础》在介绍前人主要成果的基础上,以作者在该领域获得的成果为主轴,系统讨论各种类型的“他匹配”和“自匹配”的理论模型、求解算法和计算复杂性,以及面向算法的计算机系统结构模型。
高庆狮、高小宇、胡玥、李莉、王培凤所著的《巨量串匹配基础》讨论如何把巨量字符串的串匹配问题自动生成一个优化的完全自动机,以及其简化和有效硬件的实现,进一步讨论模糊化的U-不确定控制下的巨量字符串和干扰条件下的V-不确定控制下的巨量字符串的串匹配,以及超长字符串的部分匹配的算法和硬件实现方法。
《巨量串匹配基础》的有关研究工作前后得到国家自然科学基金GJZRUJJ-60873002的资助,973课题2007CB311103的资助。
《巨量串匹配基础》可作为计算机科学技术相关专业领域研究人员提高理论素质的参考书,也可以作为相关专业研究生学习专业基础的研究资料。
第1章 绪论
1.1 需求
1.2 半个世纪研究工作(1951~2001年)的总结
1.3 Shift-Or算法
1.4 多字符串匹配
1.5 Aho-Corasick算法与Aho-Corasick自动机
1.6 完全自动机与扩展的Aho-Corasick自动机
第2章 巨量字符串匹配完全自动机的自动生成
2.1 Bi-构成树的形成
2.2 状态分配:Bi-构成树节点编码形成
2.3 相似子树:状态转换补充连接
2.4 状态连接补全
2.5 计算复杂性
2.6 一个例子
第3章 面向巨量字符串匹配完全自动机的专用系统结构
3.1 双元素的树节点表示与第5步的完全连接
3.2 一个例子
3.3 实现巨量串匹配完全自动机的专用计算机系统结构描述
3.4 参数变化的影响
3.5 巨量串匹配完全自动机并行处理
第4章 带U-V控制的巨量字符串匹配完全自动机
4.1 U-不确定串中的相交和同源后续奇点引起的问题
4.2 U-不确定串的不相交化
4.3 U-不确定串的同源后续奇点的两种解决方法
4.4 U-不确定串的无同源后续奇点化的形式描述
4.5 两两不相交且无同源后续奇点的U-不确定字符串的完全自动机
4.6 快速自动生成V-不确定串多串匹配完全自动机算法
4.7 V-不确定字符串多串匹配需要多台并行工作的完全自动机
4.8 快速自动生成U-V-不确定串多串匹配完全自动机算法
4.9 多U-V-不确定串的交错
4.10 U-V不确定串多串匹配需要并行工作的多完全自动机台数与正则表达式匹配可能的遗漏
4.11 一个例子
第5章 多超长串部分匹配完全自动机及其专用系统结构
5.1 问题与方法
5.2 基本硬件系统
5.3 两段字符串(At,Bip)比对的工作流程
5.4 一个例子
5.5 求出匹配成功准确字符串
5.6 求出多个匹配成功字符串的准确位置
5.7 几个问题的讨论
参考文献