⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 preface.htm

📁 詹卫东老师的博士论文
💻 HTM
字号:

<html>

<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="GENERATOR" content="Microsoft FrontPage 4.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
</head>

<body>
<p align="center">前   言</p> 
<p><br> 
面向人写的汉语语法书已经非常多了,面向计算机写的汉语语法书则还很少见。众所周知,计算机处理自然语言困难重重,最常被提及的恐怕莫过于计算机不懂得人类所用的自然语言的语法。那么,如何让计算机懂得自然语言的语法呢?进一步说,要让计算机能够理解汉语,能处理中文信息,需要汉语研究者为计算机准备一部什么样的汉语语法呢?</p> 
<p><br> 
《面向中文信息处理的现代汉语短语结构规则研究》可以看作是在前人已经开始的许多研究工作的基础上,为回答上述问题迈出的新的一步。<br> 
</p> 
<p>本书面向中文信息处理的实际需要,尝试以形式化的方式对现代汉语短语结构的组合规则进行全面的描写,并探讨解决计算机分析汉语短语结构碰到的各类歧义问题的途径。全书共分七章。<br> 
</p> 
<p>第一章对汉语信息处理技术的发展状况以及目前现代汉语语法研究的水平进行了宏观分析。以此为背景,确定了本书研究课题所针对的对象为短语结构,预期的目标是完成一个带有丰富约束条件的现代汉语短语结构规则库。特别值得指出的是,这样的短语结构规则库是以一部对现代汉语词语进行了全面句法语义属性描述的电子词典作为底层支撑的。有关电子词典的语法部分的详细介绍,请读者参阅本系列丛书中由俞士汶教授等著的《现代汉语语法信息词典详解》(下简称《详解》)一书。本书跟《详解》一书选择同样的语法理论框架--词组本位语法体系--作为开展研究工作的基本立场。从某种意义上说,本书的研究内容是《详解》一书的自然延伸。<br> 
</p> 
<p>第二章贯彻词组本位语法体系以功能为原则建立句法范畴的精神,将以往对词的句法功能分类和属性特征的研究进一步全面拓展到短语结构上,得到了一个相对完整的短语结构功能分类体系,并初步确立了一套描述短语结构句法功能属性的范畴体系。同时吸收了汉语配价理论、动词格框架等的具体研究成果并加以拓展,提出了一个面向中文信息处理的综合的语义信息描述框架 --“广义配价模式”,以及一个简化的语义分类体系。这部分工作是为进一步开发一个短语结构规则库打下坚实的范畴基础。<br> 
</p> 
<p>第三章在上述句法语义属性范畴基础上,对四类主要的现代汉语短语结构:np、ap、vp、dj的组合规则进行了系统地形式化描写。这部分工作可以概括为,将以往面向人所做的有关汉语短语结构的句法语义研究的成果,加上作者的研究和实践,组织成了一部可以为计算机分析汉语短语结构提供直接支持的规则库。从形式上讲,一条短语结构规则包括两部分,产生式规则和合一等式。产生式规则用于描述汉语短语结构的一种组合可能性,合一等式则进一步描述这个特定的组合模式的的整体性质及组合条件。本章总结了有关上述四类短语的规则共89条。<br> 
</p> 
<p>第四章细致分析了计算机处理汉语短语结构时面临的定界歧义和结构关系歧义问题,从不同角度区分了抽象的歧义格式的不同类型:包含终结符的歧义格式与不含终结符的歧义格式;外显型歧义格式与内含型歧义格式;真歧义格式、准歧义格式、伪歧义格式等。在已有短语结构规则的基础上,对现代汉语短语结构歧义格式(不含终结符的3项排列歧义格式和含终结符“的”跟“和”的4项和5项排列歧义格式)进行了统计,得到了计算机分析现代汉语短语时可能碰到的歧义格式的一个比较完整的清单。<br> 
</p> 
<p>第五章则在对汉语短语结构歧义有了全面认识的基础上,通过对三个典型的短语歧义格式进行分析,进一步探讨了排歧策略,并对难以和无法在短语结构规则层面解决的歧义问题,指出困难所在,以期为进一步的排歧研究提供参考。<br> 
</p> 
<p>第六章以计算机分析实例的结果展示了本书归纳的短语结构规则在一个具体的汉语句法分析器中使用的实际效果,同时对造成某些分析结果不佳的原因进行了解释。<br> 
</p> 
<p>第七章对本书涉及的研究工作进行了全面总结,包括具体的研究成果,对汉语信息处理研究所能提供的支持,以及对汉语语法研究的意义等,最后对进一步的研究工作进行了规划。<br> 
</p> 
<p>本书研究工作是跨现代汉语语法和中文信息处理两个领域进行的。一方面,研究的具体结果对推进中文信息处理技术的发展应该会有直接的应用和参考价值;另一方面,从中文信息处理的角度来审视现代汉语语法研究,也可以为研究工作提供一个清晰的实用背景。不仅可以注意到以往面向人的研究不容易注意到的一些问题,而且也使得语法研究中的许多问题能够在一个形式系统的框架中得到更明确、更规范的表述。作者希望这本书对从事汉语信息处理实际应用开发工作的科研人员,在计算语言学这一交叉学科领域辛勤耕耘的研究人员,以及汉语语法研究工作者,都能起到一定的参考作用。<br> 
</p> 
<p>书中内容在得到许多专家学者的指导和宝贵意见后经过若干次调整修正,并经多次仔细校对,但错误疏漏之处,恐仍难免。在请读者包涵谅解的同时,也恳请专家同行多多批评指正。</p> 
</body> 
 
</html> 

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -