自然语言处理
自然语言处理(Natural Language Processing)俗称人机对话,是研究如何利用计算机来理解和处理自然语言的,即把计算机作为语言研究的工具,在计算机技术的支持下对语言信息进行定量化的研究,通常又被称为自然语言理解或计算语言学。
1.自然语言处理研究的意义
它是计算机科学领域与人工智能领域中的一个重要分支学科,其研究是用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。这在当前新技术革命的浪潮中占有十分重要的地位。研制第5代计算机的主要目标之一,就是要使计算机具有理解和运用自然语言的功能。
自然语言理解是一门新兴的边缘学科,内容涉及语言学、心理学、逻辑学、声学、数学和计算机科学,而以语言学为基础。自然语言处理的目的是实现计算机对语言信息的自动分析和理解,它立足于实验、理论和计算三大支柱,通过以对人脑及语言认知的实现途径进行模拟研究,建立起多层次网络处理模型来阐明人脑语言信息处理系统,以期取得突破性的进展。自然语言理解的研究,具有很强的生命力,是当代科学新的生长点。其综合应用了现代语音学、音系学语法学、语义学、语用学的知识,同时也向现代语言学提出了一系列的问题和要求。另外它的研究不可能一步就达到对大规模真是文本的完善处理,必须逐层逐步地加以分析和解决,各层次的研究既相互独立,又有着十分密切的联系,对每一层次的研究,都应考虑更高层次的研究需要。
由于自然语言处理的对象是人类自然形成的极其复杂的语言现象,所以这门学科极具艰巨性。事实上,这门学科自20世纪40年代产生以来,经历了十分曲折的发展历程;然而随着信息社会的到来,自然语言处理,在机器翻译、信息检索、人机交互等信息处理领域有着广泛的应用前景,这是这门学科的实用价值。