在社会发展需求下,自然语言理解作为语言信息处理技术的一个高层次的重要方向,一直是人工智能界所关注的核心课题之一。显然,如果计算机能够理解自然语言,人-机间的信息交流能够以人们所熟悉的本族语言来进行,那将是计算技术的一项重大突破。另一方面,由于创造和使用自然语言是人类高度智能的表现,因此对自然语言理解的研究也有助于揭开人类智能的奥秘,深化我们对语言能力和思维本质的认识。 那么什么叫"自然语言理解"?正如什么是"智能"一样,对于"理解"这个术语也存在着各式各样的认识。在人工智能界,或者语言信息处理领域中,人们普遍认为可以采用著名的图灵(Turing)试验来判断计算机是否"理解"了某种自然语言。 相比较人工智能其它领域,自然语言理解是难度大,进展小的。至今为止未能达到很高的水平。 Turing提出的智能实验,参加者是计算机、被实验的人以及主持实验的人。由主持人提出问题,计算机和被实验的人来回答,被实验者在回答问题时尽可能的向主持人表示他是"真正"的人,计算机也尽可能逼真的模仿人的思维。如果主持人通过听取对问题的回答分辨不出哪个是人的回答,哪个是机器的回答时,便可认为被试验的计算机是有智能的了。有人对这样设计的实验提出了疑义,他们认为这种实验只反映了结果的比较而没有涉及思维的过程,而且也没明确此人是个孩子还是有良好素质的成年人参加了实验。当一个计算机系统能给出有关问题的正确答案或有用的建议、而解决问题所用的概念和推理与人相当、还能解释推理过程时,便可说这样的计算机系统是有智能的了。 本章将讨论自然语言理解的概念、发展简史以及系统组成与模型等;然后,逐一研究语言的自动分析、句子的自动理解、语言的自动生成和机器翻译等重要问题。 |