理解自然语言之所以困难,有三个重要因素: ・ 目标表示的复杂性。如语义的概念可以用语义网表示,要从语句中提取这种表示的关键字就相当的复杂,同时还需要更多相关的客观世界的知识。 ・ 映射的类型。对于源语言到目标语言表示的映射,一对一类型是最理想的,但现实中自然语言到目标语言表示的映射极难达到一对一的要求。 ・ 成分间的交互程度。在语言中,每个语句都是由多个成分组成的,若每个成分的映射与其他成分无关,那么映射过程就比较简单。遗憾的是自然语言中的成分交互程度相当高,句子中改变一个成分,常常会大大改变句子的整体结构,这使得映射的复杂程度大大增加。 一般情况下,为了达到理解语言的目的,需要进行三步工作:理解所出现的每个词,词义表示语句意义的结构,和句子语义表示言语的结构。 在这三个过程中,需要着重解决如何有效地使用语法、语义、语用及与其相关的各种知识问题。 由于汉语没有形态变化,因此无法直接套用西方现有的语法模式。正是由于汉语词性的分类及划分是个老大难问题,进而使得语法语义的分析及生成也变得极其困难。 |