起初,主要是"词对词"的翻译。当时,人们认为翻译工作之包含查阅词典和语法分析两个过程。对要翻译的文章,可首先通过查阅辞典,找出两种语言间的对应词,然后经过简单的语法分析调整词序就可实现翻译。但是,这种方法未能达到预期的效果,闹出了一些阴差阳错、颠三倒四的笑话。由于早期研究中理论和技术的局限,所开发的机器翻译系统的技术水平较低,不能满足实际应用的需要。
1966年美国科学院发表的一份报告中认为,全自动机器翻译系统在较长时期内不会取得成功。此后,机器翻译研究工作进入低潮。人们开始转向对语法、语义和语用学等基本问题的研究。因为人们认识到,对语言的理解不能只依赖于各个孤立单词的词义及语法知识,必须把它与上下文及环境知识联系起来,才能做到正确的理解,同一单词在不同的上下文及环境下往往会有不同的含义。 60年代以来已经产生过一些成功的自然语言理解系统,用来处理受限的自然语言子集。这些子语言或是在句子结构的复杂性方面受到限制(句法限制),或是在所表达的事物的数量方面受限(语义受限,或领域受限)。其中有一些系统, 如人机接口和机器翻译系统,已成为市场上的商品。但要想让机器能像人类那样自如地运用自然语言,仍是一项长远而艰巨的任务。 30年来自然语言理解的研究大体上经历了三个时期:60年代以关键词谓匹配为主流的早期,70年代以句法-语义分析为主流的中期,和80年代开始的基于知识的新一代自然语言处理系统。目前,新提出的基于大规模语料库的自然语言处理思想正在蓬勃发展。 |