第七章 其它学习方法

  
7.4.3 基于归纳的发现系统CASM
  科学发现是一个复杂过程。它包括设计实验、发现经验定律、制造新的仪器、形成理论、检验假说等侧面。各侧面间又存在复杂的相互联系。但科学发现同其它智力活动(如博弈)一样可采用启发式搜索。
  另一方面,科学发现具有与其它智力活动显然不同的特殊性。其中模型这一概念刻画了这种特殊性的一个方面。科学发现过程可以看作是分析原始实验数据,提出一种模型,在它的指导下进行新的实验,进而不断改进与完善模型。我们研制的CASM系统反映了这种思想。
  1.CASM系统简介
  CASM的研究工作对科学发现的机理进行了探讨。其中CL系统(概念学习)能从众多的化学反应中提出酸、碱、盐的概念,并指出这些概念的一般物理、化学特性。它通过一个评估函数来找出概括能力更强的概念,并可对原始描述不断抽象和量化。AC系统(成份分析)从一系列化学反应中,通过几个规则以特定的方式作用于问题空间,从而揭示各物质的组成成份。SM系统(结构模型)是一个自己学习知识并运用所学知识的系统。它以物质守恒为前提,利用Avogadro定律对化学反应进行处理,提出各分子的组成结构,确定反应方程式。以上三个子系统的作法与历史上化学家的有关工作很相似。MP系统(多变元多项式)能发现形如y=f(x1,x2,…,xn)的多项式关系。它的输入是多组自变元―函数值对,输出为概括这种关系的多项式。
  七十年代末期,美国卡内基-梅隆大学的一个小组在H.A.Simon指导下对科学发现过程进行了研究。其中以P.Langley等研制的BACON系统为代表,它能发现经验数值定律。八十年代中期,他们对化学中定性知识的获得进行了研究。
  CASM系统与BACON系统相比,有如下特点:
  (1)指出了科学发现的特殊性及模型这一概念在科学发现中的重要性。
  (2)对数值和符号都能较好地处理,并把定量和定性概念在归纳发现中综合考虑。
  (3)系统对所发现的规律,可通过应用不断完善。
  (4)MP系统解决了BACON系统存在的对多变元没有一般处理方法的问题。