第七章 其它学习方法

   5.发现多变元多项式关系的MP系统
  发现数值间的关系在科学发现中占有重要地位。BACON.2 和BACON.4系统可以发现形如y=f(x)的两变元多项式关系。MP系统提供了发现多变元间多项式函数关系的算法。
  (1)多变元多项式关系的发现
  先看三变元的例子。设z=f(x,y)为多项式关系。它可改写为
     z=gn(x)yn+…+g1(x)・y+g0(x)
关于y的多项式中的系数是x的多项式。先固定x,得出y2间的一个关系。再改变x值,对x不同值得到y与z间一系列关系。最后确定gi(x)的形式。
  要发现形如y=f(,…,xm)的多项式关系,方法与三变元情况类似。y可写为
     
其中gi(,…,xm-1)也可表示为类似形式,直到为两变元关系才止。对于n可变这种一般情况,要解决下面三个相关联的问题:输入数据的表达及输入的方式;各中间过程的系数的形成及存放;由最后的系数表转化为-般代数表达式。
  发现两变元n次多项式关系至少需要(n+2)组数据。所以为确定y=f(,,…,xm)这个多项式关系,需要多组数据。这些数据存在一个数组中,数组每个元素为一组数据,形式为(y,,,…,xm)。例如,(7,1,2,3)表示f(1,2,3)=7。
  中间函数各系数的形成与存放采用递归的方法。由于采用多维矩阵保存系统中的数据,就为递归调用提供了方便。例如对y=f(x1,x2,x3),由前面形成了数据矩阵A。设有:
     A(I,J,K)=(y',x'1,x'2,x'3)
则对每一个固定的向量(x'1,x'2),都可以归纳出一个在y'和x'3间的多项式关系。其系数表可以写为
     cf(y,x3)=(a3n,a3(n一1),…,a31,a30)
把数组元素(y',x'1,x'2,x'3)变成(cf(y,x3),x'1,x'2),并存到A(I,J,0)中。而对每一个x'1,都可归纳出x'2和a3K间的多项式关系。依此类推进行递归调用,直到所有变元都考虑完为止。在递归中,数据信息每次都压缩一维。最后,总的系数表存在数组元素A(0,0,0)中。
  下面举例说明如何由总系数表转化为一般表达式。设
     A(0,0,0)=(((1 2 1)(3-12))
           ((4 6 7) (8 9)))
则转化为
  
  (2)对MP系统的评价
  P.Langley和H.A.Simon等人研制的BACON.1到BACON.6这六个系统是发现数值经验定律的系统。但从数据环境中发现规律的功能这一点来看,BACON系统存在以下问题:
  第一、对多变元没有一般的处理方法。
  第二、在复杂的数据环境中,缺乏对有用变元进行选择的能力,从而表现出人为设计的味道。
  第三、抗干扰能力差。
  第四、能发现的函数类型很有限,除了受初等函数限制外,它也不能发现复合函数的一般关系。
  MP系统正是在考察了BACON系统后,部分解决了以上问题。MP系统重新发现了理想气体状态方程、欧姆定律等可表示为多项式关系的物理学定律。如果加上一定的启发式,对变元作适当变换,并加强抗干扰能力,MP系统将能发现BACON系统能发现的绝大部分经验定律。
  MP系统的能力仍然相当有限。实际上,找出一种经验关系是一个建立模型的过程。这个模型在MP系统中就是一个函数。它概括了用户提供的一系列自变元与函数值的关系。但是数值环境中的模型决不限于初等函数。例如,在物理、化学和其它科学中,在定量分析一个动态过程时,一般都用微分方程描述。如何建立微分方程还有待进一步研究。
  6.结论
  基于归纳的发现,系统CASM以模型思想为指导,把定量与定性分析结合起来,模拟了化学史上若干发现过程。它强调知识的获取、应用与完善的统一,同时提出了多变元多项式关系发现的一般方法。