6.1.1 例子空间 有关例子空间的第一个问题是示教例子的质量,第二个问题是例子空间的搜索方法。 1. 示教例子的质量 高质量的示教例子是无二义性的,它可以对搜索规则空间提供可靠的指导。低质量的示教例子会引起互相矛盾的解释,因此只能对规则空间的搜索提供试探性的指导。 例如教给程序同花概念时,会产生几种二义性。这些都使程序难以发现正确的概念。首先,例子本身可能有错误。例子描述的错误是测量错误,例如误把梅花2写成红心2。对例子分类的错误是分类错误,例如误把一手非同花的牌判定为同花,或反之。其次,例子排列次序也影响学习效果。如果施教者对示教例子进行合理的排序,学习任务就比较容易了。在由程序自动选择例子时,程序自动对例子进行排序。 在这一章介绍的实例学习中,示教例子都事先由施教者分类为正例和反例。另外一些学习系统是由未经分类的例子学习,这种学习方法称为观察与发现学习,将在下一章介绍。 2. 例子空间的搜索方法 这方面的研究还不多,因为一般情况下认为例子是同时提供的,即程序不选择例子。但是也有的程序主动选择另外一些附加的例子,以便修正假设。这称为补充学习。有的程序直接搜索例子空间,这称为主动选择例子。 搜索例子空间的目的一般是选择适当的例子,以便证实或否决规则空间中假设规则的集合H。在学习系统运行中,系统认为假设规则集H中的规则都可能是要求的规则,但有待进一步证实或否决。因此,搜索例子空间的方法往往涉及到假设规则集H。第一种方法是选择对划分规则空间最有利的例子,以便很快缩小在规则空间的搜索范围。如果选定的示教例子把假设规则集H分成两半,那么在得到这些新例子后就可以排除一半的假设。第二种方法是在假设规则集H中选择最有希望的假设,再选择适当的示教例子证实它。选择示教例子的目的是正式假设。第三种方法称之为“基于期望的过滤”,它选择示教例子的目的是否决假设规则集中的某个假设规则。利用H中的假设滤掉与该假设一致的例子。于是学习系统只注意与假设矛盾的例子。第四种方法选择示教例子的要求是使计算量最小。 6.1.2 解释例子 解释示教例子的目的是从例子中提取出用于搜索规则空间的信息,也就是把示教例子变换成易于进行符号归纳的形式。有时这个变换过程是很困难的。 例如Winston的程序学习在积木世界中"拱"的概念。一个示教例子是积木结构场景的一个素描图,并说明该场景是拱的正例还是反例。解释例子的过程就是用积木世界知识解释这个素描图,并用一些谓词和关系来描述这个素描图。例如,积木A是长方体,积木B是圆柱体,积木A放在积木B上,积木B和C不接触等。这时解释例子的过程就是把素描图的形式变换成谓词和关系的形式。后者是便于进行归纳推理的。 |