人工智能原理

第五章　机器学习

　　5.5 机器学习的分类

　　对机器学习的分类可以由下列几方面进行：学习策略、知识表示和应用领域。学习策略是学习中使用的推理方法。下面将按学习策略分类，以便系统介绍不同的方法。
　　学习系统总是把环境提供的信息变换成新的形式，以便存贮和使用。这种变换的性质确定了学习策略的类型。几种基本策略是：记忆学习、传授学习、演绎学习、类比学习和归纳学习。归纳学习又分为实例学习、观察与发现学习。这些策略是按变换复杂性递增的次序排列的。变换越复杂，学习者的工作越多，施教者的工作越少。人类的学习往往同时使用多种策略。这里划分不同的策略，不仅是为了介绍不同的方法，而且是便于设计学习系统。虽然现有的学习系统还只使用单一的策略，多种策略系统也将受到重视。

　　5.5.1 记忆学习
　　在记忆学习中基本没有变换。由施教者提供的信息或多或少被学习系统记忆和使用。这时环境提供的信息与执行环节使用的信息有相同的水平，同样的形式。实际上每台计算机都可以看作是记忆学习，因为它们都存贮用户送入的程序。一个例子是Samuel的西洋象棋程序（1956，1967），它记忆每个棋局以便提高下棋水平。

　　5.5.2 传授学习（指点学习）
　　在传授学习中，学习环节进行的变换只是对施教者提供的信息进行选择和改造，这主要是在语法层的变换。这时环境提供的信息过于抽象，它的水平高于执行环节所用信息的水平。学习环节把较高水平的知识变换为较低水平的知识。这种变换称为实用化。实用化主要有下列步骤：由传授的信息推出结论，作出假设以补充一些细节和确定何时需要进一步传授。实用化过程类似于编译系统把高级语言程序变换成机器码程序。第一个例子是McCarthy(1958)的系统。最近的系统有TEIRESLAS（Davis, 1976）和FOO（Mostow, 1979和1981）。

　　5.3.3 演绎学习
　　在演绎学习中，学习系统由给定的知识进行演绎的保真推理，并存储有用的结论。这种策略近几年才作为一种独立的学习策略。（Michalski, 1983）演绎学习包括知识改造、知识编译、产生宏操作、保持等价的操作和它保真变换。

　　5.5.4 归纳学习
　　在归纳学习中，变换过程是对输入信息的一般化和选择最合理的预期结果，这就是归纳推理。归纳学习可以分为以下实例学习、观察与发现学习。
　　1．实例学习
　　实例学习又称为概念获取，它的任务是确定概念的一般描述，这个描述应解释所有给定的正例并排除所有给定的反例。这些正反例是由信息源提供的，信息源可能是已经知道概念的施教者，也可能是学生做实验而系统从中得到反馈的环境。后者可称为实验学习，包括由做学习和由问题求解学习。刺激反应式学习也是一种实例学习。
　　当前对实例学习的研究集中在两个方面：例子一类型的一般化，部分一整体的一般化。在例子一类型的一般化中，提供给系统某一类对象的独立的实例，系统的目标是归纳出这些类的一般描述。实例学习的多数研究集中在这一方面。对象可能是结构化的部件、几何形状、疾病描述、故事、问题的解、控制算子等。在部分一整体的一般化中，任务是假设整个对象（情景，情况，过程）的描述，但只给定了对象的局部。例如，只给定一个房间的几张局部的照片，要重构房间的整个视图。又如，只看到一个序列或过程的一部分，要确定描述该序列或过程的规则。
　　2. 观察与发现学习
　　观察与发现学习又称为描述的一般化。这类学习没有示教者的学习帮助，它要产生解释所有或大多数观察的规律和规则。这类学习包括概念聚类、构造分类、使方程符合数据、发现解释观察的定律和形成理论；遗传学算法（Holland, 1986）和经验预测算法（Zagoruiko, 1976）可以看作这种策略的变种。
　　实例学习是由正反例学习，这些正反例是由施教者分类的。因此实例学习是有示教的学习。观察与发现学习是由未经分类的观察学习，或由系统自身的功能去发现。这是无示教的学习。

　　5.5.5 类比学习
　　类比学习是演绎学习与归纳学习的组合。它匹配不同论域的描述，确定公共的子结构，以此作为类比映射的基础。寻找公共子结构是归纳推理，而实现类比映射是演绎推理。由提醒学习可以看作一种类比学习（Schank, 1982）。类比学习是由系统已有的某一领域知识得到另一领域中类似的知识。
　　以上介绍了各种学习策略。当前研究的焦点是归纳和类比学习。下面再说明有关归纳学习的一些问题。归纳推理是从一些事实或观察出发，有时还有对这些事实的初始假设，它由此产生解释这些事实的一般化结果。归纳是使用一般化推理规则的保假推理。不用任何解释性概念直接由事实推出理论的纯归纳是不可能的。这些解释性概念应该用于描述观察，并作为学习系统背景知识的一部分。任何归纳过程都需要背景知识。背景知识包括学习目标、论域专用约束、因果关系、指导归纳过程的启发式和倾向性、评价竞争假设的准则等。
　　有两种指导和约束归纳过程的方法：基于相似的方法和基于约束的方法。基于相似的方法分析内部的实例关系。也就是说它举出概念的正例和反例，以产生概念的描述。它搜索在同一类中的事实或实例所共有的特征，并寻求一般的原因和解释，以说明为什么不同实例属于同一类。它是就实例间的差别进行一般化，这是通过忽略不同的特征，或通过形成包含这种差别的概念。基于约束的方法也分析内部实例关系，但这些关系约束了适于多个事实或实例的解释性概念。对这些事实或实例的一般化必须满足这些约束。例如，�"盒子在桌子上"的事实进行一般化时，应满足的约束是桌子上的东西不能太重以至压环桌子，也不能太大以至无法放在桌子上。Andreae(1984)的假设验证概念是这种方法的变种。基于解释的归纳是另一种变种，它更强调解释性知识的作用（Mitchell等，1986）。它用系统的背景知识来形成给定事实的高层次概念解释。基于相似的方法和基于约束的方法是互补的，它们可以同时用于学习系统中。
　　本书第六章将介绍实例学习。第七章介绍其它学习策略。