第五章 机器学习

  
5.2 什么是机器学习

  Simon(1983)认为:"学习就是系统中的变化,这种变化使系统比以前更有效地去作同样的工作。"这种观点得到广泛的采用。但是难以对系统的改善给出严格的准则,Minsky(1985)认为:"学习是在我们的头脑中进行有用的变化。"他以后发现这个定义对应用是太广了。有的观点把机器学习仅看作知识获取。知识获取似乎是大多数学习的本质。但是,获取的知识有时不会使系统有所改善。而在获取技巧时,知识获取只起很小的作用。获取技巧往往通过反复练习,较少涉及自觉的思考。在本文中将只考虑学习的知识获取问题。
  为了获取知识,必须以某种形式表示知识。于是有的观点认为:"学习是构造或修改对于经验的表示。"经验包括感觉刺激和内部思考过程,学习系统通过这些刺激和内部过程来接受客观现实。按此观点,学习的核心问题是构造客观现实的表示,而不是改善性能。性能改善只是构造表示的结果。然而,因为大多数学习都会改善性能,又因为测试性能比分析表示更容易,所以我们要考虑这两个方面。
  对于构造的表示可以给出三种评价标准。第一个是合法性(真实性)。这是表示与现实相符合的精确程度。第二个是有效性。这涉及到学习的性能。它是表示对实现预定目标的用途。表示越有效,系统性能越好。第三个是抽象层次。这反映所表示概念的范围、细节和精确性。它确定了表示的解释能力。上述三个方面确定了学习质量。
  表示形式可以是符号描述、算法、仿真模型、控制过程、规划、图像或一般的形式理论。如果表示也包括在获取技巧时神经系统中出现的物理或生理标记,则学习也包括了获取技巧。按此观点,机器学习的基本问题就是用于表示和修改知识或技巧的形式与方法。