下图表示学习系统的基本结构。
环境可以是系统的工作对象,也可以包括工作对象和外界条件。例如在医疗系统中,环境就是病人当前的症状、检验的数据和病历;在模式识别中,环境就是待识别的图形或景物;在控制系统中,环境就是受控的设备或生产流程。就环境提供给系统的信息来说,信息的水平和质量对学习系统有很大的影响。 信息水平:信息的一般性程度,也就是适用范围的广泛性。这里的一般性程度是相对执行环节的要求而言的。高水平信息比较抽象,适用于更广泛的问题。该种信息需要具体化才能够成为知识;低水平信息比较具体,是特殊的实例,只适用于个别的问题,需要归纳才能够成为知识。 信息的质量:信息的正确性、是否是适当的选择和合理的组织。 环境提供的信息水平和执行环节所需的信息水平之间往往有差距,学习环节的目的就是解决水平差距问题。如果环境提供较抽象的高水平信息,学习环节就要补充遗漏的细节,以便执行环节能够将其用于具体情况。如果环境提供较具体的低水平信息,即在特殊情况执行任务的实例,学习环境就要由此归纳出规则,以便用于完成更广的任务。 信息质量对学习难度有明显的影响。如施教者向系统提供准确的示教例子,可以减少系统的学习失误。同时学习的速度、学习结果也与提供例子的次序有关。如果次序合理,则容易进行归纳;若示教例子中有干扰,或示例的次序不合理,可能使得系统难以归纳。 影响学习系统设计的第二个因素是知识库的形式和内容。 知识库的形式:知识表示的形式。常用的知识表示方法有:特征向量、谓词演算、产生式规则、过程、LISP函数、数字多项式、语义网络和框架。选择知识表示方法要考虑可表达性、推理难度、可修改性和可扩充性等等准则。 可表达性:表达方式要能描述缺乏内在结构的事物。以一个特征集合或是其他东西描述事物。 推理难度:常用的推理是比较两个描述是否等效。表示的不同,推理当然有的容易,有的难。例如:向量的比较就比较容易,谓词的比较就很难。 可修改性:知识是否可以修改。不能修改的知识不能够更新。 可扩充性:系统学习通过增加词典条目和表示结构来扩大表示能力,使得系统能够学习并表示更复杂的知识。 知识库的内容:在初始阶段要有相当的初始知识。并且在学习过程中不断修正和增加新的知识。知识库内的知识大多是以概念的形式存储的。 |