单层的感知器模型实际上就是一种线性分类器。
  多层感知器则可看作是某种非线性的推广和发展,它能够实现一种特殊的非线性变换,把输入空间变换到由其隐层输出所形成的空间,使在这个空间中分类问题变得比较容易。
  很多情况下,多层感知器的输出可以看作是对贝叶斯后验概率的估计。如果这个估计比较精确,则神经网络的输出值可以看作是概率,它们的总和为1。可以证明,当网络输出采用"c中取1"的类别编码,并且采用最小均方误差作为训练目标时,多层感知器的输出就是对贝叶斯后验概率的估计。估计的精度受网络的复杂程度、训练样本数、训练样本反映真实分布的程度以及类别先验概率等多种因素的影响。