属性(attribute)或特征(feature):反映事件或对象在某方面的表现或性质的事项
属性值(attribute value):属性上的取值
属性空间(attribute space)或样本空间(sample space)或输入空间:属性张成的空间
特征向量(feature vector)
维数(dimensionality)
训练(training)
训练样本(training sample)
训练集(training set)
假设(hypothesis)
真实(ground-truth)
学习器(learn)
预测(prediction)
标记(label)
标记空间(label space)
分类(classification)
多分类(multi-class classification)
正类(positive class)
反类(negative class)
测试(testing)
测试样本(testing sample)
分布(distribution)
独立同分布(independent and identically distributed)
监督学习(supervised learning)
无监督学习(unsupervised learning)
聚类(clustering)
簇(cluster)
回归(regression)
泛化(generalization)
归纳(induction)
演绎(deduction)
假设空间
由形如属性值的不同的可能取值所组成的假设组成
可以由许多不同的策略对假设空间进行搜索,自顶向下或者自顶向上,前者从一般到特殊,即特化,后者从特殊到一般,即泛化,搜索过程中可以删除与正例不一样的假设、和(或)、反例一致的假设,最终将会获得与训练集一致(即可以对所有训练样本进行正确判断)的假设,即为我们学习的结果
归纳偏好
机器学习算法在学习过程中对某种类型假设的偏好,称为“归纳偏好”,或简称为“偏好”