分类:当数据被用于预测一个分类时,监督学习算法也可以称为是一种分类算法。比如,我们的一张图片可以被分类标记为狗或者猫。如果我们的分类标签只有两个类别,那么我们也把这个分类称之为二分类问题。当我们需要分类的东西超过两个类别的时候,这个模型就是一个多分类模型了。 回归:当我们预测的值是一个连续值时,这个问题就变成了一个回归问题。 预测:这是根据过去和现在的一些历史数据,来预测将来的数据。最常用的一个领域就是趋势分析。比如,我们可以根现在和过去几年的销售额来预测下一年的销售额。
关于机器学习的模型监督学习主要包括用于分类和用于回归的模型:
分类:线性分类器(如LR)、支持向量机(SVM)、朴素贝叶斯(NB)、K近邻(KNN)、决策树(DT)、集成模型(RF/GDBT等)
回归:线性回归、支持向量机(SVM)、K近邻(KNN)、回归树(DT)、集成模型(ExtraTrees/RF/GDBT)
关于各个模型的关系和选取原则可以参考下面图片.
最后总结一下
对模型空间做了一个综述,着重介绍了因果关系探索的一些数学模型
讲个小故事~关于测量~一米等于多少.1791年,著名科学家拉格朗日,当选为法国度量衡委员会主席。在他全力推动下,一项影响了全世界的长度单位——米浮出水面。法国相关当局规定:把经过巴黎的地球子午线,也就是经线长的四千万分之一定义为1米。通俗地说,l米是从地球北极到赤道距离的一千万分之一,1791年3月25日(距今227年),法国国民议会决定采纳了只基于一个长度基本单位“米”的计量制度。现在全球通用的国际长度单位米,则由此规定而来。
剩下的问题是如何测量地球子午线的长度了?那可是200年前,没有飞机,没有核动力航母,于是拿破仑真的派了俩队人一队去北极,一队去秘鲁.....开始了测赤道....7年之后俩队人返回测得了结果是57422toise(法国当时长度单位).
人类为了量化一个对象,有多努力.....