数据分析入门-05-数据分析武器库:模型空间概述·数据分析模型

 

来,先复习一下,什么是建模

昨天介绍了模型本质是对现实对象的抽象描述以及附带的一整套抽象的方法;建模本质上就是建立现实对象和模型的一种映射关系.

数据分析入门-05-数据分析武器库:模型空间概述·数据分析模型

今天我们走进模型空间,看看里面最重要的是什么

我们先来看看我们平时接触最多的

感觉很高大上的

商业模型是什么?

比如拿我们都知道的swot分析来看. 百科定义:SWOT分析法,即态势分析法,就是将与研究对象密切相关的各种主要内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析,从中得出一系列相应的结论,而结论通常带有一定的决策性。 运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而根据研究结果制定相应的发展战略、计划以及对策等。SWOT分析法常常被用于制定集团发展战略和分析竞争对手情况,在战略分析中,它是最常用的方法之一。

这种框架分析工具本质是一个分类方式;首先分类了内部和外部,其次分类了优势/劣势,机会和威胁, 分类本是一种定类测量,相当于测量了俩个数字,一类叫做0,一类叫做1;

接下来,我们需要了解一些关于测量理论的基础知识.有助于理解这类模型本质都是测量。

一般可以将数据类型的度量分为四种:定类,定序,定距,和定比,这四种类型是从低到高的递进关系,高级的类型可以用低级类型的分析方法来分析,而反过来却不行,理解下面这些类型对于后面学习统计分析方法尤为重要。1、定类变量 定类就是将给数据定义一个类别。这种数据类型将所研究的对象分类,也即只能决定研究对象是同类抑或不同类。

例如把性别分成男女两类;把动物分成哺乳类和爬行类等等。

2、 定序变量 定序变量是将同一个类别下的对象分一个次序,即变量的值能把研究对象排列高低或大小,具有>与<的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(=,≠)。

例如文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。 注意!各个定序变量的值之间没有确切的间隔距离。比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。

3、 定距变量 定距变量是区别同一类别下个案中等级次序及其距离的变量。它除了包括定序变量的特性外,还能确切测量同一类别各个案高低、大小次序之间的距离,因而具有加与减的数学特质。但是,定距变量没有一个真正的零点。

,摄氏温度这一定距变量说明,摄氏40度比30度高10度,摄氏30度比20度又高10度,它们之间高出的距离相等,而摄氏零度并不是没有温度。 注意!定距变量各类别之间的距离,只能加减而不能乘除或倍数的形式来说明它们之间的关系。

4.、定比变量 定比变量是区别同一类别个案中等级次序及其距离的变量。定比变量除了具有定距变量的特性外,还具有一个真正的零点,因而它具有乘与除(×、÷)的数学特质。例如年龄和收入这两个变量,固然是定距变量,同时又是定比变量,因为其零点是绝对的,可以作乘除的运算。

如A月收入是60元,而B是30元,我们可以算出前者是后者的两倍。智力商数这个变量是定距变量,但不是定比变量,因为其0分只具有相对的意义,不是绝对的或固定的,不能说某人的智商是0分就是没有智力;

从这里我们可以看出,很多学科所谓的模型 只是对研究对象的定类测量,另外再加一些经验性的描述而已.这些模型非常依赖主观经验,可重复性和可操纵性都难以对我们的目标产生量级上的效率提升.大数据一部分很重要的意义就是让过去一些无法精确测量的对象变得可精确测量,从而可以引入数学工具解决.这部分是我们今天的重点,关于数学模型空间.

接下进入正题,我们来看一下模型空间的具体内容

数据分析入门-05-数据分析武器库:模型空间概述·数据分析模型

需要说明的是对模型空间的分类,是非常有主观色彩的,我也是斟酌再三之后选取了这样的角度,以期望不遗漏人类在大多数方面积累的智慧成果.

关于人类先天共识模型--图像

在生活场景中,我们可以很容易被一幅生动的图像打动,却很难(也不愿意)被逻辑说服.

这个模型空间内重要是最新的心理学和认知科学的一些研究成果。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wpywwd.html