最新出炉科学家最常使用的十大算法(2)

日期：2020-06-18 栏目：程序人生浏览：次

亲切度为 0 的算法表示其在产业/政府和学术研究人员/学生之间的使用情况对等。IG亲切度越高表示该算法越被产业界普遍使用，反之越“学术”。

其中，最“产业”的算法是：

增量模型Uplift modeling，2.01

异常检测Anomaly Detection，1.61

生存分析Survival Analysis，1.39

因子分析Factor Analysis，0.83

时间序列Time series/Sequences，0.69

关联规则Association Rules，0.5

其中增量模型Uplift modeling又一次成了最“产业”的算法，但是令人惊讶的是其使用率确很低—只有3.1%，几乎是这次调查中使用率最低的算法。

最“学术”的算法是：

神经网络Neural networks – regular, -0.35

朴素贝叶斯Naive Bayes, -0.35

支持向量机SVM, -0.24

深度学习Deep Learning, -0.19

EM, -0.17

下图是所有算法以及它们在产业界/学术界的亲切度：

最新出炉——数据科学家最常使用的十大算法

数据科学家最常使用的算法工业界 vs 学术界

2016数据科学家使用的算法调查汇总

汇总表格中各项含义分别是：

N：根据使用度排名

Algorithm：算法名称，

类型：S – 监督，U – 无监督，M – 元，Z – 其他，

%指代调查中使用这种算法的调查者比例

Change—变动（％2016 年/2011％ – 1），

Industry Affinity—产业亲切度（前文中提到）

最新出炉——数据科学家最常使用的十大算法