使用excel进行数据挖掘(2)----分析关键影响因素
在配置环境后,能够使用excel进行数据挖掘。
环境配置问题可參阅:
例子 DMAddins_SampleData.xlsx
文件下载地址:
在数据表中,选择table analysis tools sample表,该表中是用户的信息统计。包含婚姻状况,性别,收入。子女。教育程度,职业,是否有房子,汽车数量,居住区域,年龄。是否已购自行车等。
将鼠标点击表格中的数据。选项卡会多出一个
以下。将使用分析关键因素功能对数据进行一个分析举例:
依据已实用户的统计信息,对 收入 进行分析。及其它因素对于 收入 的影响。
比如,一个有较好职业的用户,其对应的收入应该较高,反之亦然。
职业能够是对于收入有较大影响的因素。
执行完毕后,excel会生成例如以下报表。
在相对影响值列中,滑块长度越长,说明影响因素越大。比如,第一行数据。说明,某人的职业为从事体力劳动,其收入更倾向于低于39050