前面的博客介绍过如何构建一个推荐系统,以及简要的介绍了协同过滤的实现。本篇博客,笔者将介绍协同过滤在推荐系统的应用。推荐系统是大数据和机器学习中最常见、最容易理解的应用之一。其实,在日常的生活当中,我们会频繁的遇到推荐的场景 ,比如你在电商网站购买商品、使用视频App观看视频、在手机上下载各种游戏等,这些都是使用了推荐技术来个性化你想要的内容和物品。
2.内容本篇博客将通过以下方式来介绍,通过建立协同过滤模型,利用订单数据来想用户推荐预期的物品。步骤如下:
转换和规范化数据
训练模型
评估模型性能
选择最佳模型
2.1 技术选型完成本篇博客所需要的技术使用Python和机器学习Turicreate来实现。Python所需要的依赖库如下:
pandas和numpy:用于操作数据
turicreate:用于进行模型选择与评估
sklearn:用于对数据进行封装,包括回归、降维、分类、聚类等。
2.2 加载数据本次演示的数据源,包含如下:
customer_id.csv:列出1000个客户ID作为输出推荐;
customer_data.csv:物品数据源集。
加载Python依赖库,实现代码如下:
import pandas as pd import numpy as np import time import turicreate as tc from sklearn.model_selection import train_test_split