1.读取商铺数据csv文件
2.解析数据,存为列表字典格式:[{key1:value1,key2:value2.。。。}]
3.数据清洗:
3.1.comment,price两个字段完成数据清洗
3.2.清除字段缺失的数据
3.3.commentlist拆分成三个字段,并且清洗成数字
4.结果存为。pkl文件
拿到cvs文件,并且使用python打开文件,查看文件信息,先查看文件的最开始六行数据,看看文件的结构是怎么样子的,这里将文件内容以逗号进行分割
f = open("D:\\BaiduNetdiskDownload\\数据分析网易\\【非常重要】课程资料等多个文件\\【非常重要】课程资料\\CLASSDATA_ch02基础语言入门:从零开始学习Python\\CLASSDATA_ch02基础语言入门:从零开始学习Python\\商铺数据.csv", "r", encoding="utf8") for i in f.readlines()[:6]: print(i.split(","))