1. 读邮件数据集文件,提取邮件本身与标签。
测试数据:
链接:https://pan.baidu.com/s/1BiftJ1BBggybitfqeZbSDQ
提取码:en47
列表
numpy数组
代码如下:
import csv sms = open(\'../data/SMSSpamCollection\', \'r\', encoding=\'utf-8\') data = csv.reader(sms, delimiter=\'\t\') for i in data: print(i) sms.close()