泰坦尼克号的沉没是历史上最著名的还难事件之一,在船上的2224名乘客和机组人员中,共造成1502人死亡。本次项目的目标是运用机器学习工具来预测哪些乘客能够幸免于难。
项目过程导入并探索数据
处理缺失值,删除与预测无关的特征
将分类变量转换为数值型变量
实例化模型并进行交叉验证
模型预测
调参,得到最好的超参数
项目代码(Jupyter)import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn.model_selection import GridSearchCV from sklearn.model_selection import cross_val_score import matplotlib.pyplot as plt