2018 男足世界杯(128 场比赛)基本统计信息
完整数据分析报告:https://github.com/adi0229/ML-DL/blob/master/fifa2018.ipynb
数据特征包含:
|
|
随机森林分类器(Baseline)及特征重要性
|
|
|
|
|
|
随机森林分类器(微调)及特征重要性变化
|
|
|
|
分析:「随机森林」准确率(60% - 72%)提升之后
扑救、传球准确率、射门命中率的重要性上升
角球、全场跑动距离的重要性下降
符合足球战术常识
Xgboost 分类器(微调)及特征重要性
|
|
|
|
Xgboost发现进球是唯一重要特征。
简单粗暴,也更符合足球常理。进球多,更容易获胜,获胜一方容易出 MVP 球员。其他数据的关系并不大。12perm_xgb = PermutationImportance(xgb, random_state=1).fit(val_X, val_y)eli5.show_weights(perm_xgb, feature_names = val_X.columns.tolist())
特征重要性(Permutation Importance)