决策树
决策树步骤
说到决策树,我最近真是在这个上面栽了个跟头。那是在2018年,我在一个大数据分析的项目里,那时候我们团队接了一个大客户的项目,要做的是预测客户流失。
那时候我年轻气盛,觉得自己在机器学习这块儿挺有研究的,就直接上手了。一开始,我就选了决策树模型,因为它简单易懂,对新手友好。结果呢,就出了点岔子。
我根据数据集的特征,画了个决策树,然后就开始训练。结果模型效果不好,准确率就那么50%多,远远达不到预期。客户那边催得紧,我也急得团团转。
后来,我仔细分析了数据,发现有几个特征变量的分布特别不均匀,而且还有一些缺失值没处理。我那时候不太懂,就想着随便处理一下算了。结果,处理得不好,模型训练出来的效果自然不行。
最后,我只能硬着头皮去找专家,请教他们怎么处理。他们告诉我,要好好处理缺失值,对那些不均匀的特征变量要进行归一化处理,还要调整一下决策树的参数。
那段时间真的是把我折磨得够呛。不过,从那以后,我对决策树的理解深了不少,也学会了在实际项目中如何运用。现在回想起来,真是踩了一个大坑啊。不过,坑是踩了,但也长了记性,不是吗?
那时候我年轻气盛,觉得自己在机器学习这块儿挺有研究的,就直接上手了。一开始,我就选了决策树模型,因为它简单易懂,对新手友好。结果呢,就出了点岔子。
我根据数据集的特征,画了个决策树,然后就开始训练。结果模型效果不好,准确率就那么50%多,远远达不到预期。客户那边催得紧,我也急得团团转。
后来,我仔细分析了数据,发现有几个特征变量的分布特别不均匀,而且还有一些缺失值没处理。我那时候不太懂,就想着随便处理一下算了。结果,处理得不好,模型训练出来的效果自然不行。
最后,我只能硬着头皮去找专家,请教他们怎么处理。他们告诉我,要好好处理缺失值,对那些不均匀的特征变量要进行归一化处理,还要调整一下决策树的参数。
那段时间真的是把我折磨得够呛。不过,从那以后,我对决策树的理解深了不少,也学会了在实际项目中如何运用。现在回想起来,真是踩了一个大坑啊。不过,坑是踩了,但也长了记性,不是吗?
决策树英文
这玩意儿简单,就是像树一样分步骤解决问题。先问个问题,然后根据答案再问,一直问到有答案为止。上周刚处理一个,就是分好几层问,层层递进。
决策树理论
决策树,就是用树形图来表示决策过程。先问个问题,再分几个分支,每个分支再问问题,最终指向结果。上周刚处理一个,简单来说,就是层层筛选,找到最优解。你自己看,哪个分支最合理。