商业实战之建模操作演示3
作者:暂无发布时间:暂无

1.本节课所讲内容如图所示。



2.Excel表中【dv_response】列为被挑选出可能会参与模型中表示【个体特征的变量】与【目标变量】之间的相关关系。【dv_response】列后的为【待定变量】之间是否有较明显的贡献性。



3.对角线上为相同变量1,除1外【红色】部分为几组变量之间可能会有较明显的贡献性。



4.建模中主要采用的为【proc logistic】语句。首先将刚才步骤筛选出的变量做成红变量【var_list】,将其放到一起。



5.选取部分变量来运行【proc logistic】语句,将变量的【剔除概率】和【选入概率】均调制至【0.05】的水平,点击【代码】下工具栏中第一个按钮,运行程序。得出本次调试【c】值为【0.761】,【一致部分所占百分比】为【76.1】。



6.选中查看所需变量vif情况的语句,点击【运行】按钮。根据前方所述标准,【方差膨胀】系数在【2】以下。若vif大于【2】则考虑去除一个变量或者对其中一个变量进行变形或替换等方式。



7.选中查看【之前运行逻辑回归过程中输出参数估计结果】的语句,点击【运行】按钮。通过【ProbChiSq】列可知结果都是显著的。【Final Model】列为选出的表示个体特征的变量与【Estimate】列中的数据呈相关关系。



8.首先看的是【Estimate】列的正负相关是否是可解释的。第四行的变量为已做过重编码的变量,其原始变量为表示【过去24个月中的订单数】。将其重编码实则为将其异常值的上下限进行确定,将缺失值进行填补。其相关性是可以解释的。



9.第四行的变量其原始变量为【自上次浏览网站后过去的时间】,将其重编码为将其异常值的上下限进行确定,将缺失值进行填补。其相关性是可以解释的。



10.【贡献度】的计算方法为将【第一项的标准差】除【所有标准差的和】。为保持模型稳定性,其前几个变量的贡献值应在【30%】以下并不出现一家独大的情况。



11.选中【对前边vif部分可视化补充】部分的语句,点击【运行】按钮。用于确定两个变量之间没有过大的贡献性。



12.反复调试模型的过程为:【重复建模流程】、【更换变量清单】及【尽量去除相互有较强贡献性的变量】。



13.选中【所要验证数据集】的语句,点击【运行】按钮。选中【对p_d进行排序,为p_d分配rank】的语句,点击【运行】按钮。



14.选中【计算每个rank的响应率】的语句,点击【运行】按钮。



15.上方曲线表示的是【响应率】随着模型得分等级的变化。下方曲线纵轴代表的为【响应的百分比】,其计算方式为:每一个模型的分组上,响应人数占总体响应人数的百分比。



16.选中【输出模型】所需要的代码,点击【运行】按钮。将得分输出到指定的路径中。



17.通过输出的模型可得出【响应度】从而确定其所处rank值的位置。




特别声明:以上文章内容仅代表作者本人观点,不代表虎课网观点或立场。如有关于作品内容、版权或其它问题请与虎课网联系。
500+精品图书
20G学习素材
10000+实用笔刷
持续更新设计模板
立即领取

下载虎课APP

随时随地学技能
APP更方便
每天免费学课程
下载虎课网APP
随时随地学海量会员教程
特惠
充值
7折购
今日还在继续学习的你,太棒了!
7
折扣券可用于
年费无限VIP
立 即
使 用
此活动优惠不可与其他活动叠加使用
有效期:000000
消息
登录即可查看消息记录
建议
意见
官方
客服
在线咨询客服热线

您可以与在线客服进行沟通获得帮助

工作日:9:00~22:00节假日:9:00~18:00

联系在线客服

您可以电话联系客服进行沟通获得帮助

工作日:9:30~18:30

400-862-9191
虎课
积分
免费学习90000+个教程!
配套素材、源文件一键下载!
昨日学员已学习了36,309
并提交了230份作业!
登录后立即学习!
loading
微信扫码关注即可登录
您需要同意协议才可以进行登录
登录虎课网,每天免费学课程全站 90000+ 视频会员教程 | 每日可免费学 1
为确保账户信息安全
请先进行真实姓名验证后进行充值付款
立即验证