频道栏目
首页 > 网络 > 云计算 > 正文

特征工程小知识点罗列总结

2018-08-04 14:15:58           
收藏   我要投稿

1、特征提取

设定因变量

提取自变量:

因变量与自变量的相关系数

决策树(基于熵)

连续值处理为离散值

业务逻辑

2、缺失值处理

平均值

业务逻辑统一值

模型拟合

3、异常值识别

1、基本统计量的分析(pandas.dataframe.describe())

数量,平均值,最大最小值,四分位值

2、箱线图

上界:上四分位+1.5四分位间距

下界:下四分位-1.5四分位间距

上一篇:kafkaserver启动流程&shutdown实现实例教程
下一篇:数据分析笔试题分享
相关文章
图文推荐

关于我们 | 联系我们 | 广告服务 | 投资合作 | 版权申明 | 在线帮助 | 网站地图 | 作品发布 | Vip技术培训 | 举报中心

版权所有: 红黑联盟--致力于做实用的IT技术学习网站