依据人口普查数据预测个人的收入状况(分类)
数据分析作业代写 数据预处理:检查数据集是否存在缺失值,如果存在,则消除它们缺失值(任意方法均可)。数据预处理:标称属性需要进行数值处理(参考我们此前对german_credict数据集的处理方法)其他数据探索方法,更好地了解数据。选用合适的分类模型,划分训练数据和测试数据
一、目标: 数据分析作业代写
根据美国1994年的人口普查数据,建立分类模型,能正确判别某个人的收入是否超过5万美元/年(二分类问题)
二、数据集:
census_income.csv
【属性】
数据集包含14个属性,其中,年龄、final weight、最高学历、资本收入、资本指出和每周小时数是数值属性,其余是标称属性。
三、要求(部分要求如果难以实现,允许不完成,只要把数据挖掘过程描述清楚即可): 数据分析作业代写
- 数据预处理:检查数据集是否存在缺失值,如果存在,则消除它们缺失值(任意方法均可)。
- 数据预处理:标称属性需要进行数值处理(参考我们此前对german_credict数据集的处理方法)
- 其他数据探索方法,更好地了解数据。
- 选用合适的分类模型,划分训练数据和测试数据,构建分类模型。并解释模型的参数选择方法和最优参数。
- 选择合适的性能评价指标评价模型的性能。
- 分析算法参数对分类模型结果的影响。
- 绘制有关训练结果或训练过程的图。
- 完成“xxx数据挖掘分析报告”。
- 准备10分钟左右的ppt报告,在第17周随堂讲述本组的主要工作。更多代写: HomeWork cs作业 金融代考 postgreSQL代写 IT assignment代写 统计代写 留学生论文代写助力
发表回复
要发表评论,您必须先登录。