数据分析作业代写 依据人口普查数据预测个人的收入状况

数据分析作业代写

依据人口普查数据预测个人的收入状况(分类)

数据分析作业代写 数据预处理:检查数据集是否存在缺失值,如果存在,则消除它们缺失值(任意方法均可)。数据预处理:标称属性需要进行数值处理(参考我们此前对german_credict数据集的处理方法)其他数据探索方法,更好地了解数据。选用合适的分类模型,划分训练数据和测试数据

一、目标: 数据分析作业代写

根据美国1994年的人口普查数据,建立分类模型,能正确判别某个人的收入是否超过5万美元/年(二分类问题)

 

 

二、数据集:

census_income.csv

 

【属性】

数据集包含14个属性,其中,年龄、final weight、最高学历、资本收入、资本指出和每周小时数是数值属性,其余是标称属性。

数据分析作业代写

 

 

三、要求(部分要求如果难以实现,允许不完成,只要把数据挖掘过程描述清楚即可): 数据分析作业代写


  1. 数据预处理:检查数据集是否存在缺失值,如果存在,则消除它们缺失值(任意方法均可)。

  2. 数据预处理:标称属性需要进行数值处理(参考我们此前对german_credict数据集的处理方法)

 


  1. 其他数据探索方法,更好地了解数据。

 


  1. 选用合适的分类模型,划分训练数据和测试数据,构建分类模型。并解释模型的参数选择方法和最优参数。

 


  1. 选择合适的性能评价指标评价模型的性能。

 


  1. 分析算法参数对分类模型结果的影响。

 

 


  1. 绘制有关训练结果或训练过程的图。

 


  1. 完成“xxx数据挖掘分析报告”。

 

 


  1. 准备10分钟左右的ppt报告,在第17周随堂讲述本组的主要工作。约翰霍普金斯大学彭博公共卫生学院代写 更多代写: HomeWork cs作业     金融代考    postgreSQL代写         IT assignment代写     统计代写  留学生论文代写助力

发表回复

客服一号:点击这里给我发消息
客服二号:点击这里给我发消息
微信客服1:essay-kathrine
微信客服2:essay-gloria