2012年“深圳杯”全国大学生数学建模夏令营B题四川师范大学数模B题
本文档由 Reaganlee 分享于2012-09-24 13:25
摘 要为从本网用户资料表中识别出“职场新人”特征用户,并基于识别出的样本对不详手机价格、不详职业类型分别进行估计,进一步识别“职场新人”的教育背景。本文通过分析和预处理本网用户资料表中的数据,给出识别“职场信人”的标准;建立数学模型判别手机价格、职业类型;最后细分“职场新人”样本,多步骤讨论,识别“职场新人”的教育背景。针对问题(1),由于本网用户资料表的缺失数据,故先对年龄、套餐档次使用多重插补方法进行缺失值处理。由于变量多和相关性弱的原因,故使用数据降维方法,构造了一系列变量指标来描述职场新人的特征。用熵权Topsis法对18~28年龄范围数据进行综合评价,确定“职场新人”。针对问题(2),鉴于“职场新人”待判样本的手机价格呈正态分布,故先对其等百分比划分,并针对较高手机价格的数目少、离散度大的特点进行聚类分析,确定8类手机分组,再结合逐步判别方法进行判别。针对问题(3),由于在第..
分享:
君,已阅读到文档的结尾了呢~~