数学中国

 找回密码
 注册
搜索
热搜: 活动 交友 discuz
查看: 2737|回复: 0

第一届太普华南杯数据挖掘竞赛试题及优秀论文

[复制链接]
发表于 2015-8-17 16:00 | 显示全部楼层 |阅读模式


说明:1、参赛选手可从下述试题中任选一题作答,并在论文报告中标明
2、论文等级会综合考虑论文质量和难度系数

试题一 航空客运信息挖掘(难度系数:1.0)
很多人都听说过马来西亚的亚洲航空、美国的西南航空等公司的大名。这些公司成功的秘诀就是擅于提高上座率。为了争到客源,有些公司甚至提出了与长途巴士进行价格竞争的口号。如此看来,国内航空公司并不是把其它航空公司当作主要竞争对象,主要对手应当是火车或长途汽车。适当的低票价,将使航空资源得到充分利用,如果空座率居高不下,哪怕票价卖得很高,本身就已经出现了资源性亏损。
本例就是期望从航空公司感兴趣的主题,例如流失预测、客户细分和客户价值评估等方面,通过数据挖掘技术,实现提升航空客运的上座率目标。
附件数据集来自国内某航空公司的会员数据,共有62988个样本,每个样本有63个属性,各属性说明见“变量含义”Sheet页。除了每个客户的基本资料外,该数据集还包含了一个观测窗(2年)内8个季度的用户飞行数据,包括乘机次数、里程、积分等。参赛者可尽量使用任何的数据挖掘技术来发现尽可能多的知识,建议的数据挖掘主题包括但不限于建立客户流失模型、客户细分和客户价值评估。





















您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|数学中国 ( 京ICP备05040119号 )

GMT+8, 2024-5-16 23:36 , Processed in 0.068360 second(s), 16 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表