推荐专题：

1200字范文 > 第二届中国移动“梧桐杯”大数据应用创新大赛-基于移动大数据的网约车司机识别

第二届中国移动“梧桐杯”大数据应用创新大赛-基于移动大数据的网约车司机识别

时间：2022-08-31 15:12:19

相关推荐

第二届中国移动“梧桐杯”大数据应用创新大赛-基于移动大数据的网约车司机识别

大家好，我是轶扬，本文给大家分享一下最近半个多月参加的一个机器学习数据挖掘类比赛，移动主办的梧桐杯——基于移动大数据的网约车司机识别，这是一个结构化表格类比赛，提供的数据不仅包含用户的基本信息，还包含了由通信网采集到的信令分析而得的用户位置移动轨迹信息。本文从数据探索、数据预处理、特征工程、模型训练与融合等多个方面，具体介绍了我提出的解决方案，前期只使用基于常规信息构造的特征，模型线上分数在0.94+，加入基于移动轨迹信息构造的特征后，线上分数为0.95+，线上排名top 3%。

目录

赛题背景任务目标初步了解数据解决方案改进方向

赛题背景

随着社会的进步和经济的发展，在交通领域，诞生一系列“互联网+“的出行方式，慢慢的，网上打车的习惯已经成为人们的日常，网约车的数量也在与日俱增。

如何从普通用户中有效鉴别出网约车司机，为内部流量推广和外部第三方企业合作扩展提供助力，在实际商业应用中有着重要的意义。

本届竞赛将从真实场景和实际应用出发，在智慧交通领域新增了更具挑战性、更加务实的任务，期待参赛选手们能在这些任务上相互切磋、共同进步。

任务目标

从普通用户中有效鉴别出网约车司机（01分类问题）

评分标准： Score = 0.5 * AUC+0.5 * F1（Macro F1）

初步了解数据

查看官方的数据集介绍，了解数据集由几个表组成、主键是什么、表之间有什么关系，每个字段是什么含义

数据样本分为两份，第一份包含基础信息，通话信息，行为信息等常规数据集，第二份为位置数据集（用户位移的详细数据），相关数据集如下：

常规基础数据集（提供三个月数据）

位置数据集（近三天的唯一数据，经纬度取自WGS84坐标系）

汇总两张数据表所提供的字段，并按照具体字段对应的业务类型进行分类：

从以上数据介绍中，可以看到对于每个用户都有对应的基础信息，例如个人身份信息、手机通话信息和各类app使用情况，因此确定第一张表的数据是直接可以用于建模的。

第二张表是用户的位置轨迹信息，提供了每个用户三天的路程信息，主要包括进出每个基站的时间、基站所在的经纬度，以及表明是哪一天的信息，实时的反应了一个用户的行为轨迹信息，如驻留地、驻留时长、位移距离、位移速度等，这张表的信息不能直接用于建模，因此需要做进一步特征挖掘。

解决方案

代码github链接：待整理后上传

改进方向

从实际业务角度出发，结合网约车的行驶特点和运营过程中的手机使用特点，进一步挖掘位置轨迹类特征和常规信息类特征。对数据集中的某些干扰样本进行甄别、去除。二分类阈值在线上和线下数据集不一致，需要测榜调整阈值。

欢迎各位一起交流学习～

第二届中国移动“梧桐杯”大数据应用创新大赛-基于移动大数据的网约车司机识别线上0.95+ 方案

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

50万奖金池：欢迎全球学子报名参加中国移动第二届梧桐杯大数据应用创新大赛湖北赛道

2020-02-10

“梧桐杯”中国移动大数据应用创新大赛 - 智慧金融赛道Baseline

2020-07-29

“梧桐杯”中国移动大数据应用创新大赛 - 智慧城市赛道baseline

2019-12-02

数据分析初试：“梧桐杯”中国移动大数据应用创新大赛 - 智慧城市赛道

2023-11-12

最近发布

桃花源游记作文 1200字

2024-08-21

【精选】父亲节的作文1200字集合八篇

2024-08-21

父亲的名言1200字

2024-08-21

红楼梦笔下的林黛玉：一个完整的1200字作文素材集锦

2024-08-21

畅谈生活中的乐趣：1200字话题作文

2024-08-21

英雄广场夜景：灯光璀璨的魅力与浪漫景致

2024-08-21

同家人共赏春晚：1200字完整作文素材汇总

2024-08-21

普通人写1200个字要多久

2024-08-21

精选牡丹颂的作文1200字

2024-08-21

安吉拉的废稿童话作文1200字

2024-08-21

推荐专题

好评中国1200字庄子1200字解析与相遇作文1200字关于诚信作文1200字学会生存作文1200字短信误发1200字回归亲情征文1200字学生旷课1200字检讨 1200字作文赏析摘抄午后书香作文1200字段落摘抄1200字傅雷家书1200字读后感教案1200字左右 1200字作文优美成长作文1200字