欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

GitHub 干货 | 各大数据竞赛 Top 解决方案开源汇总

11-16 IT文章

原标题:GitHub 干货 | 各大数据竞赛 Top 解决方案开源汇总

AI 科技评论编者按:现在,越来越多的企业、高校以及学术组织机构通过举办各种类型的数据竞赛来「物色」数据科学领域的优秀人才,并借此激励他们为某一数据领域或应用场景找到具有突破性意义的方案,也为之后的数据研究者留下有价值的经验。

Smilexuhc 在 GitHub 社区对各大数据竞赛名列前茅的解决方案进行了整理,包括纯数据竞赛、自然语言处理(NLP)领域数据赛事的 Top 解决方案。对这些赛事感兴趣的小伙伴可以一起来看一下这篇干货满满的汇总贴:

纯数据竞赛

1.2018 科大讯飞 AI 营销算法大赛

本次大赛要求参赛者基于提供的讯飞 AI 营销云的海量广告投放数据,通过人工智能技术构建来预测模型预估用户的广告点击概率。比赛提供了 5 类数据,包括基础广告投放数据、广告素材信息、媒体信息、用户信息和上下文信息,总共为 1001650 初赛数据 和 1998350 条复赛数据(复赛训练数据为:初赛数据+复赛数据)。

Rank1:

2.2018 IJCAI 阿里妈妈搜索广告转化预测

本次比赛要求参赛者以阿里电商广告为研究对象,基于提供的淘宝平台的海量真实交易数据,通过人工智能技术构建来预测模型预估用户的购买意向。本次比赛为参赛者提供了 5 类数据,包括基础数据、广告商品信息、用户信息、上下文信息和店铺信息。用于初赛的数据包含了若干天的样本;最后一天的数据用于结果评测,对选手不公布;其余日期的数据作为训练数据,提供给参赛选手。

Rank1: 

Rank2: 

 

Rank3:  

Rank8:  

Rank8:  

Rank9(第一赛季): 

3.2018 腾讯广告算法大赛

本次算法大赛的题目源自一个基于真实业务场景的广告技术产品——腾讯社交广告 Lookalike 相似人群拓展。本题目要求参赛者基于提供的几百个种子人群、海量候选人群对应的用户特征,以及种子人群对应的广告特征,构建算法准确标定测试集中的用户是否属于相应的种子包。

出于业务数据安全保证的考虑,比赛所提供的所有数据均为脱敏处理后的数据。整个数据集分为训练集和测试集:训练集中标定了人群中属于种子包的用户与不属于种子包的用户(即正负样本),测试集将检测参赛选手的算法能否准确标定测试集中的用户是否属于相应的种子包,训练集和测试集所对应的种子包完全一致。初赛和复赛所提供的种子包除量级有所不同外,其他的设置均相同。

Rank3:  

rank6:  

Rank7:  

Rank9:  

Rank10:  

rank10(初赛):  

Rank11:  

 

4.2018 高校大数据挑战赛—快手活跃用户预测 

本次大赛要求参赛者基于脱敏和采样后的数据信息,预测未来一段时间活跃的用户。参赛队伍需要设计相应的算法进行数据分析和处理,比赛结果按照指定的评价指标使用在线评测数据进行评测和排名。大赛提供的数据为脱敏和采样后用户行为数据,日期信息进行统一编号,第一天编号为 01,第二天为 02,以此类推,所有文件中列使用 tab 分割。

Rank1:  

 

Rank4:  

Rank13(初赛 a 榜 rank2;b 榜 rank5): 

Rank15:  

Rank20:  

5.2018JDATA 用户购买时间预测

本次大赛要求参赛者基于给定的近 3 个月购买过目标商品的用户以及他们在前一年的浏览、购买、评价等数据信息,自行设计数据处理相关操作、训练模型,从而预测未来 1 个月内最有可能购买目标品类的用户,并预测他们在考察时间段内的首次购买日期。数据主要包括用户基本信息、SKU 基本信息、用户行为信息、用户下单信息及评价信息。

Rank9:

6.2018 DF 风机叶片开裂预警

本次大赛要求参赛者基于风机 SCADA 实时数据,通过机器学习、深度学习、统计分析等方法建立叶片开裂早期故障检测模型,对叶片开裂故障进行提前告警。比赛提供的数据集包括训练集和测试集:训练集一共有 25 类风机共 4 万个样本,测试集没有风机编号,共 8 万个样本。

Rank2:

7.2018 DF 光伏发电量预测

本次大赛要求参赛者在分析光伏发电原理的基础上,论证辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,并根据光伏电站 DCS 系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/3991.html