BDC2019

2019中国高校计算机大赛——大数据挑战赛 第三名解决方案

Github星跟踪图

BDC2019

2019中国高校计算机大赛——大数据挑战赛

鸡你太美(初赛复赛均第三名)解决方案,包含全部代码、文档及答辩PPT

赛题描述:

搜索中一个重要的任务是根据query和title预测query下doc点击率,本次大赛参赛队伍需要根据脱敏后的数据预测指定doc的点击率,结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。

任务分类:

  • 短文本匹配
  • 点击率预估

数据说明:

train_data.sample是官方给的训练样本示例,数据按列分割,分隔符为”,",为不带表头的CSV数据格式。数据格式如下:, 列名, 类型, 示例, ---, ---, ---, query_id, int, 3, query, hash string,term空格分割, 1 9 117, query_title_id, title在query下的唯一标识, 2, title, hash string,term空格分割, 3 9 120, label, int, 取值{0, 1}, ## 其他方案


感兴趣就给个star吧:-D

最后感谢两位队友@Han和@hcccccccc

主要指标

概览
名称与所有者ShusenTang/BDC2019
主编程语言Jupyter Notebook
编程语言Jupyter Notebook (语言数: 1)
平台
许可证MIT License
所有者活动
创建于2019-08-20 08:00:34
推送于2020-02-16 14:48:33
最后一次提交2020-02-16 22:48:33
发布数0
用户参与
星数122
关注者数5
派生数26
提交数17
已启用问题?
问题数2
打开的问题数1
拉请求数0
打开的拉请求数0
关闭的拉请求数0
项目设置
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?