BDC2019

2019中国高校计算机大赛——大数据挑战赛 第三名解决方案

Github stars Tracking Chart

BDC2019

2019中国高校计算机大赛——大数据挑战赛

鸡你太美(初赛复赛均第三名)解决方案,包含全部代码、文档及答辩PPT

赛题描述:

搜索中一个重要的任务是根据query和title预测query下doc点击率,本次大赛参赛队伍需要根据脱敏后的数据预测指定doc的点击率,结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。

任务分类:

  • 短文本匹配
  • 点击率预估

数据说明:

train_data.sample是官方给的训练样本示例,数据按列分割,分隔符为”,",为不带表头的CSV数据格式。数据格式如下:, 列名, 类型, 示例, ---, ---, ---, query_id, int, 3, query, hash string,term空格分割, 1 9 117, query_title_id, title在query下的唯一标识, 2, title, hash string,term空格分割, 3 9 120, label, int, 取值{0, 1}, ## 其他方案


感兴趣就给个star吧:-D

最后感谢两位队友@Han和@hcccccccc

Main metrics

Overview
Name With OwnerShusenTang/BDC2019
Primary LanguageJupyter Notebook
Program languageJupyter Notebook (Language Count: 1)
Platform
License:MIT License
所有者活动
Created At2019-08-20 08:00:34
Pushed At2020-02-16 14:48:33
Last Commit At2020-02-16 22:48:33
Release Count0
用户参与
Stargazers Count122
Watchers Count5
Fork Count26
Commits Count17
Has Issues Enabled
Issues Count2
Issue Open Count1
Pull Requests Count0
Pull Requests Open Count0
Pull Requests Close Count0
项目设置
Has Wiki Enabled
Is Archived
Is Fork
Is Locked
Is Mirror
Is Private