BDC2019

2019中国高校计算机大赛——大数据挑战赛 第三名解决方案

Github星跟蹤圖

BDC2019

2019中国高校计算机大赛——大数据挑战赛

鸡你太美(初赛复赛均第三名)解决方案,包含全部代码、文档及答辩PPT

赛题描述:

搜索中一个重要的任务是根据query和title预测query下doc点击率,本次大赛参赛队伍需要根据脱敏后的数据预测指定doc的点击率,结果按照指定的评价指标使用在线评测数据进行评测和排名,得分最优者获胜。

任务分类:

  • 短文本匹配
  • 点击率预估

数据说明:

train_data.sample是官方给的训练样本示例,数据按列分割,分隔符为”,",为不带表头的CSV数据格式。数据格式如下:, 列名, 类型, 示例, ---, ---, ---, query_id, int, 3, query, hash string,term空格分割, 1 9 117, query_title_id, title在query下的唯一标识, 2, title, hash string,term空格分割, 3 9 120, label, int, 取值{0, 1}, ## 其他方案


感兴趣就给个star吧:-D

最后感谢两位队友@Han和@hcccccccc

主要指標

概覽
名稱與所有者ShusenTang/BDC2019
主編程語言Jupyter Notebook
編程語言Jupyter Notebook (語言數: 1)
平台
許可證MIT License
所有者活动
創建於2019-08-20 08:00:34
推送於2020-02-16 14:48:33
最后一次提交2020-02-16 22:48:33
發布數0
用户参与
星數122
關注者數5
派生數26
提交數17
已啟用問題?
問題數2
打開的問題數1
拉請求數0
打開的拉請求數0
關閉的拉請求數0
项目设置
已啟用Wiki?
已存檔?
是復刻?
已鎖定?
是鏡像?
是私有?