人工智能技术已经深度融入信息生产和传播的各个环节,智能化也成为媒体未来的趋势和发展方向,智能信息发展需要更多技术和应用创新。由中国人工智能学会主办,新浪新闻承办的2021中国AI+创新创业大赛——智能信息创新与应用大赛诚挚邀请研究人员、产业从业人员、高校学生以及爱好者参赛,助力智能信息发展!
主办单位:中国人工智能学会
承办单位:新浪新闻、微博校园
支持单位:哈尔滨工业大学、清华大学、复旦大学
u 专家顾问:
刘挺 | 哈尔滨工业大学计算学部主任兼计算机科学与技术学院院长 |
王巍 | 微博COO、新浪移动CEO、新浪AI媒体研究院院长 |
u 专家评审:
王宏志 | 哈尔滨工业大学计算机科学与技术学院教授 |
王朝坤 | 清华大学软件学院长聘副教授 |
何震瀛 | 复旦大学计算机科学技术学院副教授 |
李云辉 | 新浪移动算法负责人、新浪AI媒体研究院副院长 |
一、 赛题背景
信息流推荐是新闻信息资讯应用所关注的重要问题之一,其推荐效果将直接影响一系列用户粘性指标,如用户的刷新、时长、留存等。
信息流推荐所涉及的内容样式相对多样,如图文、图集、视频、短视频等,全网热点、优质⻓尾、领域垂直等,且优化目标多样,比如点击、转发、收藏、点赞、关注等皆可作为目标。
如何在信息流这种复杂的推荐场景,进行多目标优化,提升用户体验,是业内的主流研究热点和持续优化方向。
二、 赛题任务
大赛官方给定一批新闻用户在信息流场景的推荐日志,参赛队伍根据用户的历史推荐行为数据,进行推荐算法建模,预测这批用户在不同内容的互动行为概率,包括点击、评论、点赞、关注;
同时,官方提供一批训练集给参赛队伍进行算法建模训练,参赛队伍提交模型和设计方案。
三、 参赛要求
1.参赛对象
研究人员、产业从业人员、高校学生以及爱好者。
2.参赛形式
每位选手可单人或组队参赛,每位选手只能加入一支队伍,每支队伍参赛人员不超过5人。参赛队伍须设置1名队长、1名秘书。
3.报名方式
2021年8月20日前,参赛队伍在大赛网站报名系统(http://2021aichina.caai.cn/)在线报名,录入参赛队伍信息,完成报名。
本次大赛将采用线上初赛和答辩方式进行,最终取得名次的队伍将进入2021中国AI+创新创业大赛全国总决赛。
赛程安排:
ü 报名截止日期:2021年8月20日
ü 初赛作品提交截止日期:2021年9月5日
ü 答辩名单公布日期:2021年9月10日
ü 答辩和颁奖时间:2021年9月中旬
ü 2021中国AI+创新创业大赛全国总决赛:2021年10月
1. 线上初赛
2021年9月5日24:00前,参赛队伍将算法模型和设计方案邮件至ai_media@vip.sina.com,主办方将对参赛队伍产生的测试结果进行一致性评估,最终得到各参赛队伍初赛作品的评测结果。
(注:参赛者需要自行检查提交文件的正确性,确认无误后再进行提交,主办方不负责对提交文件进行更改和调整。若因故出现数据更新、评审代码更新、作弊检查等问题,主办方有权对参赛结果进行重新测评。参赛内容应该是参赛队员独立设计、开发完成的作品,严禁抄袭、剽窃等行为。凡发现抄袭、剽窃等行为,将取消参赛队伍的参赛资格,并追究相关单位的责任。)
2. 线上答辩
(1) 时间:9月中旬
(2) 答辩方式:初赛成绩排名前十的队伍将入围线上答辩。评委组将对算法模型和答辩表现进行评审和打分,每支参赛队伍答辩时间为20分钟。
一、奖项设置
本次比赛最终选出冠军1队、亚军2队、季军2队,对应奖励如下:
冠军(1名):20000元;
亚军(2名):10000元;
季军(2名):5000元;
获奖团队还将获得荣誉证书。
一、评估指标
本赛程采用uAUC作为单个行为预测结果的评估指标,根据点击、评论、点赞、关注四个目标的uAUC值进行加权平均,作为⽐赛的最终分数。
uAUC定义为不同用户下AUC的平均值,计算公式如下:
其中,n为测试集中的有效用户数,有效用户指的是对于某个待预测的行为,过滤掉测试集中全是正样本或全是负样本的用户,AUCi为第i个有效用户的预测结果的AUC值。
二、数据格式
特征编码 | 小时表字段名 | 字段类型 | 特征说明 |
2000011 | uuid_sign | Long | 文章唯一id |
2010031 | art_content_len | Int | 正文长度 |
2010041 | art_title_len | Int | Title标题长度 |
2010181 | art_ctime | Long | 文本的创建时间 |
2020421 | art_manually_tags | List[String] | 人工标注的新闻编辑标签 |
2010021 | author_uid | Long | 作者UID |
2020101 | video_dura | Int | 视频时长 |
2020091 | video_cat_tag | Long | 机器标注的视频分类标签 |
2020081 | auto_labels | String | 机器标注的标签词 |
2020061 | auto_keywords | List[String] | 机器标注的的关键词 |
2020111 | art_cat | String | 机器标注的文章一级分类 |
2020121 | art_subcat | String | 机器标注的文章二级分类 |
2020411 | vquality | List[Float] | 视频属性,格式feature1,feature2,…,feature7 |
1000011 | device_id_sign | Long | 设备id |
9010011 | req_time | Long | 请求接口时间 |
9010041 | is_click | Int | 是否点击 |
1030252 | watch_dura | Int | 观看时长 |
1030602 | duration | Float | 文章阅读时长 |
2030702 | is_attention | Int | 是否关注 |
2030732 | is_share | Int | 是否分享 |
2030712 | is_collection | Int | 是否收藏 |
2030722 | is_like | Int | 是否赞 |
2030692 | is_comment | Int | 是否评论 |
三、数据使用说明
参赛者对所有数据信息予以严格保密,竞赛用的训练数据集和测试数据集归新浪新闻所有,数据信息仅用于此次竞赛,在未得到主办方事先许可的情况下,不得披露给任何其他人士或机构,不得分发传播,不得用作其他用途。参赛选手如发表论文、公开演讲等使用到比赛数据,需事先获得主办方许可,并不得对数据集或基于数据集的研究成果、产出物进行出售、转让或用于任何商业活动。
1. 参赛费用:本次大赛不收取任何费用。
2. 餐饮住宿:参加全国总决赛队伍在决赛期间的食宿费用、交通费用及其他费用均自理。
3. 竞赛秘书处联系方式
报名网站:http://2021aichina.caai.cn/
联系邮箱:ai_media@vip.sina.com
4. 参赛须知:参赛队伍需仔细、认真、审慎阅读竞赛规则和通知要求,同意并接受其约束,遵守由主办方制定的各项规则和制度,尊重并接受大赛评委会做出的评判、大赛主办方做出的决定等。未尽事宜,由大赛主办方负责解释。