赛道9

专业赛:智能信息创新与应用大赛

赛事时间: 2021年8月20日截至报名

报名参赛
赛事背景
人工智能技术已经深度融入信息生产和传播的各个环节,智能化也成为媒体未来的趋势和发展方向,智能信息发展需要更多技术和应用创新。由中国人工智能学会主办,新浪新闻承办的2021中国AI+创新创业大赛——智能信息创新与应用大赛诚挚邀请研究人员、产业从业人员、高校学生以及爱好者参赛,助力智能信息发展!
  • 大赛背景
  • 人工智能技术已经深度融入信息生产和传播的各个环节,智能化也成为媒体未来的趋势和发展方向,智能信息发展需要更多技术和应用创新。由中国人工智能学会主办,新浪新闻承办的2021中国AI+创新创业大赛——智能信息创新与应用大赛诚挚邀请研究人员、产业从业人员、高校学生以及爱好者参赛,助力智能信息发展!

  • 组委会信息
  • 主办单位:中国人工智能学会

    承办单位:新浪新闻、微博校园

    支持单位:哈尔滨工业大学、清华大学、复旦大学

  • 大赛专家
  • u  专家顾问:

    刘挺

    哈尔滨工业大学计算学部主任兼计算机科学与技术学院院长

    王巍

    微博COO、新浪移动CEO、新浪AI媒体研究院院长

    u  专家评审:

    王宏志

    哈尔滨工业大学计算机科学与技术学院教授

    王朝坤

    清华大学软件学院长聘副教授

    何震瀛

    复旦大学计算机科学技术学院副教授

    李云辉

    新浪移动算法负责人、新浪AI媒体研究院副院长


  • 大赛规则
  • 一、 赛题背景

    信息流推荐是新闻信息资讯应用所关注的重要问题之一,其推荐效果将直接影响一系列用户粘性指标,如用户的刷新、时长、留存等。

    信息流推荐所涉及的内容样式相对多样,如图文、图集、视频、短视频等,全热点、优质尾、领域垂直等,且优化标多样,比如点击、转发、收藏、点赞、关注等皆可作为目标。

    如何在信息流这种复杂的推荐场景,进行多目标优化,提升户体验,是业内的主流研究热点和持续优化方向。

    二、 赛题任务

    大赛官方给定一批新闻户在信息流场景的推荐志,参赛队伍根据户的历史推荐行为数据,进推荐算法建模,预测这批户在不同内容的互动行为概率,包括点击、评论、点赞、关注;

    同时,官方提供批训练集给参赛队伍进算法建模训练,参赛队伍提交模型和设计方案。

    三、 参赛要求

    1.参赛对象

    研究人员、产业从业人员、高校学生以及爱好者。

    2.参赛形式

    每位选手可单人或组队参赛,每位选手只能加入一支队伍,每支队伍参赛人员不超过5人。参赛队伍须设置1名队长、1名秘书。

    3.报名方式

    2021年8月20日前,参赛队伍在大赛网站报名系统(http://2021aichina.caai.cn/)在线报名,录入参赛队伍信息,完成报名。

  • 赛程介绍
  • 本次大赛将采用线上初赛和答辩方式进行,最终取得名次的队伍将进入2021中国AI+创新创业大赛全国总决赛。

    赛程安排:

    ü  报名截止日期:2021年8月20日

    ü  初赛作品提交截止日期:2021年9月5日

    ü  答辩名单公布日期:2021年9月10日

    ü  答辩和颁奖时间:2021年9月中旬

    ü  2021中国AI+创新创业大赛全国总决赛:2021年10月

    1.    线上初赛

    2021年9月5日24:00前,参赛队伍将算法模型和设计方案邮件至ai_media@vip.sina.com,主办方将对参赛队伍产生的测试结果进行一致性评估,最终得到各参赛队伍初赛作品的评测结果。

    (注:参赛者需要自行检查提交文件的正确性,确认无误后再进行提交,主办方不负责对提交文件进行更改和调整。若因故出现数据更新、评审代码更新、作弊检查等问题,主办方有权对参赛结果进行重新测评。参赛内容应该是参赛队员独立设计、开发完成的作品,严禁抄袭、剽窃等行为。凡发现抄袭、剽窃等行为,将取消参赛队伍的参赛资格,并追究相关单位的责任。)

    2.    线上答辩

    (1) 时间:9月中旬

    (2) 答辩方式:初赛成绩排名前十的队伍将入围线上答辩。评委组将对算法模型和答辩表现进行评审和打分,每支参赛队伍答辩时间为20分钟。

    一、奖项设置

    本次比赛最终选出冠军1队、亚军2队、季军2队,对应奖励如下:

    冠军(1名):20000元;

    亚军(2名):10000元;

    季军(2名):5000元;

    获奖团队还将获得荣誉证书。

  • 数据与评测
  • 一、评估指标

    本赛程采uAUC作为单个行为预测结果的评估指标,根据点击、评论、点赞、关注四个目标的uAUC值进加权平均,作为赛的最终分数。

    uAUC定义为不同户下AUC的平均值,计算公式如下:

                                                   image.png

    其中,n为测试集中的有效户数,有效户指的是对于某个待预测的行为,过滤掉测试集中全是正样本或全是负样本的户,AUCi为第i个有效户的预测结果的AUC值。

     

    二、数据格式

    特征编码

    小时表字段名

    字段类型

    特征说明

    2000011

    uuid_sign

    Long

    文章唯一id

    2010031

    art_content_len

    Int

    正文长度

    2010041

    art_title_len

    Int

    Title标题长度

    2010181

    art_ctime

    Long

    文本的创建时间

    2020421

    art_manually_tags

    List[String]

    人工标注的新闻编辑标签

    2010021

    author_uid

    Long

    作者UID

    2020101

    video_dura

    Int

    视频时长

    2020091

    video_cat_tag

    Long

    机器标注的视频分类标签

    2020081

    auto_labels

    String

    机器标注的标签词

    2020061

    auto_keywords

    List[String]

    机器标注的的关键词

    2020111

    art_cat

    String

    机器标注的文章一级分类

    2020121

    art_subcat

    String

    机器标注的文章二级分类

    2020411

    vquality

    List[Float]

    视频属性,格式feature1,feature2,…,feature7

    1000011

    device_id_sign

    Long

    设备id

    9010011

    req_time

    Long

    请求接口时间

    9010041

    is_click

    Int

    是否点击

    1030252

    watch_dura

    Int

    观看时长

    1030602

    duration

    Float

    文章阅读时长

    2030702

    is_attention

    Int

    是否关注

    2030732

    is_share

    Int

    是否分享

    2030712

    is_collection

    Int

    是否收藏

    2030722

    is_like

    Int

    是否赞

    2030692

    is_comment

    Int

    是否评论


    三、数据使用说明

    参赛者对所有数据信息予以严格保密,竞赛用的训练数据集和测试数据集归新浪新闻所有,数据信息仅用于此次竞赛,在未得到主办方事先许可的情况下,不得披露给任何其他人士或机构,不得分发传播,不得用作其他用途。参赛选手如发表论文、公开演讲等使用到比赛数据,需事先获得主办方许可,并不得对数据集或基于数据集的研究成果、产出物进行出售、转让或用于任何商业活动。

     

  • 竞赛管理
  • 1.    参赛费用:本次大赛不收取任何费用。

    2.    餐饮住宿:参加全国总决赛队伍在决赛期间的食宿费用、交通费用及其他费用均自理。

    3.    竞赛秘书处联系方式

    报名网站:http://2021aichina.caai.cn/

    联系邮箱:ai_media@vip.sina.com

    4.    参赛须知:参赛队伍需仔细、认真、审慎阅读竞赛规则和通知要求,同意并接受其约束,遵守由主办方制定的各项规则和制度,尊重并接受大赛评委会做出的评判、大赛主办方做出的决定等。未尽事宜,由大赛主办方负责解释。

大赛背景

人工智能技术已经深度融入信息生产和传播的各个环节,智能化也成为媒体未来的趋势和发展方向,智能信息发展需要更多技术和应用创新。由中国人工智能学会主办,新浪新闻承办的2021中国AI+创新创业大赛——智能信息创新与应用大赛诚挚邀请研究人员、产业从业人员、高校学生以及爱好者参赛,助力智能信息发展!

组委会信息

主办单位:中国人工智能学会

承办单位:新浪新闻、微博校园

支持单位:哈尔滨工业大学、清华大学、复旦大学

大赛专家

u  专家顾问:

刘挺

哈尔滨工业大学计算学部主任兼计算机科学与技术学院院长

王巍

微博COO、新浪移动CEO、新浪AI媒体研究院院长

u  专家评审:

王宏志

哈尔滨工业大学计算机科学与技术学院教授

王朝坤

清华大学软件学院长聘副教授

何震瀛

复旦大学计算机科学技术学院副教授

李云辉

新浪移动算法负责人、新浪AI媒体研究院副院长


大赛规则

一、 赛题背景

信息流推荐是新闻信息资讯应用所关注的重要问题之一,其推荐效果将直接影响一系列用户粘性指标,如用户的刷新、时长、留存等。

信息流推荐所涉及的内容样式相对多样,如图文、图集、视频、短视频等,全热点、优质尾、领域垂直等,且优化标多样,比如点击、转发、收藏、点赞、关注等皆可作为目标。

如何在信息流这种复杂的推荐场景,进行多目标优化,提升户体验,是业内的主流研究热点和持续优化方向。

二、 赛题任务

大赛官方给定一批新闻户在信息流场景的推荐志,参赛队伍根据户的历史推荐行为数据,进推荐算法建模,预测这批户在不同内容的互动行为概率,包括点击、评论、点赞、关注;

同时,官方提供批训练集给参赛队伍进算法建模训练,参赛队伍提交模型和设计方案。

三、 参赛要求

1.参赛对象

研究人员、产业从业人员、高校学生以及爱好者。

2.参赛形式

每位选手可单人或组队参赛,每位选手只能加入一支队伍,每支队伍参赛人员不超过5人。参赛队伍须设置1名队长、1名秘书。

3.报名方式

2021年8月20日前,参赛队伍在大赛网站报名系统(http://2021aichina.caai.cn/)在线报名,录入参赛队伍信息,完成报名。

赛程介绍

本次大赛将采用线上初赛和答辩方式进行,最终取得名次的队伍将进入2021中国AI+创新创业大赛全国总决赛。

赛程安排:

ü  报名截止日期:2021年8月20日

ü  初赛作品提交截止日期:2021年9月5日

ü  答辩名单公布日期:2021年9月10日

ü  答辩和颁奖时间:2021年9月中旬

ü  2021中国AI+创新创业大赛全国总决赛:2021年10月

1.    线上初赛

2021年9月5日24:00前,参赛队伍将算法模型和设计方案邮件至ai_media@vip.sina.com,主办方将对参赛队伍产生的测试结果进行一致性评估,最终得到各参赛队伍初赛作品的评测结果。

(注:参赛者需要自行检查提交文件的正确性,确认无误后再进行提交,主办方不负责对提交文件进行更改和调整。若因故出现数据更新、评审代码更新、作弊检查等问题,主办方有权对参赛结果进行重新测评。参赛内容应该是参赛队员独立设计、开发完成的作品,严禁抄袭、剽窃等行为。凡发现抄袭、剽窃等行为,将取消参赛队伍的参赛资格,并追究相关单位的责任。)

2.    线上答辩

(1) 时间:9月中旬

(2) 答辩方式:初赛成绩排名前十的队伍将入围线上答辩。评委组将对算法模型和答辩表现进行评审和打分,每支参赛队伍答辩时间为20分钟。

一、奖项设置

本次比赛最终选出冠军1队、亚军2队、季军2队,对应奖励如下:

冠军(1名):20000元;

亚军(2名):10000元;

季军(2名):5000元;

获奖团队还将获得荣誉证书。

数据与评测

一、评估指标

本赛程采uAUC作为单个行为预测结果的评估指标,根据点击、评论、点赞、关注四个目标的uAUC值进加权平均,作为赛的最终分数。

uAUC定义为不同户下AUC的平均值,计算公式如下:

                                               image.png

其中,n为测试集中的有效户数,有效户指的是对于某个待预测的行为,过滤掉测试集中全是正样本或全是负样本的户,AUCi为第i个有效户的预测结果的AUC值。

 

二、数据格式

特征编码

小时表字段名

字段类型

特征说明

2000011

uuid_sign

Long

文章唯一id

2010031

art_content_len

Int

正文长度

2010041

art_title_len

Int

Title标题长度

2010181

art_ctime

Long

文本的创建时间

2020421

art_manually_tags

List[String]

人工标注的新闻编辑标签

2010021

author_uid

Long

作者UID

2020101

video_dura

Int

视频时长

2020091

video_cat_tag

Long

机器标注的视频分类标签

2020081

auto_labels

String

机器标注的标签词

2020061

auto_keywords

List[String]

机器标注的的关键词

2020111

art_cat

String

机器标注的文章一级分类

2020121

art_subcat

String

机器标注的文章二级分类

2020411

vquality

List[Float]

视频属性,格式feature1,feature2,…,feature7

1000011

device_id_sign

Long

设备id

9010011

req_time

Long

请求接口时间

9010041

is_click

Int

是否点击

1030252

watch_dura

Int

观看时长

1030602

duration

Float

文章阅读时长

2030702

is_attention

Int

是否关注

2030732

is_share

Int

是否分享

2030712

is_collection

Int

是否收藏

2030722

is_like

Int

是否赞

2030692

is_comment

Int

是否评论


三、数据使用说明

参赛者对所有数据信息予以严格保密,竞赛用的训练数据集和测试数据集归新浪新闻所有,数据信息仅用于此次竞赛,在未得到主办方事先许可的情况下,不得披露给任何其他人士或机构,不得分发传播,不得用作其他用途。参赛选手如发表论文、公开演讲等使用到比赛数据,需事先获得主办方许可,并不得对数据集或基于数据集的研究成果、产出物进行出售、转让或用于任何商业活动。

 

竞赛管理

1.    参赛费用:本次大赛不收取任何费用。

2.    餐饮住宿:参加全国总决赛队伍在决赛期间的食宿费用、交通费用及其他费用均自理。

3.    竞赛秘书处联系方式

报名网站:http://2021aichina.caai.cn/

联系邮箱:ai_media@vip.sina.com

4.    参赛须知:参赛队伍需仔细、认真、审慎阅读竞赛规则和通知要求,同意并接受其约束,遵守由主办方制定的各项规则和制度,尊重并接受大赛评委会做出的评判、大赛主办方做出的决定等。未尽事宜,由大赛主办方负责解释。

排名公示 关闭