前沿创新
迈向通用智能决策的先驱研究,与我们一起探索人工智能改变世界的非凡方式。
强化学习创新创意大赛
寻找优秀科技人才,培育优质科技项目
比赛诚挚邀请各位专家/技术大咖,以您敏锐的专业洞察力,发掘各行业场景可以提升的技术空间,在这个时代弯道超车,重新分配价值,共同创领商业蓝海!
AI决策•强化学习落地挑战赛
学习制定平等的促销策略
比赛诚邀“挑战者”以AI营销策略者的身份共同助力智能营销,解决保障消费者权益前提下的营销挑战,考察参赛者AI决策的落地能力。
测试基准
接近实际场景的离线强化学习测试集
离线强化学习(Offline RL)旨在从已收集到的数据中学习最优的策略,在训练过程中其不需要与环境进行额外的交互。
虚拟环境
虚拟淘宝
决策模型训练出来之后,可以根据新标定试验的数据比人类专家更快的寻找到远高于工程目标的标定参数设置。