推荐
快报
广场
科股宝VIP
视频
直播
媒体
企服
创投
咨询
活动
钛空时间
集团时光
公众号
清朗网络行动
写稿
视频投稿
App下载
ENGLISH
钛媒体
链得得
钛空时间
消研所
钛媒体创投家
品牌服务
专家服务
政府服务
创业者服务
融资需求
申请报道
项目数据库
投资者服务
创投家CLUB投资机构库
机构数据库
行研报告
钛媒体
链得得
ITValue
钛空时间
消研所
钛极客
资讯
科股宝
PRO
视频
直播
FM
阿里通义实验室智能计算团队推出新算法FIPO
2026.04.07 22:34
微信扫码
15
9
钛媒体App 4月7日消息,阿里通义实验室智能计算团队宣布推出新算法FIPO(Future-KL Influenced Policy Optimization),引入Future-KL机制,奖励关键Token,解决纯强化学习(Pure RL)训练中“推理长度停滞”难题。据该团队介绍,在32B规模的纯RL设定下,率先实现对o1-mini与同规模DeepSeek-Zero-MATH的性能反超。(广角观察)
HK
阿里巴巴-W
US
阿里巴巴
新消费
互联网
新科技
AGI
本文内容仅供参考,不构成投资建议,请谨慎对待。
评论
0
/ 300
根据《网络安全法》实名制要求,请绑定手机号后发表评论
登录
请
登录
后输入评论内容
投资日历
更多
根据《网络安全法》实名制要求,请绑定手机号后发表评论