打破RLHF瓶颈,克服奖励欺骗!Meta发布全新后训练方式CGPO,编程水平直升5%
新智元报道 编辑:LRST CGPO 框架通过混合评审机制和约束优化器,有效解决了 RLHF 在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型在多任务环境中的表现。CGPO 的设计为未来多任务学习提供了新的优化路径,有望进一步提升大型语言模型的效能和稳定性。 近年来,随着大规模语言模型(
吞吐量最高飙升20倍!豆包大模型团队开源RLHF框架,破解强化学习训练部署难题
新智元报道 编辑:编辑部 HYZ 强化学习(RL)对大模型复杂推理能力提升有关键作用,然而,RL 复杂的计算流程以及现有系统局限性,也给训练和部署带来了挑战。近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow(开源项目名:veRL),一个灵活且高效的 RL/RLHF 框架。该框架采
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
新智元报道 编辑:编辑部 HYZ 大模型热,企业落地难?就在刚刚,百川智能推出「1+3」产品矩阵,一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」,仅需 10 分钟就能让企业自主成为模型定制增强专家,实现行业最佳的多场景可用率。 大模型热两年后,将大模型融入业务场景、组织流程,提
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
新智元报道 编辑:编辑部 LHj 刚刚,Claude 3.5 Haiku 允许通过 API 访问,同一天,xAI 也官宣 Grok API 也正式开启公测。 就在刚刚,Anthropic 宣布,Claude 3.5 Haiku 已经可以通过 API 访问。 与此同时,就在今天,Grok API 也官
3个思想实验撕裂时空!实验证实:人类居住时空并非物理实体,而是近似
新智元报道 编辑:静音 现有的时空结构可能并不是物理世界的最基础组成,它们可能只是某种更深层次事物的近似。一篇发表于 Quanta Magazine 的文章提出了三个思想实验来支持这一观点。这些实验表明,在极端条件下,我们所熟知的时空结构可能会失效。如果真是这样,我们可能需要用更基础的理论来重新描述
全球首款AI游戏诞生!无需游戏引擎,视频模型直出「我的世界」
新智元报道 编辑:乔杨十二 无需游戏引擎,视频基座模型直出实时交互可玩的 Minecraft,初创公司 Decart 和 Etched 打造的 Oasis 已经做到了这一点。 现在,不用游戏引擎,AI 就可以自动生成游戏了? 今天,两家初创公司 Decart 和 Etched 宣布,他们打造了一款世
UCLA、MIT数学家推翻39年经典数学猜想!AI证明卡在99.99%,人类最终证伪
新智元报道 编辑:Aeneas 好困 39 年来一个看似理所当然的数学理论,刚刚被数学家证伪!UCLA 和 MIT 的研究者证实:概率论中众所周知的假设「上下铺猜想」是错的。有趣的是,他们用 AI 已经证明到了 99.99% 的程度,但最终,靠的还是理论论证。 又一个看似坚固无比的数学理论,被证伪了
2024 AI年度报告发布,附十大预测:人形机器人热度下降,英伟达维持霸主地位
新智元报道 编辑:LRS AI 技术日新月异,像 Netflix 这样的大公司已经开始用 AI 制作特效,而新的 AI 模型也在游戏和科学研究中超越了人类。未来一年,我们可能会看到没有编程技能的人也能创造热门应用,甚至 AI 创作的歌曲也可能登上音乐排行榜前十。 AI 发展之势迅猛,从技术、政策到产
开源视频生成天花板?最强搅局者Mochi 1免费直出电影级特效
新智元报道 编辑:alan AI 视频生成领域最强搅局者,她来了!影视级效果免费开源,真「赛博菩萨」。 AI 视频生成赛道最强搅局者,来了! 何谓搅局?下面这些是模型直出的效果,开源免费送给你! 这也让一些网友直呼:「赛博菩萨」! 虽然很想把标题写成「剑指 Sora」,但可惜这个标题小编我用过了~
o1图像理解神秘现身,网友疯狂测试!Altman自曝:o2研究生级水平破105%
新智元报道 编辑:桃子 【新智元导读】完整版 o1 图像理解能力,被提前「放出」了?网友曝出 o1 能够识图,进行推理总结。现在,o1 多模态一大波试用已经铺屏全网。 o1 图像理解,可用了?! 一大早,网友们纷纷晒出,自己获得了 o1 图像理解新功能。一大波测试,简直惊掉下巴。 小编测试了下,确实
Jim Fan全华人团队HOVER问世,1.5M小模型让机器人获「潜意识」!
新智元报道 编辑:静音 【新智元导读】来自英伟达、CMU、UC 伯克利等的全华人团队提出一个全新的人形机器人通用的全身控制器 HOVER,仅用一个 1.5M 参数模型就可以控制人形机器人的身体。人形机器人的运动和操作之前只是外表看起来类人,现在有了 HOVER,连底层运动逻辑都可以类人了! 1. 5
谷歌员工集体打脸劈柴,25%新代码AI生成夸大事实!Linux之父怒斥90%都是营销
新智元报道 编辑:桃子好困 谷歌超 25% 新代码由 AI 生成,却遭到了自家员工的反对。劈柴的一句话,又让谷歌成为了众矢之的。 「谷歌内部超1/4 新代码,全是由 AI 生成的」! 上周,CEO 劈柴在 Q3 财报会议上的一句话,瞬间点燃了全网的激烈讨论。 AI 生成的代码再由工程师进行审核,能够
视觉定位新SOTA!华人团队开源革新框架SegVG,边界框转为分割信号 | ECCV 2024
新智元报道 编辑:LRST SegVG 是一种新的视觉定位方法,通过将边界框注释转化为像素级分割信号来增强模型的监督信号,同时利用三重对齐模块解决特征域差异问题,提升了定位准确性。实验结果显示,SegVG 在多个标准数据集上超越了现有的最佳模型,证明了其在视觉定位任务中的有效性和实用性。 视觉定位(
手机秒拍动画大片,高级运镜效果惊人!Runway两弹更新,火得一塌糊涂
新智元报道 编辑:静音 在 AI 视频这一赛道,Runway 显然已经走出了自己的特色——专注于艺术、媒体和娱乐。他们新近连发了两个新功能:可将真人面部表情精确复刻给 AI 角色的 Act-One,以能够实现 3D 化的 AI 摄像头控件。 前几天,Runway 宣布更加灵活逼真的 AI 摄像头控件
OpenAI回应一切,o1/GPT年前升级!奥特曼:别嫌慢,问就是缺算力
关于 OpenAI 的一切消息,官方这次全回应了!! 就在刚刚,CEO 奥特曼携 4 大高管集体亮相 reddit 有问必答活动(AMA ),挨个回复了大家对 OpenAI 主要产品、AGI 路线规划等提问。 具体阵容包括,首席产品官 Kevin Weil、高级研究副总裁 Mark Chen、工程副
翁荔,掌管OpenAI安全的北大校友,刚刚现身B站线下演讲
衡宇发自深夜朝阳 量子位公众号 QbitAI OpenAI 研究副总裁(安全)翁荔(Lilian Weng),现身国内! 还首次在国内大型活动场合公开发表 AI 主题演讲。 先简单介绍一下,翁荔是 OpenAI 华人科学家、ChatGPT 的贡献者之一。 北大毕业后,翁荔在 2018 年加入 Ope
时代变了!英伟达纳入道琼斯指数,英特尔被取代
明敏发自凹非寺 量子位公众号 QbitAI 见证历史! 最新消息,英伟达将在 2024 年 11 月 8 日替代英特尔成为道琼斯工业平均指数的组成成员。 这是历史最悠久的美国市场指数之一,只有30 家能代表美国工商业的上市公司有资格入选。 消息释出,英伟达股价上涨 2.9%,英特尔股价下跌 1.85
3B模型打通机器人任督二脉!冲咖啡叠衣服都能干,OpenAI也投了
克雷西发自凹非寺 量子位公众号 QbitAI 只要一个3B 参数的大模型,就能控制机器人,帮你搞定各种家务。 叠衣服冲咖啡都能轻松拿捏,而且全都是由模型自主控制,不需要遥控。 关键是,这还是个通用型的机器人控制模型,不同种类的机器人都能“通吃”。 这些操作背后的大模型叫做π0,参数量只有 3B,来自
2mm芯片植入视网膜,盲人重获阅读能力,马斯克老部下创业成果
克雷西发自凹非寺 量子位公众号 QbitAI 把一块 2mm 大小的芯片植入视网膜,搭配一副带摄像头的眼镜,就能成功让盲人恢复视力! 不仅重拾阅读能力,甚至还能打牌。 这是来自美国加州的脑机接口公司 Science 的最新进展。 而这家公司,正是由马斯克的前部下创立。 Science 的 CEO M
科研版AI搜索来了!知乎直答接入正版论文库,一手实测在此
鱼羊发自凹非寺 量子位公众号 QbitAI 人在知乎,正经搞科研,这事儿越来越有谱了(doge)。 想了解下学术热点,直接一搜,AI 不仅一步到位给出总结,连参考文献都列好了。 想要进一步跟大模型探讨论文内容,也无需跳转,将论文一键选入暂存区,就能愉快开聊。 最新消息,知乎版 AI 搜索知乎直答,已
1000个智能体打造《我的世界》,北大校友35页技术报告揭秘
北大校友打造的 1000 个智能体「我的世界」,背后原理揭晓了! 团队全新公开 35 页技术报告,详尽解密 AI 智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教…… 其中最精彩的,当数团队整活儿: 让牧师 NPC 引入虚拟宗教,最后发现该宗教在 500 个智能体(横跨 6 大城乡)中进行了广泛
Llama版o1来了,来自上海AI Lab,强化学习代码已开源
梦晨发自凹非寺 量子位公众号 QbitAI 复刻 OpenAI o1 推理大模型,开源界传来最新进展: LLaMA 版 o1 项目刚刚发布,来自上海 AI Lab 团队。 简介中明确:使用了蒙特卡洛树搜索,Self-Play 强化学习,PPO,以及 AlphaGo Zero 的双重策略范式(先验策略
商汤徐冰最新访谈:商汤最近在做什么?数万亿AI投资能回本吗?
允中发自凹非寺 量子位公众号 QbitAI 商汤科技联合创始人、执行董事徐冰出席香港金融科技周活动,并与前福布斯记者 Olivia Kinghorst 做现场对谈。在近 20 分钟的对话中,双方讨论了 AI 云平台市场趋势、投资判断、超级应用、竞争格局等话题。 徐冰认为,全人类对 AI 和算力的需求
慢思考准确率反降30%!普林斯顿揭示思维链某些任务上失效的秘密
梦晨发自凹非寺 量子位公众号 QbitAI OpenAI o1 彻底带火慢思考和思维链(CoT)方法,但 CoT 在某些任务上反而会降低模型表现。 比如给生造的词分类任务,GPT-4 在 zero-shot 提示下的准确率高达 94%,换成 CoT 的准确率却断崖式下跌到 64.4%。 内置 CoT
ChatGPT搜索搞不定勾股定理新证明,但国产AI可以!
金磊发自凹非寺 量子位公众号 QbitAI 万万没想到,现在的国产 AI 搜索,竟然让我成功读懂了陶哲轩推荐的论文。 事情是这样的。 前几天陶哲轩在自己的主页上推荐了一篇关于勾股定理新证明的研究,引发了一波不小的讨论。 毕竟 2500 多年的数学定理,竟然还能出现“新玩法”,而且是两个高中生搞出来的
我国首个商业航天发射场 即将迎来首发
近日,长征八号运载火箭在位于海南文昌的海南商业航天发射场一号发射工位开启为期一周左右的加注合练,为年底首飞打下良好的基础。 合练前一天,长八火箭芯一级和芯二级箭体已提前从技术区总装测试厂房出发,顺利转运至危险品操作厂房,完成火工品安装等操作。合练当天早晨,火箭合练箭车队搭载装好火工品的芯一级和芯二级
元戎启行获主机厂1亿美元融资,布局全球量产和Robotaxi运营
11 月 5 日,元戎启行宣布完成 1 亿美元 C1 轮战略融资,由国内头部主机厂独家投资。融资将用于夯实国内量产项目,拓展海外业务,同时为探索 Robotaxi 商业化运营和布局 VLA 模型等前沿技术提供资金支撑。元戎启行 CEO 周光表示,元戎启行将结合投资方及合作伙伴的资源优势,通过智能驾驶
为了在AI时代做好“个人助理”,vivo做了哪些努力?
作者 | 陆 邮箱 | xiaoyu@pingwest.com 在当今科技飞速发展的时代,人工智能(AI)无疑是最具变革性的力量之一。从智能语音助手到图像识别技术,AI 已经渗透到我们生活的方方面面。 在智能手机领域,AI 的应用更是成为了各大厂商竞争的焦点。 布局 vivo 作为一家在智能手机领域
消息称一加 Ace 5 手机搭载骁龙 8 Gen3 处理器、支持 100W 快充
IT 之家 11 月 5 日消息,博主@数码闲聊站今日发文爆料某厂新机配置,该机搭载高通骁龙 8 Gen3 处理器、配备 6xxxmAh 电池(预计电池容量≥6000mAh)、支持 100W 快充。结合评论讨论和过往爆料来看,新机预计为一加 Ace 5。 博主在评论区中回复了部分网友问题:针对新机影
高举“性价比”大旗的安卓手机,为何开始集体涨价?
“最近很多元器件都处于价格的上涨区间”、“所有手机厂商都面临巨大的成本压力”、“对比上代产品全面升级”,一加中国区总裁在公布一加 13 价格前,提到了这些因素。 无独有偶,在小米 15 发布价格前,小米集团 CMO 许斐也提到了“我们相比上代产品完成了划时代的升级”、“价格方面我们不会对标 iPho