LLM距离AGI只差一层:斯坦福研究颠覆「模式匹配」观点

来源:机器之心 | 发布时间:2025年12月10日 20:24

斯坦福大学最新研究提出,大语言模型(LLM)并非缺乏推理能力,而是缺少一个关键的“协调层”——即让模型输出与目标精准绑定的系统。该研究挑战了“LLM只是模式匹配器”的主流观点,认为AGI的瓶颈不在于规模,而在于如何组织和协调已有的知识与行为。论文以“捕鱼隐喻”说明:模型拥有海量模式(海洋),但若不通过目标引导(鱼饵),仍只能产出泛化不足的结果。这项突破性观点为实现通用人工智能(AGI)提供了全新路径,强调系统设计的重要性而非单纯扩展模型规模。核心关键词:协调层、AGI、模式匹配、系统设计、推理能力


微软发布首个测试时扩展大规模研究,还给出了终极指南

来源:机器之心 | 发布时间:2025年12月10日 20:19

微软开展了一项系统性研究,首次大规模验证“测试时扩展”(Test-time Scaling, TTS)在大语言模型推理中的实际效果。研究覆盖从7B到235B参数的8款开源模型,在4个基准数据集上生成超300亿token,测试了序列、并行与混合策略。结果显示,合理分配推理计算资源可显著提升模型表现,但策略选择需根据模型特性动态调整。研究发现,并非“算力越多越好”,过度推理反而导致误差累积,而混合策略在复杂任务中表现最优。该成果为AI产品在真实场景中优化性能提供了关键指导,标志着LLM推理效率进入“战略调度”时代。关键词:测试时扩展、推理优化、混合策略、算力调度、模型效率


「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说

来源:机器之心 | 发布时间:2025年12月10日 16:45

字节跳动的“豆包手机助手”凭借深度嵌入系统底层的超级Agent架构,引爆科技圈。区别于传统App式AI助手,该系统能跨应用执行端到端长链条任务,如“地图标记餐厅→查博物馆→订票”,全程无中断、逻辑清晰。其核心在于端侧AI深度融合OS,实现自然语言驱动的多模态任务自动化。在Meta、清华等学者看来,这标志着AI从“工具”迈向“数字管家”的关键跃迁。尽管仍处技术预览阶段,但其展现的自主规划、跨系统协同能力已远超当前主流AI产品,预示着手机人机交互范式即将变革。关键词:超级Agent、端侧AI、跨应用执行、OS级集成、长链条任务


南大联合LibLib.ai、中科院自动化所,共同提出布局推理与精准编辑「海报设计大模型」PosterCopilot

来源:机器之心 | 发布时间:2025年12月10日 16:37

南京大学PRLab团队联合LibLib.ai与中科院自动化所,推出首个解耦“布局推理”与“多轮可控编辑”的专业级海报设计大模型——PosterCopilot。该模型可精准理解用户语义,生成符合设计规范的版式,并支持多次修改与风格保持。其核心突破在于将视觉结构生成与语义编辑分离,实现高质量、可迭代的设计流程。项目已适配国产昇腾算力平台,推动国产AI设计工具落地。研究者表示,该框架解决了生成式设计中“失控”与“盲推”两大痛点,为AI辅助创意设计提供了可信赖的技术范式。关键词:PosterCopilot、布局推理、多轮编辑、可控生成、国产AI


首个由AI开发的药物或许即将面世,众多候选中,抗体一骑绝尘

来源:ScienceAI | 发布时间:2025年12月10日 14:08

人工智能在药物研发领域取得里程碑进展,首个AI设计的抗体药物或即将问世。丹麦技术大学等机构利用AI从头设计出具备高亲和力与稳定性的新抗体分子,其性能已逼近商业抗体药物标准。相比传统研发耗时数年,AI设计仅用数月便完成多轮筛选优化。研究人员指出,美制药公司已启动临床前测试,抗体类候选药物已成为AI药中最高潜力方向。该突破标志着AI正从辅助工具转向药物研发核心引擎,预示未来新药研发将进入“AI驱动”时代。关键词:AI药物、抗体设计、从头设计、临床前、AI制药

LLM距离AGI只差一层:斯坦福研究颠覆「模式匹配」观点

来源:机器之心|发布时间:2025年12月10日

斯坦福大学最新论文提出颠覆性观点:大语言模型(LLM)并非因缺乏推理能力而无法实现AGI,而是缺少一个将其模式与目标联动的“协调层”。研究通过“捕鱼隐喻”阐释,模型像无饵撒网的渔夫,收获的只是高频模式。该研究指出,AGI的核心瓶颈在于系统性协调机制,而非模型规模或结构。这一发现或重塑AI对通用智能路径的理解。关键词:AGI、协调层、模式匹配、推理能力、斯坦福研究


微软发布首个测试时扩展大规模研究,还给出了终极指南

来源:机器之心|发布时间:2025年12月10日

微软开展系统性测试时扩展(Test-time Scaling, TTS)研究,覆盖7B至235B参数模型,在4个数据集上生成超300亿token。研究对比序列、并行与混合策略,揭示“动态计算分配”可显著提升模型表现。研究强调不同模型适用不同策略,提出“最优TTS框架”应兼顾效率与成本。这项工作为LLM推理优化提供实证指南,标志着推理阶段“智能调度”正迈向实用化。关键词:测试时扩展、TTS、推理优化、微软研究、大模型推理


「豆包手机」为何能靠超级Agent火遍全网,我们听听AI学者们怎么说

来源:机器之心|发布时间:2025年12月10日

字节跳动“豆包手机助手”凭借深度集成系统级AI Agent,实现跨App复杂任务自动执行,如地图标记、查询博物馆、订票等。其核心在于将AI作为“超级管家”嵌入操作系统底层,打破传统App边界。发布仅一周即引发科技圈热议,某宝平台价格飙至近五千元。专家评价其“标志着AI从工具向实体助手的跃迁”,或将重塑人机交互范式。关键词:豆包手机、AI Agent、系统级AI、超级管家、跨应用任务


南大联合LibLib.ai、中科院自动化所,共同提出布局推理与精准编辑「海报设计大模型」PosterCopilot

来源:机器之心|发布时间:2025年12月10日

南京大学PRLab联合LibLib.ai、中科院自动化所推出PosterCopilot,首个实现“布局推理”与“多轮可控编辑”解耦的AI海报设计模型。其可理解复杂语义指令,自动生成专业级版式,并支持精准调整。模型已适配华为昇腾国产算力平台,推动AI设计技术国产化落地。该研究解决传统生成式设计“失控”与“盲推”痛点,为数字创意产业提供强大工具支持。关键词:PosterCopilot、AI设计、布局推理、多轮编辑、国产算力


首个由AI开发的药物或许即将面世,众多候选中,抗体一骑绝尘

来源:ScienceAI|发布时间:2025年12月10日

丹麦技术大学等团队利用AI从头设计出具备药物级特性的抗体分子,正逼近临床转化。相比传统研发周期长达十年,AI设计将速度大幅压缩。今年数十个团队报告成功案例,其中抗体类分子表现尤为突出,被普遍视为首个AI药物的“头号候选”。该进展预示AI将彻底变革医药研发路径,开启“算法驱动药物创新”新时代。关键词:AI药物、抗体设计、从头设计、医药研发、AI制药

何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

来源:机器之心 | 发布时间:2025年12月11日 18:20

摘要:在NeurIPS 2025大会上,何恺明发表题为《视觉目标检测简史》的演讲,回顾了计算机视觉领域里程碑式工作《Faster R-CNN》的三十年发展。该论文荣获「时间检验奖」,标志着其在目标检测领域的深远影响。何恺明通过系统性梳理算法演进,揭示了基于区域的深度学习模型如何成为现代视觉系统的核心架构。其提出的统一框架为后续研究指明方向,推动AI在复杂场景理解方面取得实质性突破,并为通用视觉智能奠定了基础。


效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决

来源:机器之心 | 发布时间:2025年12月11日 18:11

摘要:字节跳动Seed团队提出「臂-手共享自主框架」,显著提升机器人灵巧操作数据采集效率。通过VR遥操作与AI自主控制协同,人类负责高层决策与避障,AI控制灵巧手完成精细操作,降低操作者认知负荷25%以上。该方法突破传统双通道同步控制瓶颈,大幅降低数据采集成本,为灵巧机器人从实验室走向工业场景提供可扩展的技术路径,推动通用机器人技术落地。


BrainOmni:首个统一脑电磁基础模型,实现跨设备、跨模态的通用脑信号表征

来源:ScienceAI | 发布时间:2025年12月11日 14:52

摘要:上海AI实验室联合清华、剑桥等发布全球首个统一脑电(EEG)与脑磁(MEG)基础模型BrainOmni。通过引入新型注意力机制并利用传感器物理坐标替代通道命名,实现跨设备、跨模态兼容。在1997小时EEG与656小时MEG数据上完成自监督预训练,在9项任务中超越现有模型。其强零样本泛化能力为脑机接口、神经疾病诊断提供统一表征基础,标志着神经计算进入“通用模型+大规模数据”新阶段。


把数据中心塞进办公桌,让智能开发快N倍 ⚡

来源:新闻助手 | 发布时间:2025年12月11日 14:29

摘要:OpenCSG与Dell联合推出“数据驱动”智能开发新范式,将PowerScale智能存储系统嵌入办公桌面,实现本地化高性能计算。该系统以数据为中心,打破传统算力依赖,显著缩短数据传输时间,避免GPU空转。通过数据本地化、流动化管理,开发效率提升数倍,特别适用于大模型训练与推理场景,为中小企业与AI研发团队提供高效、低成本的一体化基础设施解决方案。


钉钉又发新版本!把 AI 搬进每一次对话和会议

来源:新闻助手 | 发布时间:2025年12月11日 14:19

摘要:钉钉8.1.10版本上线「AI灵动回复」功能,用户可在聊天中一键获取4-6条高情商回复建议。系统基于对话上下文、身份关系与场景,自动生成简洁、正式、轻松、确认型等多风格建议,显著降低职场沟通成本。AI持续学习用户习惯,越用越智能。同时,听记AI问答与DingTalk A1录音卡升级同步实现,标志着AI深度融入办公协作流程,助力高效、精准、人性化的智能办公新体验。

何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

来源:机器之心|发布时间:2025年12月11日

摘要:在NeurIPS 2025大会上,何恺明发表题为《视觉目标检测简史》的演讲,回顾了过去三十年该领域的发展历程。其与任少卿、Ross Girshick、孙剑合著的《Faster R-CNN》荣获“时间检验奖”,奠定现代目标检测的底层范式。该论文自2015年发表以来,成为计算机视觉里程碑式工作,推动了十年间模型架构的演进。演讲揭示了从传统方法到端到端深度学习的范式跃迁,强调统一建模可泛化设计对智能系统发展的重要性,为下一代视觉AI研究指明方向。


效率提升25%,灵巧操作数采困境被「臂-手共享自主框架」解决

来源:机器之心|发布时间:2025年12月11日

摘要:字节跳动Seed团队提出“臂-手共享自主框架”,通过VR遥操作控制机械臂(高层定位与避障)与DexGrasp-VLA自主控制灵巧手(精细抓握),实现分工协同。该机制显著降低操作员认知负荷,数据采集效率提升25%,有效破解机器人灵巧操作中高质量数据获取成本高、样本稀缺的瓶颈。该框架为通用机器人实现类人操作提供了可规模化落地的技术路径,是推动灵巧机器人从实验室走向工业场景的关键一步。


BrainOmni:首个统一脑电磁基础模型,实现跨设备、跨模态的通用脑信号表征

来源:ScienceAI|发布时间:2025年12月11日

摘要:上海人工智能实验室联合清华、剑桥大学发布BrainOmni,全球首个统一脑电(EEG)与脑磁(MEG)的大规模基础模型。通过引入模拟源重构过程的新型注意力机制,并以传感器真实物理属性替代通道命名,实现跨设备、跨模态兼容。在1997小时EEG与656小时MEG数据上自监督训练,在9项下游任务中超越现有模型,并展现强零样本泛化能力。该模型有望构建通用脑信号理解平台,助力脑机接口与神经疾病诊断技术突破。


把数据中心塞进办公桌,让智能开发快N倍 ⚡

来源:新闻助手|发布时间:2025年12月11日

摘要:OpenCSG与Dell联合推出“数据驱动型智能开发新范式”,将PowerScale智能存储系统部署至办公桌级设备,实现本地化、高性能的数据流转。通过打破“算力驱动”桎梏,将数据作为核心资产,极大缓解大模型训练中数据同步慢、GPU空转、流程混乱等痛点。该方案显著提升PoC到生产环境的敏捷性,使智能开发效率实现N倍级跃升,是构建高效AI研发基础设施的关键突破。