里程碑时刻!首个100B扩散语言模型来了,技术报告揭秘背后细节
来源:机器之心|发布时间:2025年12月12日
摘要:由蚂蚁集团联合人大、浙大、西湖大学团队发布的 LLaDA2.0-flash 模型,是全球首个达到 1000亿参数规模 的扩散语言模型(dLLM),采用MoE架构,在47项基准测试中平均得分73.18,与Qwen3-30B-A3B-Instruct-2507性能持平。该模型在编码(HumanEval、MBPP)和智能体任务(BFCL)上表现尤为突出,标志着扩散语言模型从实验性方向迈向工业级应用。其成功突破了传统自回归模型的生成瓶颈,为下一代通用AI模型提供了新范式。
Runway深夜炸场:一口气发布5大更新,首个通用世界模型来了
来源:机器之心|发布时间:2025年12月12日
摘要:AI视频巨头Runway发布五大创新升级,包括旗舰模型 Gen-4.5(支持原生音频生成)、首个通用世界模型GWM-1及其生态。GWM-1首次实现对物理世界运行规律的建模,赋能GWM Worlds(数字世界探索)、GWM Avatars(交互式数字人)和GWM Robotics(机器人训练模拟器)。此举标志着AI从“生成像素”迈向“模拟真实世界”的关键跃迁,被视作AI具身智能的重要里程碑。
NUS LV Lab新作|FeRA:基于「频域能量」动态路由,打破扩散模型微调的静态瓶颈
来源:机器之心|发布时间:2025年12月12日
摘要:新加坡国立大学(NUS)LV Lab提出 FeRA框架,首次从频域能量视角揭示扩散模型去噪过程呈“低频到高频”演变规律,设计了动态路由机制以适应不同时刻的结构与纹理需求。相比传统LoRA等静态微调方法,FeRA显著提升对复杂细节的生成质量,有效解决“顾此失彼”问题,为参数高效微调(PEFT) 开辟了新路径,对Stable Diffusion等模型的精细化适配具有重要意义。