NeurIPS 2025 | 告别全量扫描!浙大提出COIDO:破解多模态数据选择「高耗」难题
来源:机器之心
发布时间:2025-12-14
摘要:COIDO(Coupled Importance-Diversity Optimization)算法通过“耦合优化”策略,显著降低多模态数据选择的计算成本。该方法实现了重要性与多样性的统一优化,避免了传统方法中“全量扫描”带来的高资源消耗问题,为大规模视觉指令微调提供了高效解决方案,是多模态大模型数据质量管理的关键突破。
告别「盲目自信」,CCD:扩散语言模型推理新SOTA
来源:机器之心
发布时间:2025-12-14
摘要:CCD(Coherent Contextual Decoding)框架通过利用扩散过程中的上下文增广,纠正了传统扩散语言模型(DLM)“短视性”推理策略。在多种开源DLM上,该方法实现了3.48倍的推理加速与3.9%的性能提升,标志着扩散语言模型高效、连贯推理时代的到来。
辉月旧,苍龙新:AI 驱动的科学系统分析框架,打开科学研究的新工作方式
来源:ScienceAI
发布时间:2025-12-12
摘要:SciSciGPT 框架专为“科学研究的科学”设计,能阅读科学文本、理解科研网络结构,并基于证据回答关于科研生态、趋势与结构性的复杂问题。它将传统耗时的人工调研转变为即时、结构化、引用完整的智能分析,是人与AI协作研究的里程碑。
里程碑时刻!首个100B扩散语言模型来了,技术报告揭秘背后细节
来源:机器之心
发布时间:2025-12-12
摘要:由蚂蚁集团与人大、浙大、西湖大学联合推出的 LLaDA2.0-flash 模型,是首个达到100B参数量级的扩散语言模型(dLLM)。在47项基准测试中,其平均得分高达73.18,与顶级自回归模型持平。该突破证明了扩散范式在大规模模型上的巨大潜力,并为生成式AI开辟了新方向。
Runway深夜炸场:一口气发布5大更新,首个通用世界模型来了
来源:机器之心
发布时间:2025-12-12
摘要:Runway发布重磅更新,推出GWM-1通用世界模型及其家族(GWM Worlds, GWM Avatars, GWM Robotics),标志着其从“生成像素”转向“模拟世界”。结合Gen-4.5视频生成与AI驱动的交互式数字人技术,Runway正尝试构建一个可交互、可训练的虚拟世界引擎,开创AI内容创作新范式。