AI Daily News 2025-12-20

人人都是导演：CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制

来源：机器之心 | 发布时间：2025-12-21 01:06:56 +0800

近日，由华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室联合推出的CineCtrl框架，实现了视频生成中相机运镜与摄影效果的统一控制。该框架通过解耦交叉注意力机制，解决了多控制信号共同控制时效果耦合的问题，实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制，标志着AI视频创作进入了全新阶段。该研究为视频生成模型的可操控性提供了新的解决方案。
关键词： CineCtrl、视频生成、相机运镜、摄影效果、AI创作

破局工业自动化界哥德巴赫猜想，它石智航以全栈技术掀开高价值场景序幕

来源：新闻资讯 | 发布时间：2025-12-19 16:53:00 +0800

12月19日，它石智航在“TA来了，针功夫”技术首秀直播中亮相全球首个实现自主刺绣的机器人。该机器人以亚毫米级精度完成复杂刺绣流程，成功攻克了“线束”这一工业自动化领域的“哥德巴赫猜想”难题。此举不仅验证了柔性精细制造的可行性，更标志着具身智能在真实工业场景中的规模化应用前景。研究团队强调，未来机器人应具备“有用”“可信赖”的核心特征，真正服务于工业制造。
关键词： 它石智航、自主刺绣、工业自动化、具身智能、高价值场景

布局控制+身份一致：浙大提出ContextGen，实现布局锚定多实例生成新SOTA

来源：机器之心 | 发布时间：2025-12-21 00:54:43 +0800

浙江大学ReLER团队发布了ContextGen框架，旨在解决多实例图像生成中“布局控制”与“身份特征保持”的双重难题。该框架基于Diffusion Transformer（DiT）设计，通过上下文学习机制，在保证高空间布局精度的同时，有效避免了实例混淆和细节丢失问题。实验表明，ContextGen在多项指标上超越了现有SOTA方法，为高度定制化图像生成提供了可靠的新范式。
关键词： ContextGen、多实例图像生成、布局控制、身份保持、SOTA

Anthropic公布新技术：不靠删数据，参数隔离移除AI危险

来源：机器之心 | 发布时间：2025-12-21 00:48:24 +0800

为应对大模型潜在的双重用途风险，Anthropic提出了一种基于“参数隔离”的新方法。该技术通过在模型训练阶段对危险知识进行隔离，从根本上防止模型获取有害能力，避免了传统依赖数据过滤的高成本、不完美问题。该方法在有效抑制模型危险行为的同时，保持了良好的通用性能，为AI安全治理提供了全新思路。
关键词： Anthropic、参数隔离、AI安全、双重用途风险、模型训练

拆解CANN：当华为决定打开算力的「黑盒」

来源：机器之心 | 发布时间：2025-12-19 15:09:13 +0800

华为宣布全面开源其核心算力软件CANN（神经网络异构计算架构），旨在降低AI算力使用门槛，构建开放的算力生态。作为连接上层训练框架与底层AI芯片的桥梁，CANN的开源释放了开发者的定义算力权力，打破了硬件厂商的技术壁垒。此次开源标志着AI基础设施正从封闭走向开放，将加速国产算力生态的繁荣。
关键词： 华为、CANN、算力开源、AI基础设施、硬件生态

Mamba作者团队提出SonicMoE：一个Token舍入，让MoE训练速度提升近2倍

来源：机器之心 | 发布时间：2025-12-19 15:02:33 +0800

Mamba作者团队提出SonicMoE，通过创新地引入“Token舍入”机制，解决了MoE（混合专家）模型在追求高密度、微细粒度时面临的内存墙与I/O瓶颈问题。该技术显著提升了模型训练过程中的内存效率与算术强度，使得在保持相同激活参数量的情况下，训练速度提升近2倍。SonicMoE为高效训练超大MoE模型提供了关键技术突破。
关键词： SonicMoE、MoE、Token舍入、训练效率、内存优化

大模型「越想越错」？人大&腾讯团队用信息论揭示：什么时候该想、什么时候别想

来源：机器之心 | 发布时间：2025-12-19 14:55:42 +0800

中国人民大学与腾讯天衍实验室团队从信息论角度出发，揭示了当前大模型长推理链条易“越想越错”的根源。研究发现，长推理过程常在制造“自我噪声”，导致信息熵激增，反而降低决策准确性。该研究提出，应通过“熵”与“互信息”等指标，在正确时机停止思考，实现高效、精准的推理，为大模型的“理性”思考提供了量化标准。
关键词： 信息论、大模型推理、熵、互信息、理性思考

谷歌、英伟达、OpenAI在列，美国能源部宣布与24家机构达成协议，共同推进「创世纪计划」

来源：ScienceAI | 发布时间：2025-12-19 14:03:00 +0800

美国能源部宣布与24家产业界与学术机构达成协议，共同推进“创世纪计划”（Genesis Mission）。该计划旨在利用AI加速科学发现，构建可扩展的国家AI基础设施。参与方包括谷歌、英伟达、OpenAI等科技巨头，以及众多顶尖研究机构。此举标志着美国正将AI投入科研范式的根本变革，推动科学发现进入“AI+”时代。
关键词： 创世纪计划、美国能源部、AI科研、国家基础设施、产学研合作

T5Gemma模型再更新，谷歌还在坚持编码器-解码器架构

来源：机器之心 | 发布时间：2025-12-19 11:59:00 +0800

2025年末，谷歌发布了T5Gemma 2模型，延续了其经典的编码器-解码器（Encoder–Decoder）架构。尽管近年来“仅解码器”架构已成为主流，但谷歌仍坚持该技术路径，旨在探索其在文本生成、代码补全等任务上的独特优势。T5Gemma 2的发布显示，经典架构仍有广阔的发展空间，为模型设计提供了多元化选择。
关键词： T5Gemma 2、编码器-解码器、谷歌、模型架构、文本生成

基于真实数据和物理仿真，国防科大开源具身在线装箱基准RoboBPP

来源：机器之心 | 发布时间：2025-12-19 11:53:00 +0800

国防科大、中科院工业人工智能研究所等联合发布RoboBPP，一个基于真实工业数据与物理仿真的在线三维装箱基准。该基准系统性地整合了物理可行性、重力、摩擦、碰撞约束等现实因素，解决了当前研究中“数学优化”与“物理执行”脱节的问题。RoboBPP的开源为验证机器人装箱算法的实际可执行性提供了权威标准。
关键词： RoboBPP、在线装箱、具身智能、物理仿真、算法验证

AIHUB101

智汇探索