人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制

来源:机器之心 | 发布时间:2025-12-21 01:06:56 +0800

近日,由华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室联合推出的CineCtrl框架,实现了视频生成中相机运镜与摄影效果的统一控制。该框架通过解耦交叉注意力机制,解决了多控制信号共同控制时效果耦合的问题,实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制,标志着AI视频创作进入了全新阶段。该研究为视频生成模型的可操控性提供了新的解决方案。
关键词: CineCtrl、视频生成、相机运镜、摄影效果、AI创作


破局工业自动化界哥德巴赫猜想,它石智航以全栈技术掀开高价值场景序幕

来源:新闻资讯 | 发布时间:2025-12-19 16:53:00 +0800

12月19日,它石智航在“TA来了,针功夫”技术首秀直播中亮相全球首个实现自主刺绣的机器人。该机器人以亚毫米级精度完成复杂刺绣流程,成功攻克了“线束”这一工业自动化领域的“哥德巴赫猜想”难题。此举不仅验证了柔性精细制造的可行性,更标志着具身智能在真实工业场景中的规模化应用前景。研究团队强调,未来机器人应具备“有用”“可信赖”的核心特征,真正服务于工业制造。
关键词: 它石智航、自主刺绣、工业自动化、具身智能、高价值场景


布局控制+身份一致:浙大提出ContextGen,实现布局锚定多实例生成新SOTA

来源:机器之心 | 发布时间:2025-12-21 00:54:43 +0800

浙江大学ReLER团队发布了ContextGen框架,旨在解决多实例图像生成中“布局控制”与“身份特征保持”的双重难题。该框架基于Diffusion Transformer(DiT)设计,通过上下文学习机制,在保证高空间布局精度的同时,有效避免了实例混淆和细节丢失问题。实验表明,ContextGen在多项指标上超越了现有SOTA方法,为高度定制化图像生成提供了可靠的新范式。
关键词: ContextGen、多实例图像生成、布局控制、身份保持、SOTA


Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

来源:机器之心 | 发布时间:2025-12-21 00:48:24 +0800

为应对大模型潜在的双重用途风险,Anthropic提出了一种基于“参数隔离”的新方法。该技术通过在模型训练阶段对危险知识进行隔离,从根本上防止模型获取有害能力,避免了传统依赖数据过滤的高成本、不完美问题。该方法在有效抑制模型危险行为的同时,保持了良好的通用性能,为AI安全治理提供了全新思路。
关键词: Anthropic、参数隔离、AI安全、双重用途风险、模型训练


拆解CANN:当华为决定打开算力的「黑盒」

来源:机器之心 | 发布时间:2025-12-19 15:09:13 +0800

华为宣布全面开源其核心算力软件CANN(神经网络异构计算架构),旨在降低AI算力使用门槛,构建开放的算力生态。作为连接上层训练框架与底层AI芯片的桥梁,CANN的开源释放了开发者的定义算力权力,打破了硬件厂商的技术壁垒。此次开源标志着AI基础设施正从封闭走向开放,将加速国产算力生态的繁荣。
关键词: 华为、CANN、算力开源、AI基础设施、硬件生态


Mamba作者团队提出SonicMoE:一个Token舍入,让MoE训练速度提升近2倍

来源:机器之心 | 发布时间:2025-12-19 15:02:33 +0800

Mamba作者团队提出SonicMoE,通过创新地引入“Token舍入”机制,解决了MoE(混合专家)模型在追求高密度、微细粒度时面临的内存墙与I/O瓶颈问题。该技术显著提升了模型训练过程中的内存效率与算术强度,使得在保持相同激活参数量的情况下,训练速度提升近2倍。SonicMoE为高效训练超大MoE模型提供了关键技术突破。
关键词: SonicMoE、MoE、Token舍入、训练效率、内存优化


大模型「越想越错」?人大&腾讯团队用信息论揭示:什么时候该想、什么时候别想

来源:机器之心 | 发布时间:2025-12-19 14:55:42 +0800

中国人民大学与腾讯天衍实验室团队从信息论角度出发,揭示了当前大模型长推理链条易“越想越错”的根源。研究发现,长推理过程常在制造“自我噪声”,导致信息熵激增,反而降低决策准确性。该研究提出,应通过“熵”与“互信息”等指标,在正确时机停止思考,实现高效、精准的推理,为大模型的“理性”思考提供了量化标准。
关键词: 信息论、大模型推理、熵、互信息、理性思考


谷歌、英伟达、OpenAI在列,美国能源部宣布与24家机构达成协议,共同推进「创世纪计划」

来源:ScienceAI | 发布时间:2025-12-19 14:03:00 +0800

美国能源部宣布与24家产业界与学术机构达成协议,共同推进“创世纪计划”(Genesis Mission)。该计划旨在利用AI加速科学发现,构建可扩展的国家AI基础设施。参与方包括谷歌、英伟达、OpenAI等科技巨头,以及众多顶尖研究机构。此举标志着美国正将AI投入科研范式的根本变革,推动科学发现进入“AI+”时代。
关键词: 创世纪计划、美国能源部、AI科研、国家基础设施、产学研合作


T5Gemma模型再更新,谷歌还在坚持编码器-解码器架构

来源:机器之心 | 发布时间:2025-12-19 11:59:00 +0800

2025年末,谷歌发布了T5Gemma 2模型,延续了其经典的编码器-解码器(Encoder–Decoder)架构。尽管近年来“仅解码器”架构已成为主流,但谷歌仍坚持该技术路径,旨在探索其在文本生成、代码补全等任务上的独特优势。T5Gemma 2的发布显示,经典架构仍有广阔的发展空间,为模型设计提供了多元化选择。
关键词: T5Gemma 2、编码器-解码器、谷歌、模型架构、文本生成


基于真实数据和物理仿真,国防科大开源具身在线装箱基准RoboBPP

来源:机器之心 | 发布时间:2025-12-19 11:53:00 +0800

国防科大、中科院工业人工智能研究所等联合发布RoboBPP,一个基于真实工业数据与物理仿真的在线三维装箱基准。该基准系统性地整合了物理可行性、重力、摩擦、碰撞约束等现实因素,解决了当前研究中“数学优化”与“物理执行”脱节的问题。RoboBPP的开源为验证机器人装箱算法的实际可执行性提供了权威标准。
关键词: RoboBPP、在线装箱、具身智能、物理仿真、算法验证