AI Daily News 2025-12-24

当世界模型不止「视频」该如何评估？WorldLens提出实用化评估新框架

来源：机器之心
发布时间：2025-12-23 17:45:32 +0800

摘要：WorldLens 框架为生成式世界模型提供了一套体系化评估方案，涵盖生成、重建、指令跟随、下游任务和人类偏好五大维度，旨在突破传统以“像不像视频”为核心的评估局限。该框架强调模型在几何一致性、多视角一致性和时序稳定性等关键属性上的表现，推动世界模型从“视觉仿真”迈向“真实可执行”的工程应用。评估工具已开源，为行业提供可复现的标准基准。

智明堂大模型获国家中医执业医师测试最佳成绩，首创TCM-Eval基准促行业标准化

来源：新闻资讯
发布时间：2025-12-23 17:19:37 +0800

摘要：智明堂（ZMT-M1）中医大模型在国家中医执业医师资格考试模拟测试中取得96.26分的最高成绩，远超同类模型。研究团队同步发布了全球首个动态可扩展的中医大模型评测基准——TCM-Eval，填补了行业缺乏公开、可复现评估标准的空白。该平台为实现中医大模型临床级智能化奠定了标准化基石，加速了产业落地进程。

只需150k数据，多图融合效果超越Qwen-2509，至多支持10图输入！

来源：新闻资讯
发布时间：2025-12-23 17:15:00 +0800

摘要：Nano-Banana 和 GPT-Images 在多图融合（Multi-Image Composition, MICo）任务中表现突出，但开源模型因缺乏高质量训练数据而差距明显。新方法通过优化数据构造流程，在仅150K样本下实现对Qwen-2509的超越，且支持最多10张图像输入。该研究解决了目标分割不完整和边界模糊的核心难题，显著提升了模型在复杂场景下的泛化能力，为多图生成开辟新路径。

LeCun和哈萨比斯「吵」起来了：「通用智能」到底存不存在？

来源：机器之心
发布时间：2025-12-23 16:06:55 +0800

摘要：深度学习先驱 Yann LeCun 在访谈中猛烈抨击“通用智能”概念，认为其为“彻头彻尾的胡说八道”，并指出人类智能本质是高度专用化的，而非通用。此观点引发与 Demis Hassabis 的激烈辩论。LeCun强调，人类的“通用”能力源于幸存者偏差，我们只能意识到自己能构想的任务，而忽略了海量认知盲区。这一争论触及AI领域最根本的哲学命题。

告别高昂重制成本！港科大广州、快手可灵发布立体视频转换单步推理新方案

来源：机器之心
发布时间：2025-12-23 16:02:07 +0800

摘要：传统3D立体视频重制成本高昂，如《泰坦尼克号》重制耗资1800万美元。为突破此瓶颈，快手可灵与港科大广州团队联合提出 StereoPilot 新方案。该方法采用生成式先验，实现单步推理，将5秒视频的转换耗时从数十分钟缩短至秒级，同时有效解决复杂场景的视差错误问题。该技术极大降低了3D内容创作门槛，为VR与元宇宙应用提供强大支持。

打通计算设计与实验执行闭环，微软、北大、上海交大联合提出科学推理模型QFANG

来源：ScienceAI
发布时间：2025-12-23 15:44:00 +0800

摘要：QFANG 是一款科学推理语言模型，能够通过显式思维链推理，直接根据化学反应方程式生成精确的结构化实验方案。相较于依赖少量示例的上下文学习，QFANG模型内化了数十年化学研究的原理与先例，成功弥合了计算合成设计与实验室实际执行之间的巨大鸿沟。该模型将为有机合成领域提供前所未有的自动化支持。

为具身智能构建原生安全底座，永信至诚首发「数字风洞」具身智能原生安全解决方案

来源：新闻资讯
发布时间：2025-12-23 14:29:00 +0800

摘要：永信至诚发布“数字风洞”具身智能原生安全解决方案，基于ISAC-R标准，从智能度、安全度、匹配度、一致性四个维度，为具身智能提供可量化的全生命周期数字健康指引。该方案直面具身智能在感知、决策、执行与交互各环节的现实安全风险，旨在解决“AI失控”问题，为智能机器人在工厂、家庭等真实世界的规模化落地筑牢安全基石。

拿走200多万奖金的AI人才，到底给出了什么样的技术方案？

来源：机器之心
发布时间：2025-12-23 13:13:06 +0800

摘要：在2025年腾讯广告算法大赛中，冠军团队凭借解决复杂真实的广告推荐难题，斩获200万奖金与腾讯录用意向。其成功关键在于不依赖现成方案，而是从“用户行为建模”和“上下文理解”两个核心挑战入手，提出了创新的解决方案。这体现了顶尖AI人才在面对真实工业难题时，通过深度思考与系统化设计，实现从“追赶”到“引领”的跨越。

仅需15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

来源：机器之心
发布时间：2025-12-23 13:04:37 +0800

摘要：RTPurbo 是阿里RTP-LLM团队提出的后训练压缩方案，可实现上传统Full Attention 机制5倍的计算压缩，在不损失模型效果的前提下，将长序列推理成本大幅降低。该方案通过识别并优化长程注意力头，解决了长文本处理“又贵又慢”的核心痛点。这为大模型在文档处理、代码生成等长文本场景的高效应用提供了关键技术支撑。

技术革新+生态赋能：多彩新媒构建智慧广电新标杆

来源：机器之心
发布时间：2025-12-23 12:59:00 +0800

摘要：贵州多彩新媒在IPTV领域实现飞速跃迁，从全国起步最晚的省份之一，跃升为覆盖率接近89%的行业标杆。其核心在于持续的技术创新：从终端架构革新到超高清技术落地，再到中台化与运维体系升级。这些“不显眼”的改变，共同实现了从“功能满足”到“体验重构”的跨越，为传统广电的数字化转型提供了可复制的样本。

AIHUB101

智汇探索