当世界模型不止「视频」该如何评估?WorldLens提出实用化评估新框架
来源:机器之心
发布时间:2025-12-23 17:45:32 +0800
摘要:WorldLens 框架为生成式世界模型提供了一套体系化评估方案,涵盖生成、重建、指令跟随、下游任务和人类偏好五大维度,旨在突破传统以“像不像视频”为核心的评估局限。该框架强调模型在几何一致性、多视角一致性和时序稳定性等关键属性上的表现,推动世界模型从“视觉仿真”迈向“真实可执行”的工程应用。评估工具已开源,为行业提供可复现的标准基准。
智明堂大模型获国家中医执业医师测试最佳成绩,首创TCM-Eval基准促行业标准化
来源:新闻资讯
发布时间:2025-12-23 17:19:37 +0800
摘要:智明堂(ZMT-M1)中医大模型在国家中医执业医师资格考试模拟测试中取得96.26分的最高成绩,远超同类模型。研究团队同步发布了全球首个动态可扩展的中医大模型评测基准——TCM-Eval,填补了行业缺乏公开、可复现评估标准的空白。该平台为实现中医大模型临床级智能化奠定了标准化基石,加速了产业落地进程。
只需150k数据,多图融合效果超越Qwen-2509,至多支持10图输入!
来源:新闻资讯
发布时间:2025-12-23 17:15:00 +0800
摘要:Nano-Banana 和 GPT-Images 在多图融合(Multi-Image Composition, MICo)任务中表现突出,但开源模型因缺乏高质量训练数据而差距明显。新方法通过优化数据构造流程,在仅150K样本下实现对Qwen-2509的超越,且支持最多10张图像输入。该研究解决了目标分割不完整和边界模糊的核心难题,显著提升了模型在复杂场景下的泛化能力,为多图生成开辟新路径。
LeCun和哈萨比斯「吵」起来了:「通用智能」到底存不存在?
来源:机器之心
发布时间:2025-12-23 16:06:55 +0800
摘要:深度学习先驱 Yann LeCun 在访谈中猛烈抨击“通用智能”概念,认为其为“彻头彻尾的胡说八道”,并指出人类智能本质是高度专用化的,而非通用。此观点引发与 Demis Hassabis 的激烈辩论。LeCun强调,人类的“通用”能力源于幸存者偏差,我们只能意识到自己能构想的任务,而忽略了海量认知盲区。这一争论触及AI领域最根本的哲学命题。
告别高昂重制成本!港科大广州、快手可灵发布立体视频转换单步推理新方案
来源:机器之心
发布时间:2025-12-23 16:02:07 +0800
摘要:传统3D立体视频重制成本高昂,如《泰坦尼克号》重制耗资1800万美元。为突破此瓶颈,快手可灵与港科大广州团队联合提出 StereoPilot 新方案。该方法采用生成式先验,实现单步推理,将5秒视频的转换耗时从数十分钟缩短至秒级,同时有效解决复杂场景的视差错误问题。该技术极大降低了3D内容创作门槛,为VR与元宇宙应用提供强大支持。
打通计算设计与实验执行闭环,微软、北大、上海交大联合提出科学推理模型QFANG
来源:ScienceAI
发布时间:2025-12-23 15:44:00 +0800
摘要:QFANG 是一款科学推理语言模型,能够通过显式思维链推理,直接根据化学反应方程式生成精确的结构化实验方案。相较于依赖少量示例的上下文学习,QFANG模型内化了数十年化学研究的原理与先例,成功弥合了计算合成设计与实验室实际执行之间的巨大鸿沟。该模型将为有机合成领域提供前所未有的自动化支持。
为具身智能构建原生安全底座,永信至诚首发「数字风洞」具身智能原生安全解决方案
来源:新闻资讯
发布时间:2025-12-23 14:29:00 +0800
摘要:永信至诚发布“数字风洞”具身智能原生安全解决方案,基于ISAC-R标准,从智能度、安全度、匹配度、一致性四个维度,为具身智能提供可量化的全生命周期数字健康指引。该方案直面具身智能在感知、决策、执行与交互各环节的现实安全风险,旨在解决“AI失控”问题,为智能机器人在工厂、家庭等真实世界的规模化落地筑牢安全基石。
拿走200多万奖金的AI人才,到底给出了什么样的技术方案?
来源:机器之心
发布时间:2025-12-23 13:13:06 +0800
摘要:在2025年腾讯广告算法大赛中,冠军团队凭借解决复杂真实的广告推荐难题,斩获200万奖金与腾讯录用意向。其成功关键在于不依赖现成方案,而是从“用户行为建模”和“上下文理解”两个核心挑战入手,提出了创新的解决方案。这体现了顶尖AI人才在面对真实工业难题时,通过深度思考与系统化设计,实现从“追赶”到“引领”的跨越。
仅需15%全量Attention!「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了
来源:机器之心
发布时间:2025-12-23 13:04:37 +0800
摘要:RTPurbo 是阿里RTP-LLM团队提出的后训练压缩方案,可实现上传统Full Attention 机制5倍的计算压缩,在不损失模型效果的前提下,将长序列推理成本大幅降低。该方案通过识别并优化长程注意力头,解决了长文本处理“又贵又慢”的核心痛点。这为大模型在文档处理、代码生成等长文本场景的高效应用提供了关键技术支撑。
技术革新+生态赋能:多彩新媒构建智慧广电新标杆
来源:机器之心
发布时间:2025-12-23 12:59:00 +0800
摘要:贵州多彩新媒在IPTV领域实现飞速跃迁,从全国起步最晚的省份之一,跃升为覆盖率接近89%的行业标杆。其核心在于持续的技术创新:从终端架构革新到超高清技术落地,再到中台化与运维体系升级。这些“不显眼”的改变,共同实现了从“功能满足”到“体验重构”的跨越,为传统广电的数字化转型提供了可复制的样本。