尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
已满i8进入i3入7y7y9秒新媒体平台如抖音、微博等,在传统文化传播中以传播速度快、覆盖面广、形式灵活著称。在“2025非遗视频创作大会”期间,抖音凭借平台算法推荐机制,迅速将大量非遗相关视频推送给不同兴趣偏好的用户。创作者们通过短视频形式,展示非遗手工艺品制作过程或记录非遗传承人的日常生活,形式多样,生动有趣。众多非遗话题迅速登上热搜,短时间内吸引海量用户关注、点赞与分享,传播范围覆盖国内外。然而,新媒体平台内容生产门槛相对较低,导致内容质量参差不齐,部分为追求流量而过度娱乐化、商业化的内容,可能对传统文化的内涵造成曲解或稀释。6 月 12 日消息,阿里董事会主席蔡崇信近日在巴黎VivaTech大会上坦言,公司曾一度迷失方向,今年1月,DeepSeek 以其低成本、高性能的AI模型震惊业界时,阿里的工程师们感受到了巨大的压力。他提到,看了相关论文,“心想怎么我们落后了?明明大家做的是一样的事”。他表示,工程主管当即决定,取消春节假期,所有人都留在公司,睡在办公室里,加快研发进度。几周之内,阿里就推出了自己的版本,也就是后面大家熟知的Qwen系列模型。已满i8进入i3入7y7y9秒成品网站免费直播有哪些平台推荐曾毅在网上总被说成是"混子",就站在那里摆摆造型,真正唱的都是杨魏玲花。但说句公道话,没了他那股劲儿,凤凰传奇也不会是现在的凤凰传奇。毕竟人家也是从底层一路爬上来的。签订购车合同后,天津华奥兴业4S店工作人员为雷先生联系到了交通银行的贷款业务。5月7日,雷先生签订了向交通银行贷款的电子协议,并等待银行放款。
20250813 🕺 已满i8进入i3入7y7y9秒王战:我们对创新的认识要进一步深化。我们一直很高尚地说,创新是理想、信仰,其实不要忘记一条,创新很多时候是利益驱动。为什么最早的创新都来自于欧洲的那批私营企业?不是他们有创新的理想,而是作为企业,不创新就没饭吃。9.1破解版至于塞斯科何时离队,巴萨诺维奇说:“可能是下周……或者明年,甚至是三年后!即使球员可能非常希望加盟某家俱乐部,我们也绝不会强迫或勒索莱比锡。我相信这不是正确的方式,因为离开俱乐部的方式体现了你的价值观。这些价值观将带入新的俱乐部。我知道在重大转会中有很多不同的利益关系,但我相信足球世界应该有更多的尊重。所以我们做事要么正确,要么不做。很简单,尽管在媒体看来可能很复杂。”
📸 兰永观记者 金化英 摄
20250813 👄 已满i8进入i3入7y7y9秒在大众的印象当中,郭富城是个不折不扣的孝子,这一点在港媒的爆料中也得到了印证,港媒透露郭富城一直都有想要儿子的想法,也想要让母亲在百年归老前看到郭家长孙出生,他为了让方媛松口答应,一改抠门人设砸钱给妻子买奢侈品,为了讨妻子欢心送上昂贵包包,夫妻俩更偷偷找友人打听生儿子偏方,费尽了不少心思。9·1看短视频“未来他对阵西班牙人出场?我希望有嘘声,但不要有暴力或侮辱性的言语,我会做一条巨大的横幅,上面是他穿着西班牙人球衣亲吻队徽的照片。”
📸 杨碧平记者 郑康淳 摄
🥵 最近玲花和曾毅在准备他们的演唱会工作,6月13日他们在山东青岛为演唱会彩排,经纪团队晒出彩排现场曾毅的照片,当天曾毅穿着绿色的李宁短袖,头戴蓝色棒球帽子,下身穿着迷彩裤子,手上戴着绿色的手表和手串,看起来非常潮流。满18岁免费观看高清电视剧