智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】
智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。
猜你喜欢
湖北城市宅配新材料助力绿色家装潮流,让家更环保更健康!
股票杠杆作用:放大收益与风险的双刃剑
猎冰女王:日产1000公斤冰毒,刘招华背后的故事,曝光深度探讨
荔湾:全覆盖打造“新就业群体友好商圈(社区)”
打造“精灵耳”致双目失明、“高颅顶”致大片脱发……别让“微整”变“危整
股票买卖点位设置:买入价和卖出价策略
美股上攻道指涨超200点,微软股价创历史新高
半个世纪仍然历久弥新:新世代车型为何总能成为宝马标杆
定增与配股:哪种融资方式更胜一筹?
穿越时光的胡志明市:历史与现代的交响
宝发控股(08532HK)将于7月31日举行董事会会议以审批全年业绩
全仓股票杠杆:放大收益与风险的双刃剑
短线选股秘诀:捕捉涨势,把握时机
东吴期货研究所策略早参20230217
今日沪镍期货价格查询(2019年07月29日)
中国股市风向标:最大股票交易平台揭秘
港交所陈翊庭:正处理106宗新上市申请 今年以来40只新股上市
环球数码创意(08271)发盈警,预计中期亏损不多于2340万港元
20221129|东吴期货研究所策略早参
苹果iPad Pro 13英寸1TB版本海外售价跌至历史新低