【commercial property for sale in bangalore】智谱 AI 开源视频理解模型 CogVLM2
感谢IT之家网友 USER 的智谱线索投递! IT之家 7 月 12 日消息,开源智谱 AI 宣布,视频commercial property for sale in bangalore训练了一种新的理解视频理解模型 CogVLM2-Video,并将其开源。模型 据介绍,智谱当前大多数的开源视频理解模型使用帧平均和视频标记压缩方法,导致时间信息的视频丢失,无法准确回答与时间相关的理解问题。一些专注于时间问答数据集的模型commercial property for sale in bangalore模型过于局限于特定格式和适用领域,使得模型失去了更广泛的智谱问答能力。 智谱 AI 提出了一种基于视觉模型的开源自动时间定位数据构建方法,生成了 3 万条与时间相关的视频视频问答数据。基于这个新数据集和现有的理解开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,模型训练出 CogVLM2-Video 模型。 智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。 IT之家附相关链接: 代码:https://github.com/THUDM/CogVLM2 项目网站:https://cogvlm2-video.github.io 在线试用:http://36.103.203.44:7868/ 广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
- 最近发表
-
- China's commercial reusable test rocket completes vertical takeoff, landing flight test
- 北京门头沟全区景区、民宿暂停营业 房山部分景区闭园
- 国防部:敦促菲方立即撤走非法滞留仙宾礁船只
- “一食用油罐车驶入化工企业”,浙江海宁通报
- Israel, Jordan close border crossings after deadly shooting attack
- 公职人员与教师夜摘豆角引纠纷,湖南常宁通报
- 这个直播间售卖盲盒,网警为何说它是赌博?
- 国防部:日本应停止拉帮结伙搞阵营对抗
- Over 300 cultural relic sites newly found in China's Xizang
- 50多小时昼夜奋战,湖南华容洞庭湖堤防决口今夜合龙!
- 随机阅读
-
- 专家:从三个维度,看中非携手逐梦现代化
- 沈阳:个别不法网民恶意编造散布沈阳社会治安方面的虚假信息,被依法处理
- 国防部:美菲应立即撤走并永不在本地区部署中导
- 84消毒液+洁厕灵,中毒了
- 学校点名爸爸来开家长会:父亲育儿不能是“奢侈品”
- 辽宁鞍山通报自来水出现异味:已组织管网全线冲洗,目前检测结果正常
- 你守着界标,我守着你
- 钱塘龙井冒充西湖龙井卖3880元一斤,博主举报后企业被罚50万
- Tea exchange nurtures blossoming China
- 医疗反腐“利剑”守护百姓医保“救命钱”
- 美众议长称将“动用一切手段对抗中国”,中方回应
- 俄总统普京举行会议 讨论确保国防工业企业顺利运行
- 网友建议地铁拒绝coser,成都地铁回应!
- 俄总统普京举行会议 讨论确保国防工业企业顺利运行
- 国防部:敦促菲方立即撤走非法滞留仙宾礁船只
- 一片区多名外卖小哥电动车失窃 嫌犯交代:专挑着急送餐不锁车的下手
- China starts 2024 inter
- 95后“手搓”地效飞行器“水上漂” 他还“整活”过可以垂直起降的“飞行航母”
- 50多小时昼夜奋战,湖南华容洞庭湖堤防决口今夜合龙!
- 周日足彩伤停:西班牙核心佩德里缺阵 穆尼奥斯停赛
- 搜索
-