首页　>　 AI教程资讯 > VLMEvalKit入门指南 - 开源大规模视觉语言模型评估工具包

VLMEvalKit入门指南 - 开源大规模视觉语言模型评估工具包

532 2025-01-03 00:00:00

VLMEvalKit简介

VLMEvalKit是一个由开源贡献者开发的大规模视觉语言模型(LVLM)评估工具包。它具有以下主要特点:

支持对约100种视觉语言模型进行评估,包括API模型和开源PyTorch/Hugging Face模型提供40多个基准数据集,涵盖图像理解、视频理解等多个任务采用基于生成的评估方法,并提供精确匹配和基于LLM的答案提取两种评估模式一键式评估,无需繁琐的数据准备工作支持自定义基准和模型,易于扩展

主要功能

支持的视觉语言模型

VLMEvalKit支持多种类型的视觉语言模型:

API模型:如GPT-4v、Gemini Pro Vision等开源PyTorch/HF模型:如IDEFICS、LLaVA、MiniGPT-4等支持多模态输入的模型(标记为

上一篇　keras-llm-robot学习资料汇总 - 一个用于学习大型语言模型的Web UI项目下一篇　lagent入门学习资料 - 轻量级LLM智能体框架

相关推荐

热门资讯

Botpress学习资料汇总 - 开源对话式AI平台

1829 2024-12-16 16:31:42
BibiGPT-v1: 革命性的AI音视频内容一键总结工具

1973 2024-12-19 05:49:31
Ethora: 开源 Web3 社交平台引擎

551 2025-01-06 17:56:26
DouZero: 基于自我对弈深度强化学习的斗地主AI系统

1803 2024-12-19 02:10:32
开源数据工程项目精选:打造现代数据基础架构

1290 2025-01-06 16:16:54
AI也能刷短视频了？！清华大学最新发布短视频理解模型，含图像文本音频多模态理解

958 2024-12-31 16:07:01
Diffree：最新模型实现文字指令修改图片！！这下修图变得更简单了

1152 2024-12-31 16:27:01
北大团队最新发布全景3D技术！只需一张图片和一段话就能生成全景3D场景

1384 2024-12-31 16:46:55
React Agent 学习资料汇总 - 开源 React.js 自主 LLM 代理

1182 2025-01-03 17:08:43
Mojo编程语言学习资料汇总 - 兼具Python语法和系统级性能的AI编程语言

818 2025-01-06 14:37:19

相关常用工具

1 cheetah
866
2 SUPIR
1472
3 Conference-Acceptance-Rate
494
4 DouZero
933
5 GodMode
1530
6 MeloTTS
247
7 codefuse
1783
8 腾讯云 AI 代码助手
329
9 CodeGeeX
1416

Copyright © 2025 AI图片论坛版权所有. 站点地图

手机版

返回顶部