AI智库

AI智库 AI智库 AI智库 AI智库
  • 站点推荐
    • AI资讯
      • AI快讯
      • AI教程
      • AI百科
    • 关于我们
    • AI快讯
    • AI教程
    • 友情链接
    • 广告合作
    • 加入社群
    • 注册会员
  • AI对话聊天
  • AI编程工具
  • AI图像工具
    • 常用AI图像工具
    • AI图片插画生成
    • AI图片背景移除
    • AI图片无损放大
    • AI图片优化修复
    • AI图片物体抹除
    • AI商品图生成
  • AI办公工具
    • AI幻灯片和演示
    • AI表格数据处理
    • AI文档工具
    • AI思维导图
    • AI会议工具
    • AI效率提升
  • AI音频工具
  • AI设计工具
  • AI内容检测
  • AI学习网站
  • AI开发框架
  • AI提示指令
  • AI训练模型
  • AI模型评测
  • AI语言翻译
  • AI法律助手
  • AI搜索引擎
  • AI对话工具
  • AI视频工具
  • AI写作工具
AI智库
  • AI智库
    • AI对话聊天
    • AI编程工具
    • AI图像工具
    • AI办公工具
    • AI音频工具
    • AI设计工具
    • AI内容检测
    • AI学习网站
    • AI开发框架
    • AI提示指令
    • AI训练模型
    • AI模型评测
    • AI语言翻译
    • AI法律助手
    • AI搜索引擎
    • AI对话工具
    • AI视频工具
    • AI写作工具
  • AI资讯
    • AI快讯
    • AI教程
    • AI百科
  • 关于我们
  • 友情链接
  • 广告合作
  • 加入社群
  • 注册会员
AI智库 AI智库
AI搜索引擎 视频生成框架 AI商品图生成 AI论文写作工具 AI金融工具 AI编程工具 AI音频工具 AI设计工具 AI图片优化修复 AI训练模型

AI模型评测

SuperCLUE
SuperCLUE

中文通用大模型综合性测评基准

H2O EvalGPT
H2O EvalGPT

H2O.ai推出的基于Elo评级方法的大模型评估系统

PubMedQA
PubMedQA

生物医学研究问答数据集和模型得分排行榜

FlagEval
FlagEval

智源研究院推出的FlagEval(天秤)大模型评测平台

LLMEval3
LLMEval3

由复旦大学NLP实验室推出的大模型评测基准

CMMLU
CMMLU

一个综合性的大模型中文评估基准

OpenCompass
OpenCompass

上海人工智能实验室推出的大模型开放评测体系

HELM
HELM

斯坦福大学推出的大模型评测体系

MMBench
MMBench

全方位的多模态大模型能力评测体系

Chatbot Arena
Chatbot Arena

以众包方式进行匿名随机对战的LLM基准平台

按住 Ctrl+D    或    ⌘+D 键,
把https://ai-zhiku.com/收藏起来吧!
AI智库 AI智库
用AI上智库,更懂 AI,更懂你!​ AI 智库 —— 不止是导航,更是懂你的智能 AI 资源中枢。​

AI智库 广告合作 关于我们 免责声明 友情链接

关注我们

Copyright © AI智库  域名备案:辽ICP备18007040号-2  辽公网安备21021102001760号