多资源自动收录
免费加入

网站提交

百度智能云 百度智能云

百度智能云致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务,加速产业智能化转型升级

cloud.baidu.com 2024-04-27

百度翻译 百度翻译

百度翻译打造的新一代AI大模型翻译平台,为用户提供翻译和阅读外文场景的一站式智能解决方案,包括AI翻译、英文润色、双语审校、语法分析等多种能力,是智能时代不可或缺的翻译生产力终极加速器。

fanyi.baidu.com 2024-04-27

文心智能体平台 文心智能体平台

文心智能体平台(原灵境矩阵)是百度推出的基于文心大模型的智能体构建平台,允许开发者通过零代码或低代码的方式,利用自然语言交互快速创建智能体。该平台旨在降低技术门槛,使得普通用户也能成为智能体开发者。

ai-bot.cn 2024-04-27

HELM HELM

HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景,一个适配模型的提示,以及一个或多个指标。

ai-bot.cn 2024-04-27

MMBench MMBench

MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。

ai-bot.cn 2024-04-27

CMMLU CMMLU

CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力,涵盖了从基础学科到高级专业水平的67个主题。

ai-bot.cn 2024-04-27

OpenCompass OpenCompass

OpenCompass是由上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。

ai-bot.cn 2024-04-27

SuperCLUE SuperCLUE

SuperCLUE是一个中文通用大模型综合性评测基准,从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。

ai-bot.cn 2024-04-27

MMLU MMLU

MMLU全称MassiveMultitaskLanguageUnderstanding,是一种针对大模型的语言理解能力的测评,是目前最著名的大模型语义理解测评之一,由UCBerkeley大学的研究人员在2020年9月推出。

ai-bot.cn 2024-04-27

天壤小白 天壤小白

天壤小白应用开发平台是一个专为开发者设计的平台,旨在帮助用户轻松构建、管理和运营基于天壤小白大语言模型的AI应用。该平台利用天壤小白的1860亿参数大模型,结合Embedding模型,允许用户通过编写自然语言的方式创建可信赖的商业级AI应用。

ai-bot.cn 2024-04-27