大模型相关网站搜索查询 - 多资源自动收录系统

百度智能云致力于为企业和开发者提供全球领先的人工智能、大数据和云计算服务，加速产业智能化转型升级

百度翻译打造的新一代AI大模型翻译平台，为用户提供翻译和阅读外文场景的一站式智能解决方案，包括AI翻译、英文润色、双语审校、语法分析等多种能力，是智能时代不可或缺的翻译生产力终极加速器。

文心智能体平台（原灵境矩阵）是百度推出的基于文心大模型的智能体构建平台，允许开发者通过零代码或低代码的方式，利用自然语言交互快速创建智能体。该平台旨在降低技术门槛，使得普通用户也能成为智能体开发者。

ai-bot.cn 2024-04-27

HELM是由斯坦福大学推出的大模型评测体系，该评测方法主要包括场景、适配、指标三个模块，每次评测的运行都需要指定一个场景，一个适配模型的提示，以及一个或多个指标。

ai-bot.cn 2024-04-27

MMBench是一个多模态基准测试，该体系开发了一个综合评估流程，从感知到认知能力逐级细分评估，覆盖20项细粒度能力，从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测，循环打乱选项验证输出结果的一致性，基于ChatGPT精准匹配模型回复至选项。

ai-bot.cn 2024-04-27

CMMLU是一个综合性的中文评估基准，专门用于评估语言模型在中文语境下的知识和推理能力，涵盖了从基础学科到高级专业水平的67个主题。

ai-bot.cn 2024-04-27

OpenCompass是由上海人工智能实验室（上海AI实验室）于2023年8月正式推出的大模型开放评测体系，通过完整开源可复现的评测框架，支持大语言模型、多模态模型各类模型的一站式评测，并定期公布评测结果榜单。

ai-bot.cn 2024-04-27

SuperCLUE是一个中文通用大模型综合性评测基准，从三个不同的维度评价模型的能力：基础能力、专业能力和中文特性能力。

ai-bot.cn 2024-04-27

MMLU全称MassiveMultitaskLanguageUnderstanding，是一种针对大模型的语言理解能力的测评，是目前最著名的大模型语义理解测评之一，由UCBerkeley大学的研究人员在2020年9月推出。

ai-bot.cn 2024-04-27

天壤小白应用开发平台是一个专为开发者设计的平台，旨在帮助用户轻松构建、管理和运营基于天壤小白大语言模型的AI应用。该平台利用天壤小白的1860亿参数大模型，结合Embedding模型，允许用户通过编写自然语言的方式创建可信赖的商业级AI应用。

ai-bot.cn 2024-04-27