多资源自动收录
免费加入

网站提交

T9源码资源网 T9源码资源网

T9源码资源网是国内专业的网站,收集全网php源码,asp源码,net源码,精品CMS模板,建站资源,源码评测,免费副业项目,搬砖项目,网站源码,软件源码,技术教程,无人直播等资源,提供给开发者团队等群体丰富的多种类源码资源下载学习。

www.t9it.cn 2024-11-28

HELM HELM

HELM是由斯坦福大学推出的大模型评测体系,该评测方法主要包括场景、适配、指标三个模块,每次评测的运行都需要指定一个场景,一个适配模型的提示,以及一个或多个指标。

ai-bot.cn 2024-04-27

MMBench MMBench

MMBench是一个多模态基准测试,该体系开发了一个综合评估流程,从感知到认知能力逐级细分评估,覆盖20项细粒度能力,从互联网与权威基准数据集采集约3000道单项选择题。打破常规一问一答基于规则匹配提取选项进行评测,循环打乱选项验证输出结果的一致性,基于ChatGPT精准匹配模型回复至选项。

ai-bot.cn 2024-04-27

OpenCompass OpenCompass

OpenCompass是由上海人工智能实验室(上海AI实验室)于2023年8月正式推出的大模型开放评测体系,通过完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测,并定期公布评测结果榜单。

ai-bot.cn 2024-04-27

SuperCLUE SuperCLUE

SuperCLUE是一个中文通用大模型综合性评测基准,从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。

ai-bot.cn 2024-04-27

百度移动云测试中心 百度移动云测试中心

百度移动云测试中心简称MTC(MobileTestingCenter),是业界领先的移动应用一站式测试服务平台,为广大企业、开发者提供覆盖产品全生命周期的测试服务,包括兼容性测试、功能测试、远程真机调试、安全测试、海量用户体验测试等核心测试服务,解决企业在移动应用测试过程中面临的成本、技术和效率问题。

mtc.baidu.com 2024-04-27

极客公园 极客公园

极客公园聚焦互联网领域,跟踪新鲜的科技新闻动态,关注极具创新精神的科技产品。

www.geekpark.net 2024-04-27

AI大模型评测基准和排行榜 AI大模型评测基准和排行榜

人工智能大模型LLM评估基准、排行榜和数据集,帮助你查看各大主流开源和非公开大模型的评测得分。

ai-bot.cn 2024-04-27

懂车帝 懂车帝

懂车帝是一个汽车资讯平台,懂车更懂你。懂车帝资讯平台会聪明地分析你的兴趣爱好,自动为你推荐喜欢的汽车内容,提供最新汽车报价,汽车图片,汽车价格大全,汽车新闻、行情、评测、导购等内容,是提供信息最快最全的中国汽车网站,看车选车买车就上懂车帝。

dongchedi.com 2024-04-27

机锋网 机锋网

机锋网是中国领先的科技互动新媒体,关注手机、3C数码、家电等科技产品、生活方式和消费升级,提供优质、专业、有趣的新闻资讯、产品体验、攻略玩法、购买建议及视频评测等内容服务。

www.gfan.com 2024-04-27