【新芒xAI】AI聊天机器人排名：GPT-4占主导，Gemini Pro第二，竞争加剧

新芒x 2月21日消息 在最新的一份人工智能聊天机器人的众包排名中，谷歌的 Gemini Pro 目前排名第二，仅次于 OpenAI 的 GPT-4。

Gemini Pro 由 DeepMind 和 Google Research 开发，是 Google Gemini 系列中的中型型号，为以前称为 Bard 的聊天机器人提供支持。

大型模型系统组织 (LMSys) 去年 5 月推出了 Chatbot Arena，通过众包盲测对大语言模型进行 Elo 式排名。LMSys 研究小组由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学共同成立。

工作原理：用户提交提示，比较两个模型的匿名回复，然后投票选出更好的一个。该排名基于国际象棋中流行的 Elo 评级系统，经常更新并在线提供。截至 12 月，LMSys 已收集了 45 个模型的超过 130,000 个盲配对评级。

数据显示：自一年前该模型发布以来，OpenAI 的 GPT-4 的各个版本一直占据着排行榜的主导地位。但谷歌的 Gemini Pro（之前的 Bard）和巴黎 Mistral AI 的 Mistral-Medium 近几个月的排名有所上升。

一月份，Gemini Pro 超越了 OpenAI 的较旧 GPT-4 模型 (0314)，以超过 1200 分的成绩成为 LMSYS 排行榜上得分第二高的聊天机器人，这是之前只有一个其他模型实现的里程碑。GPT-4 和 Gemini Pro 的性能继续优于 Anthropic 的 Claude 模型和阿里巴巴的 Qwen 模型等的所有版本。

打赏

【新芒xAI】AI聊天机器人排名：GPT-4占主导，Gemini Pro第二，竞争加剧

作者: 新芒Group

微信扫一扫关注我们