LMArena 正式更名为 Arena
起初这只是一个对比 AI 语言模型的博士研究实验,随着时间的推移,在数百万用户的塑造下,它已成长为更广阔的全球基准。
数以百万计的全球社区成员带来了真实的提示词、专家的判断、全新的多模态交互以及多样化的 AI 协作方式。这个源自 UC Berkeley 的学术研究项目,现已演变成一个评估 AI 在实践中真实表现的权威平台。今天,我们很高兴展示与我们科学使命相匹配的全新视觉形象:测量并推进现实世界 AI 的前沿。
这种进化正是我们将名称简化为 Arena 的原因。现在请访问:arena.ai。
为何选择 “Arena”
我们的 Arena 是一个透明、共享的空间。在这里,前沿 AI 的能力被测试、被对比,并由人类的判断力来定型。每天,人们都在使用 Arena 通过真实的各种任务——写作、编程、推理、设计、搜索和创造——来对模型进行压力测试。这些交互产生了真实世界效用的信号,这是任何静态 Benchmark(基准测试)都无法单独捕捉到的。
三年前当我们开发 Chatbot Arena 时,我们创造了 “Arena” 一词,意为一个模型竞争并由真实用户评判的竞技场。现在,我们的平台已成为事实上的 Arena,我们已经超越了 “LM” 的范畴。
Introducing the Pillar / 引入石柱
The Pillar(石柱) 代表着我们放置进步成果的基座,代表着评估的基础性角色,也代表着我们为不断增长的社区所构建的平台。
在探索了数十种潜在的 Logo 后,我们选定了一个标志,它象征着竞技场,却摒弃了展现整个斗兽场的复杂性。我们的新标志经过精心设计,旨在传递高端、技术化且深深植根于信任的感觉。
色彩与排版:砂砾的温度
“Arena” 在拉丁语中意为“砂砾(Sand)”,这就是为什么我们的新色板中带着淡淡的黄色调。这种暖色调也让浅色看起来像一张饱经风霜的笔记本页面。
深色则给人一种磨损的皮革封面教科书的质感。品牌色彩(黄、红、蓝、绿、蓝绿)具有强烈的学术感,在我们的图表和数据分析中表现得极为出色。