icon of Arena

Arena

透過並排評估和人類投票對前沿AI模型進行基準測試和比較的社群驅動平台。

image for Arena

產品概覽

Arena 是什麼?

Arena(前身為LMArena)是一個基準測試平台,使使用者能夠透過真實世界使用評估和比較前沿AI模型。該平台提供匿名的頭對頭模型對戰,使用者同時與兩個模型聊天並為更好的回應投票,創建基於人類偏好的眾包排行榜。Arena提供來自各種提供商的領先模型存取,無需多個訂閱,並配備'Max'智慧路由器,自動將查詢導向最合適的模型。該平台的Bradley-Terry評級系統匯總社群投票,在文字、圖像、影片、搜尋和程式碼能力方面生成可靠的排名。


主要功能

  • 匿名模型對戰

    對戰模式同時提供兩個匿名AI模型,允許在投票前進行無偏見評估,投票後再揭示模型身份以消除品牌偏見。

  • 智慧模型路由器

    Max路由器自動分析查詢並將其導向最合適的AI模型,無需使用者手動為不同任務選擇模型。

  • 社群驅動的排行榜

    基於人類投票的即時排名,使用Bradley-Terry評級系統,在文字、圖像、影片、搜尋和程式碼等多個類別中提供透明的基準測試。

  • 多提供商存取

    透過單一平台存取主要AI實驗室的前沿模型,無需單獨訂閱,提供比單個服務訂閱更具成本效益的替代方案。

  • 持續模型評估

    透過真實使用者互動持續評估AI模型效能,將回饋分享給模型開發者以推動改進。


使用案例

  • 模型效能研究 : AI研究人員和愛好者可以在真實世界條件下比較前沿模型,了解不同任務類型的相對優勢和劣勢。
  • 經濟實惠的AI存取 : 使用者可以透過單一訂閱以低於ChatGPT Plus的成本存取多個高級AI模型,同時避免管理多個帳戶的複雜性。
  • 無偏見的模型選擇 : 評估AI解決方案的組織可以基於盲測結果而非行銷宣傳或品牌認知做出資料驅動的決策。
  • AI模型開發 : AI實驗室可以收集真實的使用者回饋和效能資料,基於真實世界的使用模式和偏好來完善其模型。
  • 任務最佳化查詢 : 使用者利用Max路由器自動將其特定提示與該特定任務的最佳效能模型匹配,無需手動選擇。

常見問題

Arena 網站分析

Arena 流量與排名
31.81M
月訪問量
00:10:26
平均訪問時長
30
類別排名
0.3%
用戶跳出率
流量趨勢:Dec 2025 - Feb 2026
Arena 的熱門地區
  1. 🇮🇳 IN: 14.62%

  2. 🇷🇺 RU: 10.94%

  3. 🇺🇸 US: 8.53%

  4. 🇧🇷 BR: 5.03%

  5. 🇪🇬 EG: 2.65%

  6. Others: 58.23%