🚀 後端近期已完成升級。如遇到任何問題請告訴我們

Arena

透過並排評估和人類投票對前沿AI模型進行基準測試和比較的社群驅動平台。

大型語言模型 (LLMs)調研工具 AI 對話客戶端 AI 分析助手

Arena preview

Atoms - 以 AI 建立網站與應用程式，無需程式碼

InsForge

智能體原生的 AWS 替代方案。免配置，支援 AI 透過 CLI／Skills 端到端運行全端應用。

概覽
替代方案
分析

Atoms - 以 AI 建立網站與應用程式，無需程式碼

產品概覽

Arena 是什麼？

Arena（前身為LMArena）是一個基準測試平台，使使用者能夠透過真實世界使用評估和比較前沿AI模型。該平台提供匿名的頭對頭模型對戰，使用者同時與兩個模型聊天並為更好的回應投票，創建基於人類偏好的眾包排行榜。Arena提供來自各種提供商的領先模型存取，無需多個訂閱，並配備'Max'智慧路由器，自動將查詢導向最合適的模型。該平台的Bradley-Terry評級系統匯總社群投票，在文字、圖像、影片、搜尋和程式碼能力方面生成可靠的排名。

主要功能

匿名模型對戰
對戰模式同時提供兩個匿名AI模型，允許在投票前進行無偏見評估，投票後再揭示模型身份以消除品牌偏見。
智慧模型路由器
Max路由器自動分析查詢並將其導向最合適的AI模型，無需使用者手動為不同任務選擇模型。
社群驅動的排行榜
基於人類投票的即時排名，使用Bradley-Terry評級系統，在文字、圖像、影片、搜尋和程式碼等多個類別中提供透明的基準測試。
多提供商存取
透過單一平台存取主要AI實驗室的前沿模型，無需單獨訂閱，提供比單個服務訂閱更具成本效益的替代方案。
持續模型評估
透過真實使用者互動持續評估AI模型效能，將回饋分享給模型開發者以推動改進。

使用案例

模型效能研究 : AI研究人員和愛好者可以在真實世界條件下比較前沿模型，了解不同任務類型的相對優勢和劣勢。
經濟實惠的AI存取 : 使用者可以透過單一訂閱以低於ChatGPT Plus的成本存取多個高級AI模型，同時避免管理多個帳戶的複雜性。
無偏見的模型選擇 : 評估AI解決方案的組織可以基於盲測結果而非行銷宣傳或品牌認知做出資料驅動的決策。
AI模型開發 : AI實驗室可以收集真實的使用者回饋和效能資料，基於真實世界的使用模式和偏好來完善其模型。
任務最佳化查詢 : 使用者利用Max路由器自動將其特定提示與該特定任務的最佳效能模型匹配，無需手動選擇。

常見問題

InsForge

智能體原生的 AWS 替代方案。免配置，支援 AI 透過 CLI／Skills 端到端運行全端應用。

Arena 的替代方案

🚀

Use AI

一個單訂閱平台，整合了25+個領先的LLM模型，為聊天、研究、程式設計、寫作等提供無縫的多模型存取。

♨️ 27.11M🇺🇸 11.55%

Kimi AI

免費多模態AI助理，具備即時網路搜尋、進階推理與超大上下文處理能力，適用於多元專業與創意任務。

♨️ 45.3M🇨🇳 53.19%

Ollama

在地推論引擎，讓使用者可於本機直接執行與管理大型語言模型（LLM），強化隱私、自訂化與離線 AI 能力。

♨️ 11.05M🇺🇸 13.81%

AnythingLLM

全方位 AI 桌面應用，支援本地與雲端 LLM、文件對話、AI 智能代理，並強調隱私與零設定啟用。

♨️ 681.58K🇺🇸 16.51%

Eye2.ai

免費的AI比較平台，讓您一次提問即可立即看到多個領先AI模型的並排回應和共識標示。

♨️ 81.26K🇺🇸 36%

Goover AI

先進 AI 個人化研究助手，結合神經符號技術與大型語言模型，協助領域知識探索與即時洞察。

♨️ 71.42K🇰🇷 97.21%

Mochii AI

一站式AI助理，免費存取頂級AI模型，強化網頁瀏覽、研究與生產力，多平台支援。

♨️ 49.26K🇧🇷 17.92%

LAION

非營利組織提供龐大開放資料集、模型和工具，支持可存取和永續的機器學習研究。

♨️ 31.12K🇺🇸 35.5%

Arena 網站分析

流量與排名

34.72M

月訪問量

00:08:11

平均訪問時長

#32

類別排名

0.34%

用戶跳出率

流量趨勢：Mar 2026 - May 2026

Arena 的熱門地區

🇮🇳 IN: 12.96%

🇷🇺 RU: 11.78%

🇺🇸 US: 7.69%

🇧🇷 BR: 3.68%

🇫🇷 FR: 3.14%

Others: 60.75%