icon of LM Arena (Chatbot Arena)

LM Arena (Chatbot Arena)

Plateforme open source et communautaire pour le benchmarking en direct et l'évaluation des grands modèles de langage (LLMs) via des comparaisons pairwise participatives et des classements Elo.

image for LM Arena (Chatbot Arena)

Aperçu du produit

Qu'est-ce que LM Arena (Chatbot Arena) ?

LM Arena, également connu sous le nom de Chatbot Arena, est une plateforme open source développée par LMSYS et UC Berkeley SkyLab pour faire progresser le développement et la compréhension des grands modèles de langage grâce à des évaluations en direct, transparentes et communautaires. Elle permet aux utilisateurs d'interagir avec plusieurs LLMs côte à côte dans des duels anonymes, collectant des votes pour classer les modèles via le système Elo. La plateforme prend en charge une large gamme de modèles publiquement disponibles, incluant à la fois les open-weight et les API commerciales, et met à jour son classement en continu selon les retours réels des utilisateurs. LM Arena met l'accent sur la transparence, la science ouverte et la collaboration en partageant ouvertement jeux de données, outils d'évaluation et infrastructure sur GitHub.


Fonctionnalités clés

  • Comparaison Pairwise Participative des Modèles

    Les utilisateurs participent à des duels anonymes et aléatoires entre deux LLMs, votant pour la meilleure réponse afin de générer des données comparatives fiables.

  • Classement des Modèles par Système Elo

    Utilise le système de classement Elo largement reconnu afin de fournir des classements dynamiques et statistiquement fiables des performances des LLMs.

  • Infrastructure Open Source

    Tous les composants de la plateforme, y compris le frontend, le backend, les pipelines d'évaluation et les algorithmes de classement, sont open source et disponibles publiquement.

  • Évaluation Continue et en Temps Réel

    La collecte en temps réel des invites et des votes des utilisateurs permet un benchmarking à jour reflétant les capacités actuelles des modèles et les cas d'utilisation réels.

  • Prise en Charge des Modèles Publiquement Disponibles

    Inclut les modèles open-weight, accessibles publiquement via API ou disponibles en tant que services, garantissant la transparence et la reproductibilité.

  • Engagement Communautaire et Transparence

    Encourage une large participation et partage ouvertement les données de préférences et les invites des utilisateurs afin de favoriser la recherche collaborative en IA.


Cas d'utilisation

  • Évaluation des Performances des LLMs : Les chercheurs et développeurs peuvent évaluer et comparer l'efficacité de différents grands modèles de langage dans des conditions réelles.
  • Sélection de Modèle pour le Déploiement : Les organisations peuvent identifier les LLMs les plus performants pour leurs applications spécifiques en consultant les classements dynamiques issus de la communauté.
  • Science Ouverte et Recherche : Les universitaires et praticiens de l'IA ont accès à des jeux de données partagés et à des outils pour mener des recherches reproductibles et améliorer le développement des modèles.
  • Retour Communautaire pour l'Amélioration des Modèles : Les fournisseurs de modèles peuvent recueillir des retours anonymisés et des données de vote des utilisateurs afin d'affiner et d'améliorer leurs systèmes d'IA avant les sorties officielles.

FAQ

Alternatives à LM Arena (Chatbot Arena)

🚀
icon

RunPod

Une plateforme cloud optimisée pour les charges de travail IA, offrant des ressources GPU évolutives pour l'entraînement, l'affinage et le déploiement de modèles IA.

♨️ 1.93M🇺🇸 21.94%
Paid
icon

Geekbench

Un outil de benchmarking multiplateforme mesurant les performances CPU et GPU sur divers appareils et systèmes d'exploitation.

♨️ 1.06M🇺🇸 17.41%
Paid
icon

Ballpark

Une plateforme de recherche utilisateur qui simplifie la collecte de retours de haute qualité sur les idées produit, les messages marketing, les designs et les prototypes grâce à des méthodes de test polyvalentes et des insights multimédias riches.

♨️ 188.66K🇺🇸 47.1%
Freemium
icon

Sakana AI

Entreprise de recherche en IA basée à Tokyo, pionnière des modèles fondamentaux inspirés de la nature et de la découverte scientifique automatisée par IA.

♨️ 162.27K🇯🇵 23.7%
Paid
icon

Userbrain

Plateforme de test utilisateur distant non modéré rationalisant la recherche UX grâce à un pool de testeurs mondial et des outils d'analyse automatisés.

♨️ 131.56K🇺🇸 31.38%
Free Trial
icon

MindSpore

Un framework open-source de deep learning tous scénarios, conçu pour un développement facile, une exécution efficace et un déploiement unifié sur le cloud, l'edge et les appareils.

♨️ 101.47K🇨🇳 58.93%
Free
icon

UXArmy

Plateforme complète de recherche utilisateur à distance fournissant des insights d'utilisabilité rapides et exploitables grâce à des enregistrements vidéo et des analyses avancées.

♨️ 59.13K🇵🇭 21.43%
Free Trial

无问芯穹

Plateforme de calcul hétérogène de niveau entreprise permettant un déploiement efficace de grands modèles sur diverses architectures de puces.

♨️ 57.8K🇨🇳 77.68%
Paid

Analytiques du site LM Arena (Chatbot Arena)

Trafic & Classements de LM Arena (Chatbot Arena)
25.32M
Visites mensuelles
00:09:22
Durée moyenne de visite
48
Classement de catégorie
0.34%
Taux de rebond
Tendances de trafic : Oct 2025 - Dec 2025
Régions principales de LM Arena (Chatbot Arena)
  1. 🇷🇺 RU: 13.21%

  2. 🇮🇳 IN: 9.98%

  3. 🇺🇸 US: 9%

  4. 🇨🇳 CN: 6.32%

  5. 🇰🇷 KR: 3.6%

  6. Others: 57.89%