icon of LM Arena (Chatbot Arena)

LM Arena (Chatbot Arena)

Open-Source-, gemeinschaftsgetriebene Plattform für Live-Benchmarking und Bewertung von Large Language Models (LLMs) mittels Crowdsourcing-Paarvergleichen und Elo-Bewertungen.

image for LM Arena (Chatbot Arena)

Produktübersicht

Was ist LM Arena (Chatbot Arena)?

LM Arena, auch bekannt als Chatbot Arena, ist eine Open-Source-Plattform, die von LMSYS und dem UC Berkeley SkyLab entwickelt wurde, um die Entwicklung und das Verständnis von Large Language Models durch Live-, transparente und gemeinschaftsgetriebene Bewertungen voranzutreiben. Nutzer können mit mehreren LLMs interagieren und diese in anonymen Duellen direkt vergleichen. Die Abstimmungen werden gesammelt, um Modelle mit dem Elo-Bewertungssystem zu ranken. Die Plattform unterstützt eine Vielzahl öffentlich verfügbarer Modelle, darunter sowohl Open-Weight- als auch kommerzielle APIs, und aktualisiert das Leaderboard kontinuierlich basierend auf realem Nutzerfeedback. LM Arena legt Wert auf Transparenz, Open Science und Zusammenarbeit, indem Datensätze, Evaluationswerkzeuge und Infrastruktur offen auf GitHub geteilt werden.


Hauptfunktionen

  • Crowdsourcing-Paarvergleich von Modellen

    Nutzer nehmen anonym an zufälligen Duellen zwischen zwei LLMs teil und stimmen für die bessere Antwort ab, um zuverlässige Vergleichsdaten zu generieren.

  • Elo-Bewertungssystem für Modell-Rankings

    Verwendet das weithin anerkannte Elo-Bewertungssystem, um dynamische, statistisch fundierte Rankings der LLM-Leistung bereitzustellen.

  • Open-Source-Infrastruktur

    Alle Plattformkomponenten, einschließlich Frontend, Backend, Evaluationspipelines und Ranking-Algorithmen, sind Open Source und öffentlich verfügbar.

  • Live- und kontinuierliche Bewertung

    Die Echtzeit-Erfassung von Nutzeranfragen und Abstimmungen sorgt für aktuelle Benchmarks, die die Fähigkeiten der Modelle und reale Anwendungsfälle widerspiegeln.

  • Unterstützung für öffentlich verfügbare Modelle

    Beinhaltet Modelle, die Open-Weight sind, öffentlich über APIs zugänglich oder als Services verfügbar sind, um Transparenz und Reproduzierbarkeit zu gewährleisten.

  • Community-Beteiligung und Transparenz

    Fördert breite Beteiligung und teilt Nutzervorlieben und Prompts offen, um kollaborative KI-Forschung zu unterstützen.


Anwendungsfälle

  • LLM-Leistungsbenchmarking : Forscher und Entwickler können die Effektivität verschiedener Large Language Models unter realen Bedingungen bewerten und vergleichen.
  • Modellauswahl für den Einsatz : Organisationen können die leistungsstärksten LLMs für ihre spezifischen Anwendungen anhand der aktuellen, gemeinschaftsbasierten Rankings identifizieren.
  • Open Science und Forschung : Akademiker und KI-Praktiker haben Zugriff auf gemeinsame Datensätze und Tools, um reproduzierbare Forschung durchzuführen und die Modellentwicklung zu verbessern.
  • Community-Feedback zur Modellverbesserung : Modellanbieter können anonymisiertes Nutzerfeedback und Abstimmungsdaten sammeln, um ihre KI-Systeme vor offiziellen Releases zu optimieren.

Häufig gestellte Fragen

LM Arena (Chatbot Arena) Alternativen

🚀
icon

RunPod

Eine Cloud-Computing-Plattform, die für KI-Workloads optimiert ist und skalierbare GPU-Ressourcen für das Training, die Feinabstimmung und Bereitstellung von KI-Modellen bietet.

♨️ 1.89M🇺🇸 22.87%
Paid
icon

Geekbench

Ein plattformübergreifendes Benchmark-Tool zur Messung der CPU- und GPU-Leistung auf verschiedenen Geräten und Betriebssystemen.

♨️ 834.36K🇺🇸 17.07%
Paid
icon

MiroMind

Ein Forschungsassistent, der Open-Source-Modelle für tiefgreifende Datenanalyse, Web-Suche und Code-Generierung nutzt.

♨️ 484.68K🇨🇳 79.5%
Paid
icon

Sakana AI

Tokio-basiertes AI-Forschungsunternehmen, das naturinspirierte Foundation Models und vollautomatisierte, AI-getriebene wissenschaftliche Entdeckungen vorantreibt.

♨️ 166.77K🇺🇸 31%
Paid
icon

Ballpark

Eine User-Research-Plattform, die das Erfassen von hochwertigem Feedback zu Produktideen, Marketingtexten, Designs und Prototypen mit vielseitigen Testmethoden und umfassenden Medien-Insights vereinfacht.

♨️ 122.2K🇺🇸 53.15%
Freemium
icon

Userbrain

Unmoderierte Remote-Nutzertestplattform, die UX-Forschung durch einen globalen Tester-Pool und automatisierte Analysetools optimiert.

♨️ 114.83K🇺🇸 29.82%
Free Trial
icon

MindSpore

Ein Open-Source-Deep-Learning-Framework für alle Szenarien, das einfache Entwicklung, effiziente Ausführung und einheitliche Bereitstellung über Cloud-, Edge- und Geräteumgebungen hinweg ermöglicht.

♨️ 59.57K🇨🇳 30.51%
Free
icon

LAION

Gemeinnützige Organisation, die umfangreiche offene Datensätze, Modelle und Tools bereitstellt, um zugängliche und nachhaltige Forschung im Bereich maschinelles Lernen zu unterstützen.

♨️ 35.22K🇺🇸 23.6%
Free

Analytik der LM Arena (Chatbot Arena) Website

LM Arena (Chatbot Arena) Traffic & Rankings
3.45M
Monatliche Besuche
00:03:57
Durchschn. Besuchsdauer
59
Kategorie-Rang
0.58%
Absprungrate
Traffic-Trends: Dec 2025 - Feb 2026
Top-Regionen von LM Arena (Chatbot Arena)
  1. 🇨🇳 CN: 57.85%

  2. 🇷🇺 RU: 3.5%

  3. 🇮🇳 IN: 2.72%

  4. 🇸🇳 SN: 2.29%

  5. 🇺🇸 US: 1.66%

  6. Others: 31.97%