icon of LM Arena (Chatbot Arena)

LM Arena (Chatbot Arena)

Plataforma open-source e orientada pela comunidade para benchmarking e avaliação ao vivo de Large Language Models (LLMs) usando comparações por pares e classificação Elo.

image for LM Arena (Chatbot Arena)

Visão Geral do Produto

O que é LM Arena (Chatbot Arena)?

LM Arena, também conhecida como Chatbot Arena, é uma plataforma open-source desenvolvida pela LMSYS e UC Berkeley SkyLab para avançar o desenvolvimento e a compreensão de Large Language Models por meio de avaliações ao vivo, transparentes e impulsionadas pela comunidade. Permite que usuários interajam e comparem múltiplos LLMs lado a lado em batalhas anônimas, coletando votos para ranquear os modelos usando o sistema Elo. A plataforma suporta uma ampla gama de modelos publicamente lançados, incluindo tanto open-weight quanto APIs comerciais, e atualiza continuamente seu leaderboard com base no feedback real dos usuários. LM Arena enfatiza transparência, ciência aberta e colaboração ao compartilhar conjuntos de dados, ferramentas de avaliação e infraestrutura abertamente no GitHub.


Recursos Principais

  • Comparação de Modelos por Pares com Participação da Comunidade

    Usuários participam de batalhas anônimas e aleatórias entre dois LLMs, votando na melhor resposta para gerar dados comparativos confiáveis.

  • Sistema de Classificação Elo para Ranqueamento de Modelos

    Adota o reconhecido sistema de classificação Elo para fornecer rankings dinâmicos e estatisticamente sólidos do desempenho dos LLMs.

  • Infraestrutura Open-Source

    Todos os componentes da plataforma, incluindo frontend, backend, pipelines de avaliação e algoritmos de ranking, são open source e publicamente disponíveis.

  • Avaliação Contínua e em Tempo Real

    A coleta em tempo real de prompts e votos dos usuários garante benchmarking atualizado, refletindo as capacidades atuais dos modelos e casos de uso reais.

  • Suporte para Modelos Publicamente Disponíveis

    Inclui modelos que são open-weight, acessíveis publicamente via APIs ou disponíveis como serviços, garantindo transparência e reprodutibilidade.

  • Engajamento da Comunidade e Transparência

    Incentiva ampla participação e compartilha abertamente dados de preferência dos usuários e prompts para fomentar a pesquisa colaborativa em IA.


Casos de Uso

  • Benchmarking de Desempenho de LLMs : Pesquisadores e desenvolvedores podem avaliar e comparar a eficácia de diversos Large Language Models em condições reais.
  • Seleção de Modelos para Deploy : Organizações podem identificar os LLMs com melhor desempenho para suas aplicações específicas revisando os rankings ao vivo gerados pela comunidade.
  • Ciência Aberta e Pesquisa : Acadêmicos e profissionais de IA podem acessar conjuntos de dados e ferramentas compartilhados para conduzir pesquisas reprodutíveis e melhorar o desenvolvimento de modelos.
  • Feedback da Comunidade para Melhoria de Modelos : Provedores de modelos podem coletar feedback anônimo dos usuários e dados de votação para refinar e aprimorar seus sistemas de IA antes de lançamentos oficiais.

Perguntas Frequentes

Alternativas ao LM Arena (Chatbot Arena)

🚀
icon

RunPod

Uma plataforma de computação em nuvem otimizada para cargas de trabalho de IA, oferecendo recursos de GPU escaláveis para treinamento, ajuste fino e implantação de modelos de IA.

♨️ 2.3M🇺🇸 28.16%
Paid
icon

Geekbench

Uma ferramenta de benchmarking multiplataforma que mede o desempenho de CPU e GPU em diversos dispositivos e sistemas operacionais.

♨️ 923K🇺🇸 16.93%
Paid
icon

MiroMind

Um assistente de pesquisa que aproveita modelos open source para análise profunda de dados, busca web e geração de código.

♨️ 364.29K🇨🇳 65.95%
Paid
icon

Sakana AI

Empresa de pesquisa em IA sediada em Tóquio, pioneira em modelos fundamentais inspirados na natureza e descoberta científica automatizada por IA.

♨️ 363.86K🇯🇵 53.46%
Paid

无问芯穹

Plataforma de computação heterogénea de nível empresarial que permite a implementação eficiente de grandes modelos em diversas arquiteturas de chips.

♨️ 319.76K🇨🇳 91.04%
Paid
icon

Userbrain

Plataforma de teste de usuário remoto não moderado que simplifica pesquisa UX através de um pool global de testadores e ferramentas de análise automatizadas.

♨️ 107.62K🇬🇧 21.75%
Free Trial
icon

Ballpark

Uma plataforma de pesquisa com usuários que simplifica a captação de feedbacks de alta qualidade sobre ideias de produto, textos de marketing, designs e protótipos com métodos de teste versáteis e insights multimídia avançados.

♨️ 98.51K🇺🇸 47.31%
Freemium
icon

MindSpore

Uma estrutura open-source de deep learning para todos os cenários, projetada para desenvolvimento fácil, execução eficiente e implantação unificada em nuvem, borda e dispositivos.

♨️ 53.57K🇨🇳 36.91%
Free

Análises do site LM Arena (Chatbot Arena)

Tráfego e Classificações do LM Arena (Chatbot Arena)
800.5K
Visitas Mensais
00:00:56
Duração Média da Visita
897
Classificação na Categoria
0.67%
Taxa de Rejeição
Tendências de Tráfego: Feb 2026 - Apr 2026
Principais Regiões do LM Arena (Chatbot Arena)
  1. 🇨🇳 CN: 61.35%

  2. 🇷🇺 RU: 5.58%

  3. 🇸🇳 SN: 2.97%

  4. 🇺🇸 US: 2.34%

  5. 🇮🇳 IN: 1.69%

  6. Others: 26.06%