icon of LM Arena (Chatbot Arena)

LM Arena (Chatbot Arena)

Plataforma open-source e orientada pela comunidade para benchmarking e avaliação ao vivo de Large Language Models (LLMs) usando comparações por pares e classificação Elo.

image for LM Arena (Chatbot Arena)

Visão Geral do Produto

O que é LM Arena (Chatbot Arena)?

LM Arena, também conhecida como Chatbot Arena, é uma plataforma open-source desenvolvida pela LMSYS e UC Berkeley SkyLab para avançar o desenvolvimento e a compreensão de Large Language Models por meio de avaliações ao vivo, transparentes e impulsionadas pela comunidade. Permite que usuários interajam e comparem múltiplos LLMs lado a lado em batalhas anônimas, coletando votos para ranquear os modelos usando o sistema Elo. A plataforma suporta uma ampla gama de modelos publicamente lançados, incluindo tanto open-weight quanto APIs comerciais, e atualiza continuamente seu leaderboard com base no feedback real dos usuários. LM Arena enfatiza transparência, ciência aberta e colaboração ao compartilhar conjuntos de dados, ferramentas de avaliação e infraestrutura abertamente no GitHub.


Recursos Principais

  • Comparação de Modelos por Pares com Participação da Comunidade

    Usuários participam de batalhas anônimas e aleatórias entre dois LLMs, votando na melhor resposta para gerar dados comparativos confiáveis.

  • Sistema de Classificação Elo para Ranqueamento de Modelos

    Adota o reconhecido sistema de classificação Elo para fornecer rankings dinâmicos e estatisticamente sólidos do desempenho dos LLMs.

  • Infraestrutura Open-Source

    Todos os componentes da plataforma, incluindo frontend, backend, pipelines de avaliação e algoritmos de ranking, são open source e publicamente disponíveis.

  • Avaliação Contínua e em Tempo Real

    A coleta em tempo real de prompts e votos dos usuários garante benchmarking atualizado, refletindo as capacidades atuais dos modelos e casos de uso reais.

  • Suporte para Modelos Publicamente Disponíveis

    Inclui modelos que são open-weight, acessíveis publicamente via APIs ou disponíveis como serviços, garantindo transparência e reprodutibilidade.

  • Engajamento da Comunidade e Transparência

    Incentiva ampla participação e compartilha abertamente dados de preferência dos usuários e prompts para fomentar a pesquisa colaborativa em IA.


Casos de Uso

  • Benchmarking de Desempenho de LLMs : Pesquisadores e desenvolvedores podem avaliar e comparar a eficácia de diversos Large Language Models em condições reais.
  • Seleção de Modelos para Deploy : Organizações podem identificar os LLMs com melhor desempenho para suas aplicações específicas revisando os rankings ao vivo gerados pela comunidade.
  • Ciência Aberta e Pesquisa : Acadêmicos e profissionais de IA podem acessar conjuntos de dados e ferramentas compartilhados para conduzir pesquisas reprodutíveis e melhorar o desenvolvimento de modelos.
  • Feedback da Comunidade para Melhoria de Modelos : Provedores de modelos podem coletar feedback anônimo dos usuários e dados de votação para refinar e aprimorar seus sistemas de IA antes de lançamentos oficiais.

Perguntas Frequentes

Alternativas ao LM Arena (Chatbot Arena)

🚀
icon

RunPod

Uma plataforma de computação em nuvem otimizada para cargas de trabalho de IA, oferecendo recursos de GPU escaláveis para treinamento, ajuste fino e implantação de modelos de IA.

♨️ 1.93M🇺🇸 21.94%
Paid
icon

Geekbench

Uma ferramenta de benchmarking multiplataforma que mede o desempenho de CPU e GPU em diversos dispositivos e sistemas operacionais.

♨️ 1.06M🇺🇸 17.41%
Paid
icon

Ballpark

Uma plataforma de pesquisa com usuários que simplifica a captação de feedbacks de alta qualidade sobre ideias de produto, textos de marketing, designs e protótipos com métodos de teste versáteis e insights multimídia avançados.

♨️ 188.66K🇺🇸 47.1%
Freemium
icon

Sakana AI

Empresa de pesquisa em IA sediada em Tóquio, pioneira em modelos fundamentais inspirados na natureza e descoberta científica automatizada por IA.

♨️ 162.27K🇯🇵 23.7%
Paid
icon

Userbrain

Plataforma de teste de usuário remoto não moderado que simplifica pesquisa UX através de um pool global de testadores e ferramentas de análise automatizadas.

♨️ 131.56K🇺🇸 31.38%
Free Trial
icon

MindSpore

Uma estrutura open-source de deep learning para todos os cenários, projetada para desenvolvimento fácil, execução eficiente e implantação unificada em nuvem, borda e dispositivos.

♨️ 101.47K🇨🇳 58.93%
Free
icon

UXArmy

Plataforma abrangente de pesquisa remota de usuários que fornece insights de usabilidade rápidos e acionáveis através de gravações de vídeo e análises avançadas.

♨️ 59.13K🇵🇭 21.43%
Free Trial

无问芯穹

Plataforma de computação heterogénea de nível empresarial que permite a implementação eficiente de grandes modelos em diversas arquiteturas de chips.

♨️ 57.8K🇨🇳 77.68%
Paid

Análises do site LM Arena (Chatbot Arena)

Tráfego e Classificações do LM Arena (Chatbot Arena)
25.32M
Visitas Mensais
00:09:22
Duração Média da Visita
48
Classificação na Categoria
0.34%
Taxa de Rejeição
Tendências de Tráfego: Oct 2025 - Dec 2025
Principais Regiões do LM Arena (Chatbot Arena)
  1. 🇷🇺 RU: 13.21%

  2. 🇮🇳 IN: 9.98%

  3. 🇺🇸 US: 9%

  4. 🇨🇳 CN: 6.32%

  5. 🇰🇷 KR: 3.6%

  6. Others: 57.89%