Arcee AI

벤더 락인 없이 엣지, 온프레미스 또는 클라우드에서 실행되는 효율적인 오픈 웨이트 언어 모델을 구축하는 미국 기반 오픈 인텔리전스 연구소입니다.

커뮤니티:

대형 언어 모델 (LLMs)AI 에이전트 개발 AI 개발자 도구

웹사이트 방문

Atoms - AI로 코드 없이 웹사이트·앱 제작

InsForge

Sponsor

AWS의 agent-native 대안. CLI와 skills로 full-stack 앱을 end-to-end로 실행

개요
대안
분석

Atoms - AI로 코드 없이 웹사이트·앱 제작

제품 개요

Arcee AI이란 무엇인가요?

Arcee AI는 원시 규모보다는 매개변수당 성능에 최적화된 오픈 웨이트 기반 모델 구축에 중점을 둔 미국 모델 연구소입니다. 플래그십 Trinity 모델 패밀리는 Nano, Mini, Large 변형을 포괄하며, 엣지 하드웨어부터 클라우드 인프라까지 다양한 디바이스 크기에서 일관된 기능을 제공합니다. 모든 모델은 Apache-2.0 하에 출시되며 다중 턴 대화, 도구 사용, 구조화된 출력을 지원합니다. Arcee는 또한 기업이 자체 가상 프라이빗 클라우드(VPC) 내에서 더 작고 도메인별 언어 모델을 완전히 훈련, 미세 조정, 배포할 수 있게 하는 SLM 적응 시스템을 제공하여 완전한 데이터 소유권과 제3자 노출 없음을 보장합니다.

주요 기능

Trinity 모델 패밀리
일관된 기능(도구 사용, 구조화된 출력, 다중 턴 일관성)을 공유하는 오픈 웨이트 MoE 모델 시리즈(Nano 6B, Mini 26B, Large 400B)로, 프롬프트 재설계 없이 엣지와 클라우드 간 워크로드 이동을 가능하게 합니다.
완전 VPC 배포
모든 훈련과 추론이 고객의 자체 클라우드 환경에서 완전히 실행됩니다. 데이터는 절대 고객의 인프라를 벗어나지 않으며, 생성된 모델은 완전히 고객 소유입니다.
SLM 적응 시스템
도메인 적응 사전 훈련, 정렬, 검색 증강 생성을 포괄하는 엔드투엔드 파이프라인으로, 일반적인 오픈소스 기반 모델을 처음부터 훈련하는 비용의 일부로 전문화된 프로덕션 준비 SLM으로 변환합니다.
긴 컨텍스트 및 Agent 안정성
Trinity 모델은 희소 MoE 어텐션으로 최대 512K 토큰 컨텍스트 윈도우를 지원하여 정확한 함수 선택, 스키마 준수 JSON 출력, 확장된 세션에서 일관된 다단계 Agent 워크플로를 가능하게 합니다.
유연한 배포 옵션
모델은 호스팅된 OpenAI 호환 API, Hugging Face의 다운로드 가능한 오픈 웨이트, 또는 엔터프라이즈 전용 배포를 통해 제공되며, vLLM, SGLang, llama.cpp 등과 호환됩니다.

사용 사례

엔터프라이즈 SLM 개발 : 조직은 자체 데이터를 사용하여 독점적이고 도메인별 언어 모델을 구축할 수 있으며, 최대한의 제어와 데이터 보안을 위해 VPC 내에서 완전히 훈련하고 배포할 수 있습니다.
Agent 워크플로 : 개발팀은 Trinity의 일관된 크로스 사이즈 스킬 프로파일을 활용하여 복잡한 도구 오케스트레이션, 함수 호출, 장기 작업 실행을 처리하는 안정적인 다단계 AI Agent를 구축할 수 있습니다.
엣지 및 온디바이스 추론 : Trinity Nano의 1B 활성 매개변수는 지연 시간과 프라이버시가 중요한 소비자용 GPU, 모바일 디바이스, 임베디드 시스템에서 오프라인 작동을 가능하게 합니다.
규제 산업 배포 : 금융, 의료, 법률과 같은 산업은 완전히 프라이빗한 VPC 배포를 활용하여 규정 준수 요구사항을 충족하면서도 강력한 언어 모델의 혜택을 누릴 수 있습니다.
음성 어시스턴트 백엔드 : Trinity의 조정 가능한 상세도와 저지연 스트리밍 출력은 실시간 음성 애플리케이션의 LLM 백본으로 적합하며, TTS 시스템에 직접 입력됩니다.