OpenWhispr

macOS, Windows, Linux에서 로컬 또는 클라우드 모델을 사용하여 빠르고 개인정보 보호 우선의 음성-텍스트를 제공하는 오픈 소스 데스크톱 받아쓰기 앱입니다.

커뮤니티:

AI 음성 인식 음성에서 텍스트로

웹사이트 방문

Atoms - AI로 코드 없이 웹사이트·앱 제작

InsForge

Sponsor

AWS의 agent-native 대안. CLI와 skills로 full-stack 앱을 end-to-end로 실행

개요
대안
분석

Atoms - AI로 코드 없이 웹사이트·앱 제작

제품 개요

OpenWhispr이란 무엇인가요?

OpenWhispr는 모든 데스크톱 애플리케이션에서 음성을 즉시 텍스트로 변환하는 오픈 소스 음성-텍스트 받아쓰기 애플리케이션입니다. 로컬 Whisper 또는 NVIDIA Parakeet 모델을 사용하여 장치에서 음성 인식을 완전히 실행하므로 음성이 절대 기계를 떠나지 않으며, 선택적으로 더 빠른 처리를 위해 클라우드 API를 사용할 수 있습니다. 이 도구는 오프라인으로 작동하며 100개 이상의 언어와 자동 감지를 지원하고 Slack, Google Docs, ChatGPT, Claude, Cursor, Gmail, Teams 등의 애플리케이션과 원활하게 통합됩니다. 사용자는 분당 약 150단어의 속도로 받아쓰기할 수 있으며, 이는 타이핑보다 약 3배 빠르며, 음성 명령을 사용하여 텍스트를 정리하거나 이메일을 초안 작성할 수 있습니다.

주요 기능

개인정보 보호 우선 로컬 처리
로컬 Whisper 또는 NVIDIA Parakeet 모델을 사용하여 장치에서 음성을 텍스트로 완전히 변환하며, 데이터 보존이 없습니다. 음성이 어디로도 전송되지 않으며, 모델 다운로드 후 인터넷이 필요하지 않습니다.
크로스 플랫폼 데스크톱 받아쓰기
macOS, Windows, Linux에서 Slack, Google Docs, ChatGPT, Claude, Cursor, Gmail, Teams 등 텍스트를 입력받는 모든 애플리케이션에서 작동하며, 간단한 단축키로 사용할 수 있습니다.
음성 명령 및 AI 정리
'정리해줘' 또는 'Mike에게 이메일 초안 작성'과 같은 음성 지시를 내립니다. 도구는 음성 명령에 따라 텍스트를 자동으로 형식화하거나 편집합니다.
100개 이상의 언어 및 자동 감지
100개 이상의 언어를 지원하며 자동 언어 감지 기능이 있어 수동 설정 없이 대화 중간에 언어를 전환할 수 있습니다.
사용자 정의 사전 및 자동 학습
의료, 법률 또는 기술 용어에 대한 사용자 정의 단어를 추가하고, 시스템이 수정 사항에서 자동으로 학습하여 시간이 지남에 따라 정확도를 향상시킵니다.
오프라인 모드 및 다중 모델 옵션
여러 로컬 Whisper 모델(Tiny, Base, Small, Medium, Turbo) 또는 NVIDIA Parakeet 중에서 선택하여 속도/정확도 트레이드오프를 조정하고, 클라우드 처리를 위해 자신의 API 키를 사용할 수 있습니다.

사용 사례

빠른 작성 및 콘텐츠 생성 : 작가와 크리에이터는 모든 애플리케이션에서 이메일, 문서, 기사, 소셜 미디어 게시물을 타이핑보다 3배 빠르게 받아쓰기로 작성합니다.
LLM 프롬프팅 및 개발자 워크플로우 : 개발자는 긴 코드나 질문을 입력하는 대신 음성으로 ChatGPT, Claude, Cursor 및 기타 AI 도구에 빠르게 프롬프트를 제공합니다.
회의 기록 및 전사 : Google Calendar를 연결하여 Zoom, Teams, FaceTime 회의를 자동으로 전사하고 발표자 레이블을 추가하여 향상된 회의 기록을 생성합니다.
개인정보 보호 민감 전문 받아쓰기 : 법률, 의료, 저널리즘 전문가는 로컬 전용 처리를 사용하여 특권 또는 민감한 콘텐츠를 클라우드 전송 없이 장치에만 보관합니다.
다국어 통신 : 100개 이상의 언어를 사용하는 사용자는 국제 협업, 번역 작업 또는 언어 학습을 위해 원활하게 전환합니다.