microsoft/VibeVoice 한국어 분석

🎙️ VibeVoice: 오픈소스 최첨단 음성 AI

📰 뉴스

2026-03-06: 🚀 VibeVoice ASR이 이제 Transformers 릴리스의 일부가 되었습니다! 이제 Hugging Face Transformers 라이브러리를 통해 음성 인식 모델을 직접 사용하여 프로젝트에 매끄럽게 통합할 수 있습니다.

2026-01-21: 📣 우리는 60분 길이의 오디오를 한 번에 처리하고, 화자(Who), 타임스탬프(When), 내용(What)을 포함한 구조화된 전사를 생성하며 사용자 맞춤 컨텍스트를 지원하는 통합 음성-텍스트 모델 VibeVoice-ASR을 오픈소스로 공개했습니다. Playground에서 사용해 보세요.

⭐️ VibeVoice-ASR은 기본적으로 다국어를 지원하며, 50개 이상의 언어를 지원합니다 — 지원 언어는 자세한 내용을 확인하세요.
🔥 VibeVoice-ASR 파인튜닝 코드가 이제 공개되었습니다!
⚡️ vLLM 추론이 이제 지원되어 더 빠른 추론이 가능합니다; 자세한 내용은 vllm-asr를 참고하세요.
📑 VibeVoice-ASR 기술 보고서가 제공됩니다.

2025-12-16: 📣 탐색을 위해 VibeVoice‑Realtime‑0.5B에 실험적인 화자를 추가했습니다. 여기에는 9개 언어(DE, FR, IT, JP, KR, NL, PL, PT, ES)의 다국어 음성과 11개의 다양한 영어 스타일 음성이 포함됩니다. 사용해 보세요. 더 많은 화자 유형이 시간이 지남에 따라 추가될 예정입니다.

2025-12-03: 📣 텍스트 스트리밍 입력과 장기 음성 생성 지원을 포함한 실시간 텍스트-음성 모델 VibeVoice‑Realtime‑0.5B를 오픈소스로 공개했습니다. Colab에서 사용해 보세요.

2025-09-05: VibeVoice는 음성 합성 분야의 협업을 촉진하기 위한 오픈소스 연구 프레임워크입니다.

🚀 가벼운 미리보기 모드: 페이지 속도를 위해 핵심 도입부만 번역되었습니다. 전체 코드는 원문 GitHub에서 확인하세요!

microsoft / VibeVoice

이 프로젝트에 대해

Language Breakdown

🇰🇷 한국어 번역 README

🎙️ VibeVoice: 오픈소스 최첨단 음성 AI