트렌딩 목록으로
Python

microsoft / VibeVoice

오픈소스 프런티어 음성 AI

48.4K
5.4K
14일 전
GitHub에서 보기

이 프로젝트에 대해

microsoft 님의 VibeVoice 프로젝트는 GitHub에서 48.4K개의 별을 받으며 많은 개발자들의 주목을 받고 있습니다. 특히 Python 환경에서 유용하게 활용될 수 있으며, 최근 오픈소스 커뮤니티에서 활발한 기여와 토론이 이루어지고 있는 트렌딩 레포지토리입니다.

Language Breakdown

Python 100%

🇰🇷 한국어 번역 README

캐시 히트

🎙️ VibeVoice: 오픈소스 최첨단 음성 AI

📰 뉴스

2026-03-06: 🚀 VibeVoice ASR이 이제 Transformers 릴리스의 일부가 되었습니다! 이제 Hugging Face Transformers 라이브러리를 통해 음성 인식 모델을 직접 사용하여 프로젝트에 매끄럽게 통합할 수 있습니다.

2026-01-21: 📣 우리는 60분 길이의 오디오를 한 번에 처리하고, 화자(Who), 타임스탬프(When), 내용(What)을 포함한 구조화된 전사를 생성하며 사용자 맞춤 컨텍스트를 지원하는 통합 음성-텍스트 모델 VibeVoice-ASR을 오픈소스로 공개했습니다. Playground에서 사용해 보세요.

  • ⭐️ VibeVoice-ASR은 기본적으로 다국어를 지원하며, 50개 이상의 언어를 지원합니다 — 지원 언어는 자세한 내용을 확인하세요.
  • 🔥 VibeVoice-ASR 파인튜닝 코드가 이제 공개되었습니다!
  • ⚡️ vLLM 추론이 이제 지원되어 더 빠른 추론이 가능합니다; 자세한 내용은 vllm-asr를 참고하세요.
  • 📑 VibeVoice-ASR 기술 보고서가 제공됩니다.

2025-12-16: 📣 탐색을 위해 VibeVoice‑Realtime‑0.5B에 실험적인 화자를 추가했습니다. 여기에는 9개 언어(DE, FR, IT, JP, KR, NL, PL, PT, ES)의 다국어 음성과 11개의 다양한 영어 스타일 음성이 포함됩니다. 사용해 보세요. 더 많은 화자 유형이 시간이 지남에 따라 추가될 예정입니다.

2025-12-03: 📣 텍스트 스트리밍 입력과 장기 음성 생성 지원을 포함한 실시간 텍스트-음성 모델 VibeVoice‑Realtime‑0.5B를 오픈소스로 공개했습니다. Colab에서 사용해 보세요.

2025-09-05: VibeVoice는 음성 합성 분야의 협업을 촉진하기 위한 오픈소스 연구 프레임워크입니다.


🚀 가벼운 미리보기 모드: 페이지 속도를 위해 핵심 도입부만 번역되었습니다. 전체 코드는 원문 GitHub에서 확인하세요!

이 정보는 AI가 자동으로 분석한 결과입니다. 정확한 내용은 원문을 확인하세요.

microsoft/VibeVoice GitHub 원문 바로가기 →