트렌딩 목록으로
Python
agentagent-skillagent-skillsai-agent

ThePlasmak / faster-whisper

오디오를 기록하기 위해 Whisper 전사 모델의 더 빠른 구현인 faster-whisper를 사용하는 OpenClaw 스킬로, 화자 분리와 같은 추가 기능이 포함되어 있습니다

이 프로젝트에 대해

ThePlasmak 님의 faster-whisper 프로젝트는 GitHub에서 7개의 별을 받으며 많은 개발자들의 주목을 받고 있습니다. 특히 Python 환경에서 유용하게 활용될 수 있으며, 최근 오픈소스 커뮤니티에서 활발한 기여와 토론이 이루어지고 있는 트렌딩 레포지토리입니다.

Language Breakdown

Python 80%Shell 10%PowerShell 9%Batchfile 1%

🇰🇷 한국어 번역 README

캐시 히트

faster-whisper

OpenClaw 에이전트를 위한 스킬로, faster-whisper를 사용하여 오디오를 더 빠르게 전사합니다.

faster-whisper는 OpenAI의 Whisper보다 우수하며 — CTranslate2로 재구현되어 동일한 정확도로 약 4-6배 더 빠릅니다.

안티바이러스/VirusTotal 경고 관련 주의

일부 스캐너(VirusTotal 포함)는 ClawHub에서 이 스킬을 '의심스러움'으로 표시할 수 있습니다. 이는 특수하게 조작된 URL 또는 파일 경로가 yt-dlp 또는 ffmpeg 내에서 명령 주입 취약점을 악용할 수 있기 때문입니다.

저는 악성 코드를 배포하지 않습니다! 이는 인터넷에서 파일을 다운로드하고 처리하는 모든 도구에서 발생할 수 있는 일반적인 위험일 뿐입니다.

다른 도구와 마찬가지로, 무엇을 입력하는지 주의하고 중요한 파일은 항상 백업하세요.

기능

주요 기능

  • OpenAI 원본 Whisper보다 약 4-6배 빠름 (동일한 모델 가중치, CTranslate2 백엔드)
  • GPU 사용 시 약 20배 실시간 처리 — 10분 오디오를 약 30초만에 전사
  • 증류 모델 사용 가능 (~6배 더 빠르며 출력이 더 길어지는 경우 1 사용, 기본값: 1.0) | | --prompt-reset-on-temperature T | 온도 폴백이 기준치를 초과하면 초기 프롬프트를 재설정 (기본값: 0.5) | | --no-suppress-blank | 공백 토큰 억제를 비활성화 (조용하거나 부드러운 음성에 도움될 수 있음) | | --suppress-tokens IDS | 기본값 외 억제할 콤마 구분 토큰 ID | | --max-initial-timestamp T | 첫 세그먼트의 최대 타임스탬프(초 단위, 기본값: 1.0) | | --prepend-punctuations CHARS | 앞 단어에 병합할 구두점 | | --append-punctuation

🌐 본 텍스트는 빠른 이해를 돕기 위한 요약 번역본입니다. 정확한 기술 정보 및 전체 코드는 GitHub 원문에서 확인하실 수 있습니다.

🔗 유사한 프로젝트

이 정보는 AI가 자동으로 분석한 결과입니다. 정확한 내용은 원문을 확인하세요.

ThePlasmak/faster-whisper GitHub 원문 바로가기 →