Python
z-lab / dflash
DFlash: 플래시 투기적 디코딩을 위한 블록 확산
3.8K
263
약 1개월 전
이 프로젝트에 대해
z-lab 님의 dflash 프로젝트는 GitHub에서 3.8K개의 별을 받으며 많은 개발자들의 주목을 받고 있습니다. 특히 Python 환경에서 유용하게 활용될 수 있으며, 최근 오픈소스 커뮤니티에서 활발한 기여와 토론이 이루어지고 있는 트렌딩 레포지토리입니다.
Language Breakdown
Python 100%
🇰🇷 한국어 번역 README
캐시 히트DFlash: 플래시 추측 해독을 위한 블록 확산
종이 | 블로그 | 모델들
DFlash는 가벼운 **블록 확산 모델로, 추측적 디코딩을 위해 설계되었습니다. 효율적이고 고품질의 병렬 도면을 가능하게 합니다.
지원 모델
| 모델 | DFlash 초안 |
|---|---|
| gemma-4-31B-it | z-lab/gemma-4-31B-it-DFlash |
| gemma-4-26B-A4B-it | z-lab/gemma-4-26B-A4B-it-DFlash |
| MiniMax-M2.7 (미리보기) | z-lab/MiniMax-M2.7-DFlash |
| MiniMax-M2.5 (미리보기) | z-lab/MiniMax-M2.5-DFlash |
| Kimi-K2.6 (미리보기) | z-lab/Kimi-K2.6-DFlash |
| 키미-K2.5 | z-lab/Kimi-K2.5-DFlash |
| Qwen3.6-27B | z-lab/Qwen3.6-27B-DFlash |
| Qwen3.6-35B-A3B | z-lab/Qwen3.6-35B-A3B-DFlash |
| Qwen3.5-4B | z-lab/Qwen3.5-4B-DFlash |
| Qwen3.5-9B | z-lab/Qwen3.5-9B-DFlash |
| Qwen3.5-27B | z-lab/Qwen3.5-27B-DFlash |
| Qwen3.5-35B-A3B | z-lab/Qwen3.5-35B-A3B-DFlash |
| Qwen3.5-122B-A10B | z-lab/Qwen3.5-122B-A10B-DFlash |
| GPT-OSS-20B | z-lab/gpt-oss-20b-DFlash |
| GPT-OSS-120B | z-lab/gpt-oss-120b-DFlash |
| Qwen3-Coder-Next | z-lab/Qwen3-Coder-Next-DFlash |
| Qwen3-4B (무사고) | z-lab/Qwen3-4B-DFlash-b16 |
| Qwen3-8B (무사고) | z-lab/Qwen3-8B-DFlash-b16 |
| Qwen3-Coder-30B-A3B | z-lab/Qwen3-Coder-30B-A3B-DFlash |
| 라마-3.1-8B-인스티치 | z-lab/LLaMA3.1-8B-Instruct-DFlash-UltraChat |
| 딥시크-V4-플래시 | 곧 공개 |
| 딥시크-V4-프로 | 곧 공개 |
| GLM-5.1 | 곧 공개 |
추가 모델 지원을 요청하려면 GitHub 이슈를 자유롭게 열어도 됩니다. 또한 개장할 예정입니다-
🌐 본 텍스트는 빠른 이해를 돕기 위한 요약 번역본입니다. 정확한 기술 정보 및 전체 코드는 GitHub 원문에서 확인하실 수 있습니다.
이 정보는 AI가 자동으로 분석한 결과입니다. 정확한 내용은 원문을 확인하세요.
z-lab/dflash GitHub 원문 바로가기 →