트렌딩 목록으로
TypeScript
agentsclaudecodexharness

SparkEngineAI / QuantClaw-plugin

QuantClaw는 OpenClaw용 플러그앤플레이 작업 유형 라우팅 양자화 플러그인입니다.

66
0
약 2개월 전
GitHub에서 보기

이 프로젝트에 대해

SparkEngineAI 님의 QuantClaw-plugin 프로젝트는 GitHub에서 66개의 별을 받으며 많은 개발자들의 주목을 받고 있습니다. 특히 TypeScript 환경에서 유용하게 활용될 수 있으며, 최근 오픈소스 커뮤니티에서 활발한 기여와 토론이 이루어지고 있는 트렌딩 레포지토리입니다.

Language Breakdown

TypeScript 88%Python 12%

🇰🇷 한국어 번역 README

캐시 히트

QuantClaw: OpenClaw를 위한 중요한 곳에서의 정밀함

中文文档

QuantClaw는 OpenClaw용 플러그 앤 플레이 작업 유형 라우팅 양자화 플러그인입니다. 각 들어오는 요청을 분류하고, 이를 정밀도 티어(4bit, 8bit, 16bit)에 매핑하며, 요청을 올바른 모델 대상으로 라우팅하여 사용자가 정밀도를 수동으로 선택하지 않아도 품질, 지연 시간, 비용의 균형을 맞출 수 있습니다.

🔍 QuantClaw 소개

QuantClaw는 고정된 직관이 아니라 OpenClaw 워크로드에 대한 양자화 연구를 기반으로 구축되었습니다. 우리는 24개의 작업 유형, 104개의 작업, 6개의 모델, 9B에서 744B까지의 스케일을 아우르는 양자화 및 고정밀 모델을 평가합니다.

Claw-Eval(v0.0.0 릴리스) 결과:

  모델
  파라미터(B)
  BF16 / FP8
  NVFP4

  GLM-4.7-Flash
  30
  0.6370
  0.6034

  GLM-5
  744
  0.7130
  0.7229

  MiniMax-M2.5
  229
  0.6760
  0.6823

  Qwen3.5-9B
  9
  0.4267
  0.4107

  Qwen3.5-35B-A3B
  35
  0.6686
  0.6549

  Qwen3.5-397B-A17B
  397
  0.7048
  0.6937
  • 코딩, 안전, 복잡한 워크플로와 같은 높은 민감도 작업은 더 높은 정밀도로 혜택을 볼 수 있습니다.
  • 연구, 멀티모달 이해, 독해, 지식 검색, 사무 QA, 데이터 분석과 같은 낮은 민감도 작업은 종종 낮은 정밀도에서도 원활하게 실행될 수 있습니다.

✨ 주요 기능

 자동 적응
 Intel

🌐 본 텍스트는 빠른 이해를 돕기 위한 요약 번역본입니다. 정확한 기술 정보 및 전체 코드는 GitHub 원문에서 확인하실 수 있습니다.

🔗 유사한 프로젝트

이 정보는 AI가 자동으로 분석한 결과입니다. 정확한 내용은 원문을 확인하세요.

SparkEngineAI/QuantClaw-plugin GitHub 원문 바로가기 →