트렌딩 목록으로
C++

ggml-org / llama.cpp

C/C++에서의 LLM 추론

115.2K
19.3K
13일 전
GitHub에서 보기

이 프로젝트에 대해

ggml-org 님의 llama.cpp 프로젝트는 GitHub에서 115.2K개의 별을 받으며 많은 개발자들의 주목을 받고 있습니다. 특히 C++ 환경에서 유용하게 활용될 수 있으며, 최근 오픈소스 커뮤니티에서 활발한 기여와 토론이 이루어지고 있는 트렌딩 레포지토리입니다.

Language Breakdown

C++ 57%C 14%Python 8%Cuda 5%TypeScript 3%HTML 3%

🇰🇷 한국어 번역 README

캐시 히트

llama.cpp

선언문 / ggml / 연산

C/C++에서 LLM 추론

최근 API 변경 사항

  • libllama API 변경 로그
  • llama-server REST API 변경 로그

주요 주제

  • Hugging Face 캐시 이전: -hf로 다운로드한 모델은 이제 표준 Hugging Face 캐시 디렉토리에 저장되어 다른 HF 도구와 공유할 수 있습니다.
  • 가이드 : llama.cpp의 새로운 WebUI 사용법
  • 가이드 : llama.cpp와 함께 gpt-oss 실행하기
  • [피드백] 다운스트림 사용자 지원을 위한 llama.cpp 패키징 개선 🤗
  • 네이티브 MXFP4 형식을 사용하는 gpt-oss 모델 지원 추가 | PR | NVIDIA와 협업 | 댓글
  • 다중 모드 지원이 llama-server에 도입됨: #12898 | 문서
  • FIM 완성을 위한 VS Code 확장:
  • FIM 완성을 위한 Vim/Neovim 플러그인:
  • Hugging Face Inference Endpoints가 이제 GGUF를 기본 지원!
  • Hugging Face GGUF 편집기: 토론 | 도구

빠른 시작

llama.cpp 시작은 간단합니다. 머신에 설치하는 몇 가지 방법은 다음과 같습니다:

  • brew, nix 또는 winget을 사용하여 llama.cpp 설치
  • Docker로 실행 - Docker 문서를 참조
  • 릴리스 페이지에서 미리 빌드된 바이너리 다운로드
  • 이 리포지토리를 클론하여 소스에서 빌드 - 빌드 가이드 참고

설치 후에는 사용할 모델이 필요합니다. 모델 획득 및 양자화 섹션을 참고하세요.

예제 명령:

설명

llama.cpp의 주요 목표는 최소한의 설정과 상태로 LLM 추론을 가능하게 하는 것입니다


🌐 본 텍스트는 빠른 이해를 돕기 위한 요약 번역본입니다. 정확한 기술 정보 및 전체 코드는 GitHub 원문에서 확인하실 수 있습니다.

이 정보는 AI가 자동으로 분석한 결과입니다. 정확한 내용은 원문을 확인하세요.

ggml-org/llama.cpp GitHub 원문 바로가기 →