트렌딩 목록으로
HTML

alchaincyf / darwin-skill

Darwin.skill - 스킬을 무한히 발전시킬 수 있는 시스템: 평가 → 개선 → 테스트 → 유지 또는 롤백 | Claude Code를 위한 Autoresearch에서 영감을 받은 자율 기술 최적화. 평가, 개선, 테스트, 유지 또는 되돌리기.

1.1K
139
2개월 전
GitHub에서 보기

이 프로젝트에 대해

alchaincyf 님의 darwin-skill 프로젝트는 GitHub에서 1.1K개의 별을 받으며 많은 개발자들의 주목을 받고 있습니다. 특히 HTML 환경에서 유용하게 활용될 수 있으며, 최근 오픈소스 커뮤니티에서 활발한 기여와 토론이 이루어지고 있는 트렌딩 레포지토리입니다.

Language Breakdown

HTML 99%JavaScript 1%

📝 AI 한국어 핵심 요약

SKILL.md를 편집하고 git commit 4.
새 브랜치 > 이전 브랜치 → 유지; 그렇지 않으면 → git revert 6.

🇰🇷 한국어 번역 README

캐시 히트

영어 | 中文

动画由 huashu-design skill 制作

达尔文.스킬

**像训练模型一样优化你的 Agent Skills. **

受 Andrej Karpathy 的 autoresearch 启发,将自主实验循环从模型训练搬到 Skill 优化领域。 一个只能向前转的棘轮。


核心循环


为什么做这个

Agent Skill 生态在快速扩张. Claude Code、Codex、OpenClaw、Trae、CodeBuddy 等工具都支持 SKILL.md 格式。 당당你有 10 个 Skills 时可以手动维护;당당你有 60+ 个 Skills 时,你需要一个系统。

전통적인 Skill 审查是纯结构性的:检查格式对不对, 步骤有没有编号、路径能不能访问。 하지만 一个格式완벽한 Skill,跑出来的效果可能很差.

达尔文.skill 同时评估结构质量实际效果,然后只保留真正有改进的修改。


로부터 autoresearch가 Skill Optimizer

이 프로젝트는 직접 受 Karpathy autoresearch 启发. autoresearch 的做法是:写一个 'program.md' 定义目标和约束,让 agent 自主生成和测试代码变更,只保留可测量的改进。

우리가 같은 생각 시로를 옮겼습니다 Skill 优化:

자동 연구达尔文.skill为什么这样映射
'program.md'本 SKILL.md定义评估标准和约束规则
'train.py'각 待최적화의 SKILL.md被优化的资产,每次实验只改它
'val_bpb'8 维加权总分(满分100)可量化的优化目标
'겟 래칫'유지 / 되돌리기 메커니즘只保留有改进的 commit
'테스트 세트'test-prompts.json验证改进是否真的有效
全自主运行人在回路Skill 的好坏比 loss 더 微妙,需要人的判断

五条核心原则

#原则说明
01单一可编辑资产每次只改一个 SKILL.md,변수 可控,改进可归因
02双重评估结构评分(静态分析)+ 效果验证(跑测试看输出)
03棘轮机制只保留改进,自动回滚退步,分数只升不降
04独立评分评分用子 agent,避免「自己改自己评」的偏差
05人在回路각 Skill 优化完后暂停,用户确认再继续下一个

8 维度评估体系

总分 100。 结构维度靠静态分析(60分),效果维度必须实测(40分)。

实测表现权重最高(25分)。 Skill 写得再漂亮,跑出来效果不好就是零。


优化循环:5 个阶段

系统在每个阶段内自主运行,但在阶段之间暂停等待人类确认。

2단계 핵심 논리:

  1. 找出得分最低的维度
  2. 针对该维度生成 1 个具体改进方案
  3. 편집 SKILL.md, git co

🌐 본 텍스트는 빠른 이해를 돕기 위한 요약 번역본입니다. 정확한 기술 정보 및 전체 코드는 GitHub 원문에서 확인하실 수 있습니다.

이 정보는 AI가 자동으로 분석한 결과입니다. 정확한 내용은 원문을 확인하세요.

alchaincyf/darwin-skill GitHub 원문 바로가기 →