alchaincyf / darwin-skill
Darwin.skill - 스킬을 무한히 발전시킬 수 있는 시스템: 평가 → 개선 → 테스트 → 유지 또는 롤백 | Claude Code를 위한 Autoresearch에서 영감을 받은 자율 기술 최적화. 평가, 개선, 테스트, 유지 또는 되돌리기.
이 프로젝트에 대해
alchaincyf 님의 darwin-skill 프로젝트는 GitHub에서 1.1K개의 별을 받으며 많은 개발자들의 주목을 받고 있습니다. 특히 HTML 환경에서 유용하게 활용될 수 있으며, 최근 오픈소스 커뮤니티에서 활발한 기여와 토론이 이루어지고 있는 트렌딩 레포지토리입니다.
Language Breakdown
📝 AI 한국어 핵심 요약
🇰🇷 한국어 번역 README
캐시 히트영어 | 中文
动画由 huashu-design skill 制作
达尔文.스킬
**像训练模型一样优化你的 Agent Skills. **
受 Andrej Karpathy 的 autoresearch 启发,将自主实验循环从模型训练搬到 Skill 优化领域。 一个只能向前转的棘轮。
核心循环
为什么做这个
Agent Skill 生态在快速扩张. Claude Code、Codex、OpenClaw、Trae、CodeBuddy 等工具都支持 SKILL.md 格式。 당당你有 10 个 Skills 时可以手动维护;당당你有 60+ 个 Skills 时,你需要一个系统。
전통적인 Skill 审查是纯结构性的:检查格式对不对, 步骤有没有编号、路径能不能访问。 하지만 一个格式완벽한 Skill,跑出来的效果可能很差.
达尔文.skill 同时评估结构质量和实际效果,然后只保留真正有改进的修改。
로부터 autoresearch가 Skill Optimizer
이 프로젝트는 직접 受 Karpathy autoresearch 启发. autoresearch 的做法是:写一个 'program.md' 定义目标和约束,让 agent 自主生成和测试代码变更,只保留可测量的改进。
우리가 같은 생각 시로를 옮겼습니다 Skill 优化:
| 자동 연구 | 达尔文.skill | 为什么这样映射 |
|---|---|---|
| 'program.md' | 本 SKILL.md | 定义评估标准和约束规则 |
| 'train.py' | 각 待최적화의 SKILL.md | 被优化的资产,每次实验只改它 |
| 'val_bpb' | 8 维加权总分(满分100) | 可量化的优化目标 |
| '겟 래칫' | 유지 / 되돌리기 메커니즘 | 只保留有改进的 commit |
| '테스트 세트' | test-prompts.json | 验证改进是否真的有效 |
| 全自主运行 | 人在回路 | Skill 的好坏比 loss 더 微妙,需要人的判断 |
五条核心原则
| # | 原则 | 说明 |
|---|---|---|
| 01 | 单一可编辑资产 | 每次只改一个 SKILL.md,변수 可控,改进可归因 |
| 02 | 双重评估 | 结构评分(静态分析)+ 效果验证(跑测试看输出) |
| 03 | 棘轮机制 | 只保留改进,自动回滚退步,分数只升不降 |
| 04 | 独立评分 | 评分用子 agent,避免「自己改自己评」的偏差 |
| 05 | 人在回路 | 각 Skill 优化完后暂停,用户确认再继续下一个 |
8 维度评估体系
总分 100。 结构维度靠静态分析(60分),效果维度必须实测(40分)。
实测表现权重最高(25分)。 Skill 写得再漂亮,跑出来效果不好就是零。
优化循环:5 个阶段
系统在每个阶段内自主运行,但在阶段之间暂停等待人类确认。
2단계 핵심 논리:
- 找出得分最低的维度
- 针对该维度生成 1 个具体改进方案
- 편집 SKILL.md, git co
🌐 본 텍스트는 빠른 이해를 돕기 위한 요약 번역본입니다. 정확한 기술 정보 및 전체 코드는 GitHub 원문에서 확인하실 수 있습니다.
이 정보는 AI가 자동으로 분석한 결과입니다. 정확한 내용은 원문을 확인하세요.
alchaincyf/darwin-skill GitHub 원문 바로가기 →