Story page
GitHub - microsoft/waza: CLI / Framework for Agent Skills - create, test, measure and improve skill quality and effectiveness
要約
microsoft/wazaは、AIエージェントのスキルを作成・評価・改善するためのGo製CLI。評価スイート作成、ベンチマーク実行、モデル間比較などを支援する。
注目ポイント
- Go製CLIでAIエージェントスキルを評価
- スキルとevalスイートの雛形を作成可能
- Copilot経由のモデル評価や比較に対応
- CI向けの終了コードやJUnit出力を備える
- キャッシュ、カバレッジ、トークン分析機能も提供
背景知識
AIエージェントのスキルは、作るだけでなく品質や有効性を継続的に測る必要がある。wazaは評価定義、実行、採点、比較、CI連携をCLIでまとめ、スキル改善の反復をしやすくする点が重要だ。
- Source
- はてなブックマーク - 人気エントリー - 総合
- Canonical
- https://github.com/microsoft/waza
- Fetched
- 2026-05-09T03:48:29.607Z
- Extraction
- ok