Story page

はてなブックマーク - 人気エントリー - 総合 / 2026-05-08

GitHub - microsoft/waza: CLI / Framework for Agent Skills - create, test, measure and improve skill quality and effectiveness

microsoft/wazaは、AIエージェントのスキルを作成・評価・改善するためのGo製CLI。評価スイート作成、ベンチマーク実行、モデル間比較などを支援する。

  • Go製CLIでAIエージェントスキルを評価
  • スキルとevalスイートの雛形を作成可能
  • Copilot経由のモデル評価や比較に対応
  • CI向けの終了コードやJUnit出力を備える
  • キャッシュ、カバレッジ、トークン分析機能も提供

AIエージェントのスキルは、作るだけでなく品質や有効性を継続的に測る必要がある。wazaは評価定義、実行、採点、比較、CI連携をCLIでまとめ、スキル改善の反復をしやすくする点が重要だ。

Source
はてなブックマーク - 人気エントリー - 総合
Canonical
https://github.com/microsoft/waza
Fetched
2026-05-09T03:48:29.607Z
Extraction
ok