
promptfoo
LLM開発ツールプロンプトのテスト・評価ツール
promptfooは、プロンプトやエージェント、RAGシステムをテスト・評価するためのオープンソースツールです。YAMLの宣言的な設定でテストケースを定義し、GPT、Claude、Geminiなど複数モデルの出力品質を並べて比較できます。CI/CDに組み込めば、プロンプト変更による品質低下(リグレッション)をデプロイ前に検知できます。さらにレッドチーミング機能を備え、プロンプトインジェクションや有害出力などAI特有の脆弱性スキャンも実行できる点が特徴です。OpenAIやAnthropicでも利用されていると公表されています。LLMアプリの品質を継続的に担保したい開発チームや、AIシステムのセキュリティ検証が必要な企業に向いています。MITライセンスでローカル実行でき、データが外部に送信されない点も安心です。
関連トピック
cici-cdcicdevaluationevaluation-frameworkllmllm-evalllm-evaluationllm-evaluation-frameworkllmopspentestingprompt-engineeringprompt-testingpromptsragred-teamingtestingvulnerability-scanners
コメント(0)
コメントするにはログインしてください。
同じカテゴリのOSS

langflow
ビジュアルでRAG・エージェントを構築するローコードツール
LLM開発ツールMITPython

dify
ノーコードでAIアプリを構築できるLLMOpsプラットフォーム
LLM開発ツールOtherTypeScript

langchain
LLMアプリ開発の定番フレームワーク
LLM開発ツールMITPython

llama.cpp
ローカルLLM実行の基盤となるC++実装
LLM開発ツールMITC++

vllm
高スループットなLLM推論エンジン
LLM開発ツールApache-2.0Python

ragflow
深い文書理解に基づくRAGエンジン
LLM開発ツールApache-2.0Python