AI
10k

LLMの可観測性・評価ツール

Phoenixは、Arize AIが開発するオープンソースのAI可観測性・評価プラットフォームです。OpenTelemetryベースのトレーシングでLLMアプリやエージェントの実行過程を記録・可視化し、LLM-as-a-judgeなどによる自動評価、データセット管理、実験の比較、プロンプトの管理までをローカル環境やセルフホストで実行できます。LangChain、LlamaIndex、OpenAI、smolagentsなど主要フレームワークとの統合が用意されており、数行のコードで計装を開始できます。RAGやエージェントの「なぜこの回答になったのか」を追跡・改善したいAIエンジニアや、評価を開発サイクルに組み込みたいチームに向いています。ベンダーロックインを避けつつLLMの観測基盤を整えたい場合の有力な選択肢です。

関連トピック

agentsai-monitoringai-observabilityaiengineeringanthropicdatasetsevalslangchainllamaindexllm-evalllm-evaluationllmopsllmsopenaiprompt-engineeringsmolagents

コメント(0

コメントするにはログインしてください。

同じカテゴリのOSS

Let's Build Together

OSS導入、自社だけで悩まない。

ツール選定から構築・運用・AI活用まで、オープンソースラボ運営元のClasslessが伴走します。初回のご相談は無料です。