
docling
その他IBM製のドキュメント解析・変換ツール
Doclingは、IBMが開発するオープンソースのドキュメント解析・変換ツールです。PDF・DOCX・PPTX・XLSX・HTMLなど多様な形式の文書を読み込み、レイアウトや表構造をAIモデルで解析して、MarkdownやJSONなど生成AIで扱いやすい形式に変換します。LangChainやLlamaIndexとの統合が用意されており、RAGパイプラインへの組み込みが容易な点が特徴です。ローカル実行が可能なため機密文書も安全に処理できます。社内文書を生成AIの知識ソースとして活用したい企業や、文書処理の前処理基盤を標準化したい開発チームに向いています。IBM発でLF AI & Dataプロジェクトとなっており、信頼性を重視する企業にも採用しやすいツールです。
関連トピック
aiconvertdocument-parserdocument-parsingdocumentsdocxhtmlmarkdownpdfpdf-converterpdf-to-jsonpdf-to-textpptxtablesxlsx
コメント(0)
コメントするにはログインしてください。





