AI
21k

90以上の言語に対応するOCRツール

suryaは、90以上の言語に対応するオープンソースのOCR・文書解析ツールキットです。テキスト認識だけでなく、レイアウト解析(見出し・表・画像領域の検出)、読み順の推定、表構造の認識までを統合的に行える点が特徴です。PDF変換ツールmarkerと同じ開発元によるもので、文書AIの基盤コンポーネントとして設計されています。多くの言語でクラウドOCRに匹敵する精度を目指して開発が続けられています。多言語の文書処理パイプラインを構築したい開発者や、スキャン文書のデジタル化・構造化を自前の環境で行いたい企業・研究機関に向いています。Google Cloud VisionなどのOCR APIの代替として利用できます。

コメント(0

コメントするにはログインしてください。

同じカテゴリのOSS

Let's Build Together

OSS導入、自社だけで悩まない。

ツール選定から構築・運用・AI活用まで、オープンソースラボ運営元のClasslessが伴走します。初回のご相談は無料です。