
surya
その他90以上の言語に対応するOCRツール
suryaは、90以上の言語に対応するオープンソースのOCR・文書解析ツールキットです。テキスト認識だけでなく、レイアウト解析(見出し・表・画像領域の検出)、読み順の推定、表構造の認識までを統合的に行える点が特徴です。PDF変換ツールmarkerと同じ開発元によるもので、文書AIの基盤コンポーネントとして設計されています。多くの言語でクラウドOCRに匹敵する精度を目指して開発が続けられています。多言語の文書処理パイプラインを構築したい開発者や、スキャン文書のデジタル化・構造化を自前の環境で行いたい企業・研究機関に向いています。Google Cloud VisionなどのOCR APIの代替として利用できます。
コメント(0)
コメントするにはログインしてください。





