ネットスマイル、生成AI-OCR「なんでも読めるくん(R)」に適用されている文書画像処理システムで特許を取得
ネットスマイル株式会社

~AI-OCRと大規模言語モデルを組み合わせ、誤抽出を抑制する新技術~
生成AIを活用したDX事業を展開するネットスマイル株式会社(代表取締役社長:齊藤福光、本社:東京都文京区、以下「ネットスマイル」)は、2025年9月5日、生成AIによる文書画像処理システムに関する特許(特許第7738872号)を取得しました。本特許技術は、当社が提供する生成AI-OCR「なんでも読めるくん(R)」に適用され、従来のOCRでは困難だった多様な帳票の高精度なデータ化を実現します。
■特許概要(特許第7738872号)
・発明の名称:文書画像処理システム
・特許登録日:2025年9月5日
■背景
近年、AI-OCRの分野では生成AI(大規模言語モデル:LLM)の活用が進んでいます。しかし、生成AIには「ハルシネーション」と呼ばれる誤った情報生成の課題があり、請求書や見積書など書式が定まっていない様々な文書画像を読み取る際には、抽出精度が十分でないケースが見受けられました。本特許技術は、この課題を解決し、文字認識の信頼性を大幅に向上させるものです。
■発明の特徴
今回取得した「文書画像処理システム」特許は、従来のOCRと生成AIを組み合わせ、両者の結果を相互に検証・補完することで高精度な文字認識を実現します。
(1)二重のOCR処理と検証
システム内のローカルOCRが文書画像を読み取り、テキストデータを作成すると同時に、生成AI-OCRが同じ文書画像とプロンプト(指示文)を生成AIサーバーに送り、テキストデータを取得します。
ローカルOCRと生成AI-OCRの結果を比較し、正確性を判定し、正当と判断された場合のみ生成AI結果を採用します。
(2)精度向上のフィードバック機能
誤りと判定された場合はローカルOCRの結果を追加プロンプトとして再度生成AIに問い合わせを行います。これにより、生成AIはより多くのヒントを得て、精度を向上させることができます。
[画像1:
https://prcdn.freetls.fastly.net/release_image/32780/24/32780-24-60e48fa30c691098d8f1b0d9f528618e-540x712.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
(3)位置情報の特定
ローカルOCRがテキストの座標情報を特定し、生成AIからの結果を文書上の位置と対応付けします。
(4)複数の生成AIモデルの活用
複数の生成AIモデルを同時活用し、得られた結果を統合することで、単一モデルの弱点を補い、より信頼性の高い結果を得ることができます。
本特許技術により、生成AI-OCRの課題であった「抽出精度の不安定さ」を克服し、文書処理業務のさらなる自動化と効率化を実現します。請求書処理、契約書管理、各種申込書のデータ化など、幅広い業務シーンでの活用が期待されます。
■生成AI-OCR「なんでも読めるくん(R)」について
「なんでも読めるくん(R)」は、2025年4月に提供を開始した次世代OCRサービスです。
生成AI-OCR なんでも読めるくんの詳細は
こちら
(URL:
https://netsmile.jp/nandemoyomerukun/)
【特長】
(1)テンプレート不要
取得したい項目名を登録するだけで、フォーマットの異なる帳票からも必要情報を自動抽出。
(2)多様な書式に対応
かすれた手書き文字、複雑なレイアウト、記号・アイコンを含む帳票まで幅広く読み取り可能。
(3)生成AIによる理解と要約
単なる文字認識に留まらず、文脈理解に基づいた要約や情報生成が可能。
[画像2:
https://prcdn.freetls.fastly.net/release_image/32780/24/32780-24-f74c2322c87816ec83df9ce1edb62617-1154x523.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
【導入効果】
・請求書や契約書、各種申込書の処理工数を大幅削減
・テンプレート作成・管理の負担を解消
・読み取り精度の向上により、人手による確認作業の削減
・多様な業種(製造、物流、小売、金融など)での導入が期待
今回の特許技術を組み込んだことで、「なんでも読めるくん(R)」は従来以上に高精度かつ信頼性の高い文書データ化を実現し、企業のDX推進をさらに加速します。
■ネットスマイルについて
社 名 ネットスマイル株式会社
所 在 地 東京都文京区湯島4丁目1-11
代 表 者 代表取締役 齊藤 福光
設 立 2013年10月
資 本 金 1億円
URL
https://netsmile.jp/
事業内容 生成AI-OCR、DXソリューション、生成AIによる業務自動化、機械学習
プレスリリース提供:PR TIMES

記事提供:PRTimes