OCR(光学文字認識)でテキスト化できる文字は、PCなどで作成された文章をプリントアウトしたもの、すなわち印字を対象としています。従って、比較的身近な例として、GoogleドライブやLINEに画像やPDFファイルをアップロードすることで、文字認識が行われデジタルテキスト化されるといったもの等を対象としていましたが、近年OCRの技術にAI(人工知能やディープラーニング)を組み合わせたサービスが出てきました。これがAI-OCRといわれるテクノロジーです。
AI-OCRは手書きの文字でも認識可能であるため、手書きの文字でなくとも、OCRより高精度で読み取りできます。さらに、AI-OCRでは文字の認識だけでなく読みとる画像のレイアウトも認識可能で、例えば請求書フォーマットを登録しておけば、読み取る請求書の必要箇所を適切に抜き出すことが可能です。
【AI-OCRの活用メリット】
AI-OCRは、従来のOCRと比較して以下の3つの活用メリットがあります。
1.識字率(文字の認識精度)が高い・・・従来のOCRは、あらかじめ決められたロジックの範囲内でしか、文字の識別を行えませんでした。しかしAI-OCRはAIの特徴である深層学習(ディープラーニング)などの技術により、識字率(文字の認識精度)が向上しました。具体的には複雑な手書き文字(乱筆文字、区切り線のないフリーフォーマットの手書き文字、罫(けい)線被り文字など)の読み取りが可能です。
2.多様なフォーマットの帳票に対応できる・・・従来のOCRは、事前に読取位置や項目など、読み取り対象の書類の詳細を定義する作業が必要でした。AI-OCRであればAIが読取位置や項目を自動抽出してくれるため、事前の面倒な設定が不要となったため、請求書や納品書、発注書など取引企業ごとに様式が異なる非定型帳票、契約書などの任意様式の文書の文字認識が可能となりました。
3.RPAとの連携でさらに業務効率が向上・・・従来のOCRでは、例えば紙の請求書の情報を会計システムなどに入力しようとした時、情報ごとの対応付けや部門、科目などの仕分けなど、人手による作業が残っていました。つまり、決まったフォーマットの帳票しか対応できない点が、不便を強いられていました。
ということで、AI-OCRはRPA(=Robotic Process Automation)との連携が注目されています。
【AI-OCRとRPA連携】
RPAとAI-OCRを連携すると、文字情報の認識からシステムへの入力までワンストップで行う業務フローが構築可能となります。例えば、受け取った紙の帳票類や書類などをスキャナーで読み取りPDFとしてシステムに保存すれば、その後はAI-OCRがフォーマットに応じて必要な情報をデジタルテキスト化します。その後、RPAが経理システムや表計算システムなどに自動的に入力、というような活用方法が考えられます。
という訳で、AI-OCRはRPA(=Robotic Process Automation)との連携が注目されていて、これまで人手で行っていた作業をソフトウェアロボットで自動化するRPAとAI-OCRとを組み合わせることで、紙帳票からのデータ抽出~データ入力~集計・加工~出力といった一連の業務を自動化することが可能となります。
【コロナ禍で伸長を続けるAI-OCR市場】
こうしたメリットから注目を浴びるAI-OCR。その市場規模は、コロナ禍におけるペーパーレス化と業務自動化、そしてDX(デジタルトランスフォーメーション)ニーズを背景に、伸長を続けています。2023年には「インボイス制度」の施行も控えており、これまで紙が主流であった企業間の請求書のやり取りについても電子化が加速しています。
また、各調査会社による市場動向では、OCRソリューション市場は2019年から2年連続前年比120%と成長を続けており、中でもけん引しているのはAI-OCRと言われています。
これを裏付けるように各社から続々とAI-OCRツールやサービスが提供されており、今や業界を問わず多くの企業や組織で、AI-OCRを活用した業務効率化への動きが高まっています。
ポイント① 文字認識のエラー頻度は?継続的な向上は可能?
AI-OCRは、AIの特徴であるディープラーニング(深層学習)によって文字の補正結果を学習することで、識字率(文字の認識精度)を向上しています。しかし当然ながらこの技術は各社さまざまです。また、実際の業務ではクセの強い手書き文字や走り書きの処理などもあり、そもそも「AI-OCRで100%の読み取りを行うことは、理論上不可能」と言われています。そうなると結局、AI-OCRが読み取った文字に間違いがないのかを人が確認し、間違いがあれば人手で修正する、といった作業が必要になります。
<具体例>高精度な手書き文字認識AIと継続的な認識率向上を実現
ポイント② OCRの前処理は自動化できる?
ビジネスにおいては自社の定型帳票だけでなく取引先からの見積書、注文書、納品書、請求書といった多種多様な帳票に対応する必要があります。AI-OCRを利用する際、さまざまな帳票のフォーマットを読み取るための「テンプレート」を選択する前処理が、意外と面倒で手間がかかります。「テンプレート」とは、帳票のレイアウト中の読取箇所が分かるように、システム上で帳票画像にマーキングすることです。これを行うことで、帳票の画像のどの部分を読み取りたいのかを、AI-OCRに伝えることができます。
AI-OCRを活用する際、この「OCRの前処理をどこまで自動化できるか?」は非常に重要なポイントです。
「帳票認識サービス」は、読み取り帳票を自動で分類し、テンプレートの選択まで行うようにします。前処理機能が帳票の種類の確認、テンプレートの選択、画像補正などを自動で実施。利用者は文字を読み取りたい帳票を選ぶだけで多量の帳票の読み取りがスピーディーに行うことができます。非定型帳票においても業務において認識対象としたい項目を指定するだけで、事前の位置指定なしに帳票から目的とする認識項目を特定できます。AI-OCRに読み取ってほしい場所を詳細に設定する必要がなく、多様な様式の帳票を自動的にAI-OCRが判断。帳票のフォーマットを問わない読み取りが可能です。
文字の読み取りを行う認識エンジンには、大別すると次に示すように2種類のエンジンがあります。「帳票認識サービス」では、複数の認識エンジンが利用可能であり、さまざまな種類の帳票の読み取りに対応できます。
-
- 定型帳票認識エンジン
フォーマットが決まっている帳票のイメージデータを、高速・高精度にデータ化するAI-OCRエンジンです。ディープラーニング技術を活用し、活字文字に加えて、これまで自動認識が難しかった手書き文字を高精度に読み取れます。トレーニングデータの準備、または業界特有の言語モデルと連携することで、多言語対応や業界用語への拡張対応も可能です。 - 非定型帳票認識エンジン
さまざまな非構造なドキュメントから、情報を正確に抜き出して整理するAI-OCRエンジンです。フォーマットがバラバラな帳票にも対応可能で、さまざまな業務場面で活用できます。業務に合わせたトレーニングやチューニングを行うことで、人間のように文字を読み取り可能です。
- 定型帳票認識エンジン
ポイント③ 認識結果の確認作業工数は?
AI-OCRに100%の認識率を求めることは困難ですので、認識結果は人の確認が必要となります。読み取り作業は自動化できたものの、読み取り結果をその都度人が確認しなければならないと、業務全体の生産性は高まりません。そこで、解決策として、「確信度」スコアにより人による確認工数を削減する方策を講じます。
「帳票認識サービス」は、AI-OCRの認識結果の“確からしさ”を、アルゴリズムによる「確信度」というスコアとして提示します。さらにAI-OCR認識結果と確信度に対し、適用業務におけるチェックルール(桁数チェックや形式チェックなど)を適用して補正することで、AI-OCRの不読・誤読による誤ったデータ登録リスクを低減させています。
これにより、認識結果が確信度「低」の場合は、人による確認を実施、確信度「高」の場合は、人は確認せずに自動登録という具合に、誤登録リスクと人的な確認工数を抑制しながら、帳票業務の自動化率を向上できます。
さらに、認識結果と別系列の業務データとの突合チェックを行い、突合チェック結果も確信度の補正に活用することで、誤ったデータ入力のビジネスリスクをさらに低減し続けることも可能です。
【まとめ】
AI-OCRはOCRでは技術的に業務に組み込むのが難しかったような書類やフローでも対応できるものが増えているため、書類の自動入力を検討している方はぜひ一度資料などをチェックしてみてください。