POKeDEX Information

IT関連・マーケティング・ソフトダウンロード等の様々な情報を公開しているサイトです!皆様の情報の一つになれば幸いです。

AI-OCR RPAについて 新着記事

AI-OCR RPA 連携は? 活用メリットは? コロナ禍で伸張!

投稿日:

OCR(光学文字認識)でテキスト化できる文字は、PCなどで作成された文章をプリントアウトしたもの、すなわち印字を対象としています。従って、比較的身近な例として、GoogleドライブやLINEに画像やPDFファイルをアップロードすることで、文字認識が行われデジタルテキスト化されるといったもの等を対象としていましたが、近年OCRの技術にAI(人工知能やディープラーニング)を組み合わせたサービスが出てきました。これがAI-OCRといわれるテクノロジーです。

AI-OCRは手書きの文字でも認識可能であるため、手書きの文字でなくとも、OCRより高精度で読み取りできます。さらに、AI-OCRでは文字の認識だけでなく読みとる画像のレイアウトも認識可能で、例えば請求書フォーマットを登録しておけば、読み取る請求書の必要箇所を適切に抜き出すことが可能です。

AI-OCRの活用メリット】

AI-OCRは、従来のOCRと比較して以下の3つの活用メリットがあります。

1.識字率(文字の認識精度)が高い・・・従来のOCRは、あらかじめ決められたロジックの範囲内でしか、文字の識別を行えませんでした。しかしAI-OCRはAIの特徴である深層学習(ディープラーニング)などの技術により、識字率(文字の認識精度)が向上しました。具体的には複雑な手書き文字(乱筆文字、区切り線のないフリーフォーマットの手書き文字、罫(けい)線被り文字など)の読み取りが可能です。

2.多様なフォーマットの帳票に対応できる・・・従来のOCRは、事前に読取位置や項目など、読み取り対象の書類の詳細を定義する作業が必要でした。AI-OCRであればAIが読取位置や項目を自動抽出してくれるため、事前の面倒な設定が不要となったため、請求書や納品書、発注書など取引企業ごとに様式が異なる非定型帳票、契約書などの任意様式の文書の文字認識が可能となりました。

3.RPAとの連携でさらに業務効率が向上・・・従来のOCRでは、例えば紙の請求書の情報を会計システムなどに入力しようとした時、情報ごとの対応付けや部門、科目などの仕分けなど、人手による作業が残っていました。つまり、決まったフォーマットの帳票しか対応できない点が、不便を強いられていました。

ということで、AI-OCRはRPA(=Robotic Process Automation)との連携が注目されています。

AI-OCRとRPA連携

RPAとAI-OCRを連携すると、文字情報の認識からシステムへの入力までワンストップで行う業務フローが構築可能となります。例えば、受け取った紙の帳票類や書類などをスキャナーで読み取りPDFとしてシステムに保存すれば、その後はAI-OCRがフォーマットに応じて必要な情報をデジタルテキスト化します。その後、RPAが経理システムや表計算システムなどに自動的に入力、というような活用方法が考えられます。

という訳で、AI-OCRはRPA(=Robotic Process Automation)との連携が注目されていて、これまで人手で行っていた作業をソフトウェアロボットで自動化するRPAとAI-OCRとを組み合わせることで、紙帳票からのデータ抽出~データ入力~集計・加工~出力といった一連の業務を自動化することが可能となります。

コロナ禍で伸長を続けるAI-OCR市場

こうしたメリットから注目を浴びるAI-OCR。その市場規模は、コロナ禍におけるペーパーレス化と業務自動化、そしてDX(デジタルトランスフォーメーション)ニーズを背景に、伸長を続けています。2023年には「インボイス制度」の施行も控えており、これまで紙が主流であった企業間の請求書のやり取りについても電子化が加速しています。

また、各調査会社による市場動向では、OCRソリューション市場は2019年から2年連続前年比120%と成長を続けており、中でもけん引しているのはAI-OCRと言われています。

これを裏付けるように各社から続々とAI-OCRツールやサービスが提供されており、今や業界を問わず多くの企業や組織で、AI-OCRを活用した業務効率化への動きが高まっています。

ポイント① 文字認識のエラー頻度は?継続的な向上は可能?

AI-OCRは、AIの特徴であるディープラーニング(深層学習)によって文字の補正結果を学習することで、識字率(文字の認識精度)を向上しています。しかし当然ながらこの技術は各社さまざまです。また、実際の業務ではクセの強い手書き文字や走り書きの処理などもあり、そもそも「AI-OCRで100%の読み取りを行うことは、理論上不可能」と言われています。そうなると結局、AI-OCRが読み取った文字に間違いがないのかを人が確認し、間違いがあれば人手で修正する、といった作業が必要になります。

<具体例>高精度な手書き文字認識AIと継続的な認識率向上を実現

ポイント② OCRの前処理は自動化できる?

ビジネスにおいては自社の定型帳票だけでなく取引先からの見積書、注文書、納品書、請求書といった多種多様な帳票に対応する必要があります。AI-OCRを利用する際、さまざまな帳票のフォーマットを読み取るための「テンプレート」を選択する前処理が、意外と面倒で手間がかかります。「テンプレート」とは、帳票のレイアウト中の読取箇所が分かるように、システム上で帳票画像にマーキングすることです。これを行うことで、帳票の画像のどの部分を読み取りたいのかを、AI-OCRに伝えることができます。

AI-OCRを活用する際、この「OCRの前処理をどこまで自動化できるか?」は非常に重要なポイントです。

「帳票認識サービス」は、読み取り帳票を自動で分類し、テンプレートの選択まで行うようにします。前処理機能が帳票の種類の確認、テンプレートの選択、画像補正などを自動で実施。利用者は文字を読み取りたい帳票を選ぶだけで多量の帳票の読み取りがスピーディーに行うことができます。非定型帳票においても業務において認識対象としたい項目を指定するだけで、事前の位置指定なしに帳票から目的とする認識項目を特定できます。AI-OCRに読み取ってほしい場所を詳細に設定する必要がなく、多様な様式の帳票を自動的にAI-OCRが判断。帳票のフォーマットを問わない読み取りが可能です。

文字の読み取りを行う認識エンジンには、大別すると次に示すように2種類のエンジンがあります。「帳票認識サービス」では、複数の認識エンジンが利用可能であり、さまざまな種類の帳票の読み取りに対応できます。

 

    • 定型帳票認識エンジン
      フォーマットが決まっている帳票のイメージデータを、高速・高精度にデータ化するAI-OCRエンジンです。ディープラーニング技術を活用し、活字文字に加えて、これまで自動認識が難しかった手書き文字を高精度に読み取れます。トレーニングデータの準備、または業界特有の言語モデルと連携することで、多言語対応や業界用語への拡張対応も可能です。
    • 非定型帳票認識エンジン
      さまざまな非構造なドキュメントから、情報を正確に抜き出して整理するAI-OCRエンジンです。フォーマットがバラバラな帳票にも対応可能で、さまざまな業務場面で活用できます。業務に合わせたトレーニングやチューニングを行うことで、人間のように文字を読み取り可能です。

ポイント③ 認識結果の確認作業工数は?

AI-OCRに100%の認識率を求めることは困難ですので、認識結果は人の確認が必要となります。読み取り作業は自動化できたものの、読み取り結果をその都度人が確認しなければならないと、業務全体の生産性は高まりません。そこで、解決策として、「確信度」スコアにより人による確認工数を削減する方策を講じます。

「帳票認識サービス」は、AI-OCRの認識結果の“確からしさ”を、アルゴリズムによる「確信度」というスコアとして提示します。さらにAI-OCR認識結果と確信度に対し、適用業務におけるチェックルール(桁数チェックや形式チェックなど)を適用して補正することで、AI-OCRの不読・誤読による誤ったデータ登録リスクを低減させています。

これにより、認識結果が確信度「低」の場合は、人による確認を実施、確信度「高」の場合は、人は確認せずに自動登録という具合に、誤登録リスクと人的な確認工数を抑制しながら、帳票業務の自動化率を向上できます。

さらに、認識結果と別系列の業務データとの突合チェックを行い、突合チェック結果も確信度の補正に活用することで、誤ったデータ入力のビジネスリスクをさらに低減し続けることも可能です。

【まとめ】

AI-OCRはOCRでは技術的に業務に組み込むのが難しかったような書類やフローでも対応できるものが増えているため、書類の自動入力を検討している方はぜひ一度資料などをチェックしてみてください。

スポンサーリンク

-AI-OCR, RPAについて, 新着記事
-, , , ,

執筆者:


comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

関連記事

日本人はなぜ英語を話せないのか?

目次1 英語学習で陥りがちな「4つの誤解」1.1 誤解① たくさん聞き流せば話せるようになる1.2 誤解② 間違ってはいけない1.3 誤解③ 長く美しい英語でなければいけない1.4 誤解④ 暗記すれば …

EXCELをデータベースのようにした操作簡単な完全無料配布顧客管理フリーソフト

顧客管理に関するソフトは種々雑多で非常にたくさん存在します。SEとして長年たずさわった筆者が多くのソフトを分析して、カスタマー・リレーションとして最低限の機能に絞って外部仕様を設計して具現化した顧客管 …

備品・消耗品 購入明細 ダウンロード excel明細管理作成 RPAによる自動化

目次1 【RPA化する以前】2 【RPA化した以後全て自動化】3 【まとめ】3.0.1 スポンサーリンク 企業や個人事業主においては、備品または消耗品を購入する場合の処理はどのように処理されていますか …

横浜市旭区 若葉台団地に住んでみて・・・ 

開発面積が90ha、総戸数5,300戸で構成されている最大規模の団地を、神奈川県住宅供給公社が丘陵地帯を開拓して建設した団地です。設計のコンセプトは自然を尊び人間を尊重すること、そしてレジャー、リクレ …

年賀状の無料テンプレートやイラスト集、Canonや郵便局など、便利なアイテムを紹介!

目次1 年賀状2018無料テンプレートがダウンロードできるサイトは?1.1 年賀状2018無料テンプレート1.2 Canonの年賀状ダウンロードページについて1.3 郵便局の年賀状ダウンロードは?1. …