AI-OCRとは?業務に組み込むメリットと課題、活用シーン

AI-OCRとは

AI-OCRとは、AI(人工知能)を活用して帳票や書類、文書、画像上の文字を読み取り、テキストデータ化する技術です。

そもそもOCRとは「Optical Character Recognition(あるいはReader)」の略で、日本語では「光学文字認識」の意味になります。帳票や書類などに記載された活字や手書き文字をスキャナやカメラで読み取り、データ化するのです。

つまり、AI-OCRはAIと従来のOCRを融合させた技術ということになります。AIを用いることで文字の認識精度が飛躍的に向上し、活用の幅が広がりました。

AI-OCRとOCRの違い

AIを組み込むことで、従来のOCRとなにが変わるのでしょうか。大きな違いは、AIの特徴であるディープラーニング(深層学習)を活用できることです。ディープラーニングとは、特定の課題を実行させるため、コンピュータに学習させることをいいます。

もちろん従来のOCR技術もビジネスをはじめさまざまなシーンで活用され、業務や作業の効率化につながりました。しかし、いくつかの欠点があることも否めません。

特に問題になるのは認識精度で、手書きの帳票やキャプチャした帳票です。現在、世界中でペーパーレス化・デジタル化が進んでいますが、いまだ紙の帳票や書類はなくなっていません。そのなかには手で書かれた文字もたくさんあり、それらには書いた人の個性や癖が表れます。また、キャプチャするにはズレが避けられないため、従来のOCR技術では正確に認識するのが難しいのです。

事前作業および事後作業が多いのも問題です。OCRでテキストデータを抽出するためには、あらかじめ帳票や書類などの向きの調整、認識していく文字の順番を詳細に決めておくことなど、さまざまな事前準備をする必要があります。また、データ化する帳票や書類のフォーマットが複数種類ある場合は、そのレイアウトを作業者の手で登録しておかなければなりません。そしてOCR結果のチェックも欠かせません。

状態の悪い帳票や書類の文字認識率が悪いのも問題の一つです。帳票や書類はFAXで送受信することがありますが、従来のOCR技術では文字にノイズがあるとうまく認識できません。本来であれば「大」と読み取るべきところを、ノイズを文字の一部だと認識してしまい「犬」や「太」と読み取ってしまうようなことがあるのです。文字認識率を上げるためには画像を読み込む前に、人間の手によってノイズを除去しておく必要があります。

こうした問題を解決するのが、AIのディープラーニングです。人間は他者が書いた文字の特徴を理解して、高い精度で認識することができます。また、帳票や書類を見ればレイアウトや向き、読み進める順番も理解できますし、紙の汚れを文字の一部だと誤認してしまうこともありません。

ディープラーニングは、人間であれば当然のように認識できることをコンピュータに継続的に学習させることで実行できるようにすることを指します。これによってAI-OCRは、従来のOCR技術ではできなかった人間の作業負担を減らしながら、高い精度で帳票や書類をテキストデータ化できるようになったのです。

AI-OCRを業務に組み込む5つのメリット

AI-OCRには主に5つのメリットがあります。

1. テキストデータ作成後の修正作業の削減

AI-OCRの特徴は文字認識率の高さです。たとえば従来のOCRでは漢字の「工」とカタカナの「エ」を正しく区別できないことがありました。漢字の「夕」とカタカナの「タ」など、同じように認識しづらいものは多くあります。また、文字の背景や網掛け、かすれなども、誤認識の原因です。

AI-OCRはディープラーニングによって繰り返し継続して学習していくため、文字認識の精度が向上していきます。これはプリンターによって印字された文字でも手書き文字でも同様です。AI-OCRの文字認識率の高さは、人間による確認と修正の負担を大幅に削減します。

2. データ入力時間の削減

AI-OCRはデータの入力業務の削減につながります。入力業務とは、紙の帳票や書類に書かれた文字を人間がデータベースに打ち込んでいく作業のことです。もちろん、従来のOCRでも、この作業にかかる時間を削減することはできました。ただし、文字認識の精度が低かったため、入力作業が減る代わりにチェックと修正の負担が増えることになったのです。これでは人間の作業負担を、実質的には大きく削減できません。

AI-OCRを活用すれば、帳票や書類を読み込ませるだけで高い精度のテキストデータを作成できます。人間の負担を軽減しながら、業務効率と品質を向上させることにつながるのです。

3. フォーマットが異なる帳票に対応

従来のOCRで帳票や書類を読み込むときには、そのレイアウトや向き、読み取り位置、項目などを人間が確認し、定義しておく必要がありました。AI-OCRではAIがこれらを自動的に認識します。たとえば、請求書や見積書、発注書、納品書など複数種類の帳票や書類のフォーマットが異なっていたとしても、事前準備に大きな負担をかけることなくテキストデータ化できるのです。

4. 情報の一元化

AI-OCRを活用すれば、紙で保管・保存していた帳票や書類を一元的なデータにすることができます。検索によって必要なものを素早く見つけられるようになるだけでなく、組織内で簡単に共有できるようになり、情報の有効活用にもつながります。また、ペーパーレス化によって、紙の帳票や書類の保管場所が不要になる点も見逃せません。

5. RPAとの連携で作業効率と生産性アップ

従来のOCRでは紙の帳票や書類の文字の読み取りはできたものの、その意味を認識することはできませんでした。そのためOCRで読み取りをしたテキストデータと業務システムの入力欄との紐づけを、人間が行わなければならないことがありました。

そこで活用できるのがRPAです。RPAとは「Robotic Process Automation」の略で、人間がパソコンで行っているのと同じ作業を、プログラムされたソフトウェア型のロボットに自動で行わせる技術をいいます。

AI-OCRとRPAを連携させることで、読み取ったテキストデータが業務システムのどの項目に対応するのかといったことを自動的に判断できるようになります。紙の帳票や書類からテキストデータを抽出するだけでなく入力や転記も自動化できるので、人間の作業負担が軽くなり大幅な業務効率化を図れるのです。

AI-OCRの活用シーン

AI-OCRはどのようなシーンでの活用に有効なのでしょうか。

受発注業務

取引先や顧客から届く発注書や注文書、申込書などは、手書きであることがまだまだ多くあります。従来のOCRは手書き文字や文字近辺のノイズ、複数種類のフォーマットからの文字認識に弱く、結局は人間の作業負担が軽減されないことがありました。AI-OCRであれば手書き文字やノイズの入った文字の認識率も高く、フォーマットの異なる帳票や書類にも対応。受発注システムと連携することで、大幅に業務を効率化できます。

経理業務

たとえば、取引先から届く請求書を会計システムに入力するときには、取引先名や住所、金額だけでなく、勘定科目、部門、項目などを入力する必要があります。従来のOCRでは難しかったこれらの自動抽出も、AI-OCRであれば高い精度で実現できます。

企業内に保管されている帳票や書類のデータ化業務

過去に紙で作成あるいは受領した帳票や書類が、紙のまま保管されているケースがあります。このなかから目的のものを見つけるためには、膨大な帳票や書類を確認する必要がありました。人為的なミスによって、あるべきところにあるべきものが保管されていないようなことがあれば、業務効率は著しく低下します。紙のまま保管されている帳票や書類は、できるだけ早くデータ化する必要があるのです。

ただ、その作業のすべてを人間の作業によって行うのは効率的ではありません。AI-OCRを活用して自動化すれば効率よくデータを抽出できます。

【AI-OCRを活用できる書類例】

  • 契約書
  • 申込書
  • 証明書
  • 証券
  • 伝票
  • アンケート用紙
  • 受領した名刺
  • 手書きマニュアル
  • 手書き図面

AI-OCRの課題

AI-OCRは大幅な業務効率化を期待できる技術です。しかし、課題もあります。

文字認識率の精度は100%ではない

AI-OCRを使えば、帳票や書類から効率よくテキストデータを抽出できます。ただし、その文字認識精度は完全ではありません。もちろんディープラーニングによって精度は向上していきますが、100%にすることは難しいものです。間違いなく業務を進めるためには、人間によるチェック作業がどうしても必要になります。

自社の業務に合わせたAI-OCRサービスを選ぶ必要がある

AI-OCRには「印字の認識に強いもの」「手書き文字の認識に強いもの」「印字と手書き文字の両方に対応できるもの」など、さまざまな種類があります。ですから、自社で扱う帳票や書類の特徴をあらかじめ洗い出し、適切なものを選ばなければなりません。チェックポイントには主に以下のようなことがあります。

  • 読み取る帳票や書類は印字のものが多いか、手書き文字のものが多いか
  • 日常の業務で読み取る帳票や書類は定型か非定型か
  • 帳票や書類に書かれた文字には日本語以外の言語や業界特有の用語が使われているか

日常で読み取る帳票や書類のフォーマットが多岐にわたる場合、それに対応したものを選ぶ必要がありますし、世界中から帳票や書類が集まる場合は多言語に対応しているものでなければなりません。このように自社が扱う帳票や書類の特徴をチェックして、適切なAI-OCRサービスを選ぶ必要があります。

まとめ

AI-OCRは従来のOCR技術と比較して文字の認識精度が格段に向上しています。しかし導入にあたっては、あくまでどれだけの効率化が見込めるかといった業務への総合的な貢献度を検証することが必要です。

オージス総研が提供するOCRサービスは、企業間データ連携であるEDIとの親和性が高いのが特長です。EDI経路にAI-OCR機能を組み込んでいるため、読み取り結果を業務システムに直接連携することができます。

また、AI-OCRを用いながら読み取る範囲を帳票の値に限定して、帳票の項目の読み取りつまりレイアウト解釈は実施していません。これにより、レイアウト解釈に失敗した場合に読み取ったデータの構造が破綻してしまうことを防止しています。更に、読み取った値の整合性をチェックするなど、データ連携の安全性を高める仕組みを備えています。

この機会にぜひオージス総研のOCRサービスによる業務効率化をご検討ください。

2022年7月1日

※この記事に掲載されている内容、および製品仕様、所属情報(会社名・部署名)は公開当時のものです。予告なく変更される場合がありますので、あらかじめご了承ください。

関連サービス

  • eCubenet OCRオプションサービス

    EDIにおけるOCRまたはAI-OCR機能を提供するサービスです。注文の帳票や請求書の帳票を読み取って変換します。請求は明細単位でOCRしますので、業務効率化、転記作業時間の削減、転記ミスの防止を実現し、貴社のDX推進に貢献します。

  • EDIアウトソーシングサービス

    レガシーEDIからインターネットEDIまで、EDIをサービス形態でご提供します。2024年1月のINSネット終了に伴うインターネット化対応も可能です。

  • eCubenetデータフロー

    企業間の連携接続に手間取ることがなくなります。取引先や協業先とすぐに連携できるので事業拡大のデータ連携基盤として利用することができます。