OCRとは
OCR(Optical Character Recognition/Reader、光学的文字認識)とは、手書きや印字を読み取りデジタル化する技術。書類をスキャンして文字を抜き出し、デジタルデータで処理できる文字に変換することで、手入力する作業を効率化するものです。
OCRの弱点
1.精度向上が難しい
日本語OCRは40年近い歴史を持つテクノロジーですが、日本語はひらがな、カタカナ、漢字と文字の種類が多く誤認識もありました。文字認識の精度を向上させるためには、大々的なOCRエンジンのバージョンアップが必要となります。
2.座標の設定が必要
帳票の種類ごとに、読み込む文字が配置されている座標を設定する必要があります。帳票ごとに作成するため膨大な手間がかかることと、座標からズレた場合には認識することができません。
3.定型フォーマットしか対応しない
非定型のフォーマットには対応していないため、OCRで帳票上の文字を認識させる前に予めどのフォーマットで認識させるか指定する必要があります。そのため、様々な帳票をOCRで認識させたい場合、その都度設定が必要になるため、非常に手間がかかります。
AI-OCRとは
AI-OCRとは、簡単に言うとAI技術を取り入れたOCRです。AIを導入することで、読み取り精度が格段に向上し注目されています。
特に、RPA(Robotics Process Automation)の導入を検討するものの種々雑多な紙書類の電子化が高いハードルとなり、RPA導入を躊躇していた企業から、認識精度の高いAI-OCRに関心が高まっているのです。
AI-OCRの強み
従来型OCRの弱点を克服したのが、AI-OCRの強みです。
1.精度向上が難しい → 常に精度が向上
人工知能のディープラーニングにより、データを処理しながら学習を続けることで、認識精度が向上するのが強みです。また、トレーニングデータを用意することで、さまざまな言語、業界用語の手書き文字認識への応用も可能です。手書き文字にも高い精度で対応するAI-OCRもあります。
2.座標の設定が必要 → 設定が不要
AIにより座標の設定は不要になり、人工知能が自動的に判別するオートセグメンテーション機能を持つAI-OCRでは、従来型OCRでは1時間もかかるテンプレート作成も、2~3分でスピード設定できます。
3.定型フォーマットしか対応しない → 自動で対応
AI-OCRでは、非定型フォーマットに対応しています。処理を行う際にどのテンプレートを使用して読み取るかを設定しなくても、自動的に識別されます。複数の取引先から送られてくる請求書などバラバラなフォーマットの帳票を、一度に複合機でスキャンするだけで自動的にテンプレートが選ばれる機能をもつAI-OCRもあります。
この他にもAI-OCRの強みは多数あります。また、AI-OCRを開発している会社によって、それぞれ得意分野があります。
AI-OCRの比較
企業名 | 商品・サービス名 | オススメPOINT | |
1 | ネットスマイル | AIスキャンロボ | RPAとの連携、多品種小ロットの帳票に最適 |
2 | ABBYY | FlexiCapture | 大量処理、多言語の帳票を扱う企業に最適 |
3 | コージェントラボ | Tegaki | 手書き文字の処理が多い企業に最適 |
4 | AI inside | DX Suite | フォーマットが一定の書類が大量にある業務に最適 |
5 | インフォディオ | スマートOCR | AI-OCR後のサービスも充実。保険代理店に最適 |
[1] ネットスマイル「AIスキャンロボ」
RPAとの連携、多品種小ロットの帳票に最適
多数の取引先から送られてくる請求書などバラバラなフォーマットの帳票を、一度に複合機でスキャンするだけで自動的にテンプレートが選ばれる、テンプレート自動識別機能を搭載しています。
また、3枚綴りの請求書など2ページ以上にわたる帳票もAIが判別して読み取りが可能なので、WinActorやBizRobo!、SynchRoidといったRPAツールとの連携も容易な点が強みです。
一定フォーマットでの大量処理は勿論、多品種小ロットの書類を読み込み、RPAに連携するのに最も適しています。
[2] ABBYY「FlexiCapture」
大量処理、多言語の帳票を扱う企業に最適
大量かつ高速なドキュメントの処理にも対応。1日に百万以上の文書を処理する場合も、1分で1,000ページを処理する場合も、処理要件に合わせてスケーリングできます。
また、グローバルでOCRをはじめ情報の有効活用を実現する技術を展開しているため、複雑なレイアウトの書類やPDFであっても、柔軟にテキスト文書へと変換する最先端テクノロジーがあります。ABBYYのAI-OCRは、198の言語に対応し、複数言語が混在する文書であっても、高精度な認識・変換機能により正確に読み取ります。
[3] コージェントラボ「Tegaki」
手書き文字の処理が多い企業に最適
読み取る紙の書類が手書きの場合に有効です。手書き文字の認識率99.22%を達成した研究結果に基づき、データ入力業務の効率化とコスト削減を実現。OCR・ディープラーニングを活用した独自のアルゴリズムを利用し、平仮名、片仮名、漢字、数字、アルファベット、記号などさまざまな手書き文字を認識することができます。
特に手書き書類で使われる1文字ずつ記載する枠や選択式のチェックボックスなどにも対応しており、手書き文書を読み取ることを想定している場合に最適です。
[4] AI inside「DX Suite」
フォーマットが一定の書類が大量にある業務に最適
特別な事前学習なしに、従来型OCRでは困難であった文字と文字のつなぎ目や切れ目を判別するなどがAI-OCRにより可能になっています。大量データ読取り時も、自動でスケーリングを行うため、必要な時に必要な分だけのリソース利用が可能であり、大規模処理が想定される場合に有効です。
また、エントリー作業のAIによるサポート、ベリファイのサポート、エントリーベリファイの複数回チェックのサポートなど、データチェックに関する基本機能を取り揃えており、一定の書類が大量にある業務に向いています。
[5] インフォディオ「スマートOCR」
AI-OCR後のサービスも充実。保険代理店に最適
保険代理店であるアイリックコーポレーションを親会社に持ち、保険代理店業界に詳しいことから、AI-OCRだけでなく、加入している保険の内容をわかりやすくビジュアルに分析する「保険IQシステム」、複数の保険会社の商品を一度に検索、比較、提案する「AS-BOX」、保険代理店向けに複数の保険会社の契約内容を顧客単位で照会し、募集人ごとの手数料管理、経営分析までをトータルに管理する「顧客契約管理システム」といった独自の保険システムを構築していますので、保険代理店が導入するAI-OCRとして最も適しています。
まとめ
RPAの導入を検討するものの種々雑多な紙書類の電子化が高いハードルとなって、RPAの導入を躊躇する企業も少なくはありません。こうした企業にとって、従来型OCRとは比べ物にならないくらい簡単になったAI-OCRは画期的です。一連の「働き方改革」により、RPAが浸透するほど、AI-OCRはますます注目されるようになるでしょう。
なお、読み取りたい書類の種類によって最適なAI-OCRは違います。導入にあたっては、各社が提供している無料トライアルやデモを使って、自社にあったサービスをお選びください。
※上記の比較は、掲載時におけるWEB等の公開情報や取材等に基づいて作成しておりますが、情報が古いなど現況と異なる場合はご指摘ください。