パーソルグループのパーソルプロセス&テクノロジー(本社:東京)は、Sigfoss(本社:東京)と共に、ディープラーニング技術を活用したOCRの文字認識技術を共同で開発し、非定型の帳票から必要な情報を抽出・デジタルデータ化するソリューションの提供を8月7日より開始した。
多くの企業では業務の効率化を実現するRPAの活用が進んでいるが、紙中心の業務が多い日本企業では、請求書などの非定型書類に記載された文字を人の手でシステムに入力する必要があることが、生産性向上を阻害する要因の1つとなっている。
そこで多くの企業は帳票の文字などアナログデータをデジタルデータに変換するOCRの活用を検討するも、非定型の帳票が大半を占め、そこから文字を認識することが困難、もしくは読み取るための詳細な設定が必要になるなどの理由で導入が困難な状況にある。このような課題を解決するために、同社らは、ディープラーニング技術を活用したOCRの文字認識技術を共同で開発し、従来の技術では認識することが難しかった非定型帳票からの情報を認識、デジタルデータ化するソリューションの提供を開始。
従来のOCRでは「書類のこの位置にこの文字がある」と座標を指定して認識、読み取っていたため、詳細設定が必要であり、崩れた手書き文字や、罫線や枠線、異なる背景色等から文字を高い精度で認識することが困難であったが、同ソリューションでは、ディープラーニング技術を活用したOCRエンジンが、非定型の帳票から企業名、名前、住所などの文字を認識し、アナログデータからデジタルデータに変換する。
具体的には、あらかじめ読み込ませた帳票から特徴を抽出し、OCRで読み取った情報と文脈や出現場所から文字を認識。また、処理後、結果を継続的に蓄積・学習することで、文字認識の正確性を向上し続ける。