古いバージョンのブラウザーを使用しています。MSN を最適にご利用いただくために、サポートされているバージョンをご使用ください。

少ない学習データでも高精度で文字認識 富士通が開発、ディープラーニングを効率化

ITmedia NEWS のロゴ ITmedia NEWS 2017/02/22
少ない学習データでも高精度で文字認識 富士通が開発、ディープラーニングを効率化: 従来技術と比べると、1文字当たり約70%少ないデータ数で同じ精度を実現できるという © ITmedia NEWS 提供 従来技術と比べると、1文字当たり約70%少ないデータ数で同じ精度を実現できるという

 中国の富士通研究開発中心(FRDC)は2月21日、古文書文字を画像認識するディープラーニングに改良を加え、少ない数の学習データでも高精度で認識できる仕組みを開発したと発表した。従来技術と比べると、1文字当たり約70%少ないデータ数で同じ精度を実現でき、古文書文字を電子化する作業の効率化につながるという。

 ディープラーニングを用いた従来の文字認識では、あらかじめ文字画像と正解の文字を正しくひも付けたデータを認識エンジンに学習させる。学習するデータが多いほど認識精度は高くなるが、中国の古文書文字だとさまざまな書体がある上に、同じ文字でも字形が異なる場合もあり、十分な量の学習データを用意することが難しかった。

 新技術では、これまでは正解の文字とひも付かずに学習データに使われていなかった文字画像データも学習に活用。(1)認識エンジンが文字画像に、正解と考えられる「仮の文字ラベル」を与える、(2)それらの文字画像をランダムで2枚ずつペアにする、(3)2枚が同じ文字かどうかを別の認識エンジンが判断、(4)判断結果を認識エンジンにフィードバックして違いを学習させる――という手順を繰り返すことで、認識精度を向上させるという。

 同社のベンチマークテストによれば、新技術は81%の認識精度を達成するのに必要な学習データの数(1文字当たり)が、従来技術よりも約70%少なくて済むという。1文字当たり50個のデータを使って学習させた場合は、従来技術だと約82%だった認識率が、新技術では88%まで向上したという。

 新技術は、中国各地の図書館や古文書データベース向けに提供する予定。日本語や韓国語などにも応用できるという。2018年度には富士通の人工知能(AI)技術「Human Centric AI Zinrai」への活用を目指し、植物の識別など、認識すべき対象が多い用途に導入するとしている。

ITmedia NEWSの関連記事

image beaconimage beaconimage beacon