>906
すげえな、まじかよコレ。

当方、もうずっと以前からxubuntu16.04上でtesseract-ocr4.00alfaを使って、
スキャンした小説のテキスト化をやっているが、最近やっとそれなりの認識結果の
テキストファイルを吐き出せるようになったというのに、これはかなわない。

本来ベトナム語用OCRソフトだったVietOCRも、以前に一度使ったことがあったけど
認識結果はとくに変わらなかったから素のtesseract-ocrでずっと使ってきたけど、
ここまで向上できるものなのか? 桁違いの認識精度だな。とくにtesseract-ocr
のくせに余計な半角スペースが全然挟まってないのが素晴らしい。

ちょっとVietOCRインストールしてくるわ。