0909名無しさん@お腹いっぱい。
2018/03/30(金) 21:57:07.63ID:ahn0K420すげえな、まじかよコレ。
当方、もうずっと以前からxubuntu16.04上でtesseract-ocr4.00alfaを使って、
スキャンした小説のテキスト化をやっているが、最近やっとそれなりの認識結果の
テキストファイルを吐き出せるようになったというのに、これはかなわない。
本来ベトナム語用OCRソフトだったVietOCRも、以前に一度使ったことがあったけど
認識結果はとくに変わらなかったから素のtesseract-ocrでずっと使ってきたけど、
ここまで向上できるものなのか? 桁違いの認識精度だな。とくにtesseract-ocr
のくせに余計な半角スペースが全然挟まってないのが素晴らしい。
ちょっとVietOCRインストールしてくるわ。