0933名無しさん@お腹いっぱい。
2018/04/03(火) 01:48:10.91ID:m9tGIMBo自己レス
Viet5αのメニューから取得した言語データはここのtessdata_fastのjpn.traineddataと同じものだった(compで確認)
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
tessdata_fastのページの下のほうに書かれてるけど縦書き用は言語データが分かれてた
jpn_vertmをダウンロードしたら一応行けたけど縦はまだ未チューニングで従来と精度変わらないぽい
https://i.imgur.com/Jg5KqkK.png
コマンドラインからは jpn+jpn_vert で辞書切り替えなしで縦横両方いけた
時間むっちゃかかるけど
-- cmd_ocr.bat (tesseract-ocrフォルダに配置) ---
@echo off
set TESSDATA_PREFIX=%~dp0
"%~dp0tesseract.exe" -l jpn+jpn_vert %1 %~n1 %2
-----------------------------------------