bunkoOCRを少し試しているのですが、認識率もさることながら、GoogleDriveでのOCRで出来なかったルビ無しのOCRがいいですね。
※うちのPC(CPU AMD Ryzen 7 PRO 4750GE with Radeon Graphics 3.10 GHz 内臓GPU)では1冊bunkoOCRでOCRするのに4時間程度かかりますが…
以前から愛用しているiOS用テキスト読み上げアプリ(Voice Dream Reader)で聴くとGoogleDriveで変換したテキストではルビが邪魔でいつもイラっとしていましたw。
そこで、bunkoOCRで生成したルビ無テキストファイル(noruby.txt)を結合。
改行ごとにテキスト読み上げアプリ(Voice Dream Reader)では間があるので改行を削除。
代わりに「。」の後に改行を追加。
UFT-8でOCRされるので書式を崩さないように日本語プログラミング言語「なでしこ」v1とPowershellの合わせ技で作ってみました。
できたテキストファイルは、フォルダ名+.noruby.txtです。
Powershellもコマンドプロンプトもほとんど知識無しでしたが、ChatGPT先生に聞きながら試行錯誤したら意外とできるものですね。(一度尋ねてそのまま動いたためしがないのでエラーを含めて何度も尋ねるを繰り返しましたw。)
なでしこv1でプログラムを作るのに便利ですね。ChatGPTもPowershellも。