サンプルイメージファイルを使って解説します。
今回は、まず画像トリマーを起動します。
連番の画像ファイルの入ってるフォルダを選び
その中の切り取りの目安に最適と思われるファイルを選びます。
今回のイメージファイルでは上のノンブル(ページ番号)部分が読み上げアプリには必要ないのでそれ以外の本文部分を切り取るように左上隅をクリック。
そして、スクロールして、
右下隅をクリック。
OKを押してしばらく待ちます。
処理が終わるとソースのフォルダを削除するか尋ねてきます。
どちらか選ぶと、処理後のファイルがエクスプローラで表示されますので、ここで読み上げアプリに必要ないと思われる
表紙や扉絵、挿絵、目次、奥付などを削除します。
今回は、表紙を削除しました。
次に画像ファイル分割PDF変換を起動します。
今のところデフォルトで4MBになっています。(Googleドキュメントは9MBくらいまで開くことができるようですが、最後までOCRしてくれるとは限りません。)
処理したフォルダを選択。
しばらく待ちます。
処理が終わるとまた、ソースのフォルダを削除するか尋ねてきます。
今回は9個のPDFファイルができました。
+新規を押して
ファイルをアップロードを選択、
できたPDFファイルを選んでアップロードします。
PDFファイルを右クリックして
アプリで開くーGoogleドキュメントを選択
それをファイルごとに繰り返します。
(一度に連続してGoogleドキュメントを開くとエラーが起きるので自分の環境では5,6個くらいでしばらく待つのが良いです。)
(※GoogleDriveで新しいタブにフォーカスさせない方法 - 主にメモ)
9つの新しいファイルができたら選択してダウンロードします。
ダウンロードしたファイルを解凍すると9個の.docxファイルができます。
.docx結合.txt変換+読み上げアプリ最適化を起動して.docxファイルのあるフォルダを選択。
しばらく待ちます。(予めMicrosoft Wordまたは、Openoffice Writterのどちらかをインストールしておいてください。)
ファイルごとに最後までOCRされているかチェックして、テキストファイルに結合変換します。
同じフォルダにそのまま結合しただけの_OCR.txtと自分の使用してる読み上げアプリに最適化した_OCRH.txtができあがります。