- 締切済み
文字認識を誤ったPDFを訂正したい。
富士通のスキャンスナップで文書を検索可能なPDFにしました。検索に引っかからない文字があり、おかしいと思って調べたら「穢」の文字を「糠」とか」「穣」として認識していたようです。枚数が膨大なので、再度スキャンする気にもなれず困っています。誤って認識した文字を正しく認識させる方法はありますか?ちなみにPDF編集ソフトはPDFelement6 proを所有しています。
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- Eureka_
- ベストアンサー率41% (5084/12282)
>PDFの状態で文字検索をかけたい 誤認識しているテキストがスキャン画像と重なってる状態では直すこともままならない、と言っているのです。 まずテキストとしてどこが間違ってるのが把握し、把握された誤認識ポイントをPDF編集ソフトで打ち直していくという手作業が必要であろうと考えます。
- roadhead
- ベストアンサー率22% (852/3790)
PDFの編集を行うソフトを利用する事になります。 無料のものや有料のものが沢山あります。
- Eureka_
- ベストアンサー率41% (5084/12282)
>それをもしやるとなると 誤認識を含むテキストを全部選択してメモ帳辺りにコピペして、そっちで見ていく方が楽かなーという気はしますね。 レイアウトの関係でよりわからなくなる可能性もありますが。 レイアウト保持まで考えるなら、PDFelementは使ったことがありませんがWord形式などでの書き出しには対応していませんか? なんせスキャン画像と切り離して文字だけにしてみないと、どうしても人間側の認識が画像に引っ張られて校正が捗らないと思います。
お礼
回答ありがとうございます。PDFの状態で文字検索をかけたいので、ヒットしないと、その関連の文書を見つけることができないので不便なんです。
- roadhead
- ベストアンサー率22% (852/3790)
誤認識は防ぐことが出来ません。 どの様に誤認識しているかは一文字づつ人間が確認して修正する校正と言う作業を行うしかありません。 大変な手間になりますが手作業になります。
補足
回答ありがとうございます。それをもしやるとなると私の所有のソフトでもできるのでしょうか?またはほかのソフトですか?
お礼
PDFelement6 proってのを使っているんですけどね。有料の正規版です。