書籍PDF化:縦書き検索ができない(OCR済)

このQ&Aのポイント
  • 書籍をPDF化し、自分でOCRを掛けたが縦書きの検索がうまくいかない
  • 他のアプリで試すと、縦書きは検索結果に表示されず、横書き部分の検索のみ可能
  • OCR時の設定に問題があるのか、検索するアプリが縦書きに対応していないのか疑問
回答を見る
  • ベストアンサー

書籍PDF化:縦書き検索ができない(OCR済)

こんにちは。 業者の方にお願いし、書籍を300冊ほどPDF化しました。それを受け取った後、Acrobat Pro 9を使用し自分でOCRを掛けたのですが、縦書きの検索がどうもうまくいきません。 検索にAcrobatを使用すれば問題ないのですが、他のアプリで試すと、ページ本文内の縦書きは一切、検索結果に表示されません。 代わりに、各ページの上部にある横書き部分(見出しや、タイトル名)に検索キーワードがある場合、それがヒットします。 これは、OCR時の設定に問題があるのでしょうか? それとも、検索するアプリが縦書きの検索に対応していないと考えるべきなのでしょうか? (マック環境なので、プレビューとスポットライトで試しました) 詳しい方、いらっしゃいましたら宜しくお願いします。 M

質問者が選んだベストアンサー

  • ベストアンサー
  • hokkaidor
  • ベストアンサー率100% (1/1)
回答No.4

もうだいぶ質問の時から時間がたってしまいましたが,同じ悩みを持つ方が検索でここにたどり着くこともあるかと思いますので(私もそうでした),書いておきます。 実は私も全く同じ症状で困っていました。ScanSnapで自炊した本を,iPad上で主にGoodReaderを用いて読もうと思っていたのですが,Mac上で問題なく検索できる縦書きのOCR済みPDFファイルが,iPadのGoodReaderの検索に全くかかりません。横書きの本や縦書きの本の中にある図表ないの横書き文字は検索されます。 どうも,iPad,iPhone上のアプリでは,まともに縦書きPDFファイルの検索に対応しているアプリがないようです。 質問者さんの挙げておられるiBooksも http://books.campur.com/archives/438 に,縦書きのPDFは検索できないと書いてあります。 私が見つけた,唯一縦書き検索に対応しているiPadのアプリとしては,「Bookman(無料)」がありました。しかし,これにも問題があります。 (1)検索スピードが異様に遅い。普通の新書1頁を検索するのに5秒くらいかかるので,200頁程度の全文検索には,15分くらいかかってしまいます。 (2)なぜか,OCRをAcrobat8でかければ検索にかかりますが,ScanSnap Managerでかけると,横書き以外,全く反応しません。OCRをかけるアプリケーションによっても違いが出るというのは困ったものです。やはりAcrobatを使っておくのが無難なのでしょうか? 素人には,横でできるものがどうして縦でできないのか理解不能ですが,兎に角,現状では難しいようです。 実は私自身はデジタル物に疎いので,他の方の訂正,追加情報を期待します。

mitsuwao23
質問者

お礼

投稿してから見つけたサイトの中に(url 探してみましたが見つかりませんでした)「 MacはOSレベルでは縦書きをサポートしていないので、縦書き検索をするには、アプリが個別に対応している必要がある」と書かれていました。 OS X で対応されていないうことであれば、iOSでもされていないと考えるのが当然だと思うので、自分としては、現状ほとんどのアプリで検索できない事にも納得できました。Apple側の対応を待つしかない、ということでしょうかね。。 ご回答ありがとうございました。

その他の回答 (3)

  • kokubosino
  • ベストアンサー率19% (697/3530)
回答No.3

MacでAcrobat Proで縦書きって一番悪い組み合わせです はっきり言って駄目ですよ、あきらめましょう^^ PDFなんでそのまま読みましょうね、OCRだと識字率が悪いから

noname#142908
noname#142908
回答No.2

まずAcrobatでは駄目な理由を明確にしてください Acrobatが一番適切なアプリです

mitsuwao23
質問者

補足

理由ですが、pdf化した書籍はパソコンではなく、iPadで読む予定です。 現在、縦書きpdfの検索に対応しているアプリがあるのかは、まだ調べていませんが、iBooksは横書きならpdfでも検索が可能で、今後アプリ自体がepubファイルの縦書き表示に対応するのに従い、縦書き検索も可能になると思います。 その際の二度手間を防ぐために、いま自分の手順が間違えているのであれば教えて下さい、ということです。

  • yasuto07
  • ベストアンサー率12% (1344/10625)
回答No.1

なぜ、加工利用を想定していたのに、PDFにしたしまったのですか?、これは印刷イメージの意味ですよ。二次加工には、向かないのです。意味を理解していますか?。 本来は、書籍300冊、業者に頼むなら、テキスト文にしてもらえばよかったのに。 PDFの文章の検索なて、どう考えても、うまくいくはずがありませんよ。 PDFを、OCR、テキスト文に直しているかなにかしているのですか、二度手間、三度手間を感じます。

mitsuwao23
質問者

補足

あまり、詳しくないのは事実ですが、手順が間違えてるとも思えません。 OCRテキスト認識では、スキャナなどで取り込んだ画像形式のPDFを検索可能な文字列として変換させる機能です。 http://blog.m-school.biz/article/122983491.html また、頼んだ業者さんでも同じ手順を踏んでいるはずです。基本料金として(PDF化)一定額がまず設定されており、 オプションでOCRの追加が選べる形です。取り込みのスキャナーは持っていないのですが、acrobatは持っていたため、今回は自分でOCR処理することにしたのです。 また、PDF内の検索も横書きであれば、一切問題ありません。うまくいくはずがない、とはどういう意味でしょうか? PDFにOCR処理をして、テキスト内検索は、googleなどで検索する限りとても一般的に思えます。今回は、それがうまく行かないのでここで尋ねているのです。

関連するQ&A

  • 縦書き→横書きに変換し編集するのに良いocrソフト

    (祖父の)縦書きの著書をスキャンしてOCRソフトで横書きに換え、WZエディタで編集して(書き加えたり、文体を今風に変える)、横書きの本(黒字のみ)を作りたいです。「読んde!!ココver.13」でやってみましたが、うまく横書きにできず、文字も滅茶苦茶になります。 なお、WORDや一太郎を通さずにいきなりエディタに読み込むことができるてしょうか。著書は1000ページ足らずで、バラバラにしても構いません。 よいocrソフト 及び 相性のよいスキャナーとプリンタ(カラー可能)をお教えください。複合機でも構いません。90%くらい認識できれば上等です。この仕事が終われば壊れても構いませんので、合計3万円内外の価格が希望です。どうか宜しくお願いいたします。

  • WORDの表示(縦書き・横書き)について

    WORD2003を使用しています。 横書きで入力されているWORD文書を印刷プレビューで見ると 縦書きで表示され、印刷も縦書きになります。 どのような設定をすればこのような結果になるのでしょうか。 印刷設定では、文字方向は横書きになっています。(;_;) ご存じの方のご教授をお願いいたします。m(_ _)m

  • Word2003の縦書きと横書きの自由切り替え設定教えて下さい。

    お世話になります。 WindowsXP Microsoft Office Word2003を使用しています。入力画面を横長にして上部に横書きでタイトルを書き込ました。次に縦書きの文章に切り替えたいのですが、書式→縦書き、横書きの設定では、前に書いたタイトルまで縦書きになってしまい、どうしてもうまくいきません。 横書きにしたタイトルはそのままで、それ以降縦書きに変更する設定をご教示願えれば幸いです。

  • PDFの本文を検索できるようにするには?

    本や新聞の切り抜きなどをスキャナで読み取ってグーグルデスクトップで本文中のキーワードを検索できるようにするにはどうしたらよいのでしょうか?PDF化したページが表示されればと思い、いきなりPDFスキャナ2 で新聞記事を透明テキスト付PDFにしてみましたが、本文中のキーワードで検索しても検索に引っかかりませんでした。ちなみにスキャナはブラザーA3カラー複合機ジャスティオMFC-6490CNです。

  • ワードの文字の方向

    Windows 7 ワード 2010 を 使用しています。 ファイルの見出しの印刷時、1枚のページに横書きの文字を2つ作成して、ワードのページレイアウト→文字列の方向→縦書きしたい文字を選択し→縦書きをクリックすると2つとも縦書きになります。 ファイルの表紙用に横書き、背表紙用に縦書きの文字を作る場合、文字列の方向で縦書きにしたものと、横書きのものを作成して、印刷を行っています。 1枚のページにに縦書き、横書きの文字は作成できないのでしょうか。」

  • ワードで1ページ目を横書き、2ページ目を縦書きにできる?

    ワードで1ページ目を横書き、2ページ目を縦書きにできますか。ただし、図形、テキストボックスを使用しないでやりたいのですが、そんなことが可能でしょうか?

  • 検索可能なPDFからキーワード検索ができません。

    たまった論文を整理し、あとで検索しやすいようにOCR機能のあるScanSnap ix1500を購入しました。画質はスーパーファインで検索可能なPDFモードでスキャンし、ScanSnap Homeに保存しました。 ScanSnap Homeの上段にある検索するところにキーワードを入れ、エンターボタンを押したり、マウスをクリックしましたが、画面に変化はありません。 キーワードを入れることで、該当するページが表示されると思っていたのですが、うまく検索することができないようです。解決方法を教えていただけると幸いです。よろしくお願いいたします。 ※OKWAVEより補足:「「ScanSnap/fiシリーズ/HHKB」商品について」についての質問です。

  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • ページの途中で一部分だけ横書きから縦書きに変更する方法

    ワードの初心者です。ワード2003で横書きの文章の途中で1部分を縦書きの文字にしたいとき 書式→縦書きと横書き→縦文字 と進みOKすると強制的に改ページ せれますよね。改ページされなくて選択した文字が縦書きできませんか。別の方法で挿入→テキストボックス→縦書き 描画をここにいれ作成 しますと改ページはしませんが 文字に枠が入り枠が削除できませんで困っています。問題の解決方法を教えてください。 

  • 差し込み印刷で封筒宛名を縦書き印刷するには

    封筒に宛名を直接縦書き印刷したいのですが、どうも上手くいきません。ワードのページ設定で用紙を封筒サイズに、縦書き設定にして、差し込み印刷のレターで宛名をデータ元から差し込みました。ここまではいいのですが、印刷プレビューでもちゃんと縦書きになっているのに、実際印刷すると封筒の上の方になぜか横書きでしかも前半部分が切れた形で印刷されます。もちろん、プリンタの設定でも用紙を封筒サイズにしているのにどうしてこうなってしまうのでしょうか?ちなみに、縦書きがいけないのかと横書きにして印刷しようとしたら、なぜかプリンタが封筒を給紙してくれません。プリンタはエプソンのPx-G930です。

専門家に質問してみよう