• 締切済み

OCR機能付のPDF閲覧iPadアプリを探してます

iPad用のアプリについて質問させて下さい。 iBookやi文庫HDなどPDFを閲覧できるアプリは沢山ありますが、アプリで表示中のPDF内の画像に対してその場でテキスト認識>クリップボードにコピーできるものを探しています。 文章と写真の混在した専門誌をスキャニングしたJPGをPDF化していますが、それをアプリで閲覧しつつ、気になる文章をクリップボードにコピーしてメモ帳に貼り付けるなどしたい訳です。 最初からOCR処理を施したPDFにしていないのには、スキャン後に画質調整したり解像度を自由に変えたかったり、OCR機能のある高額なソフトでもOCR機能が完璧じゃなく専門書なので誤変換が怖いなどといった理由でJPGのままPDF化しています。 私が知りたいのは先に書いたように、閲覧中に気になったページ(の一部など)だけテキスト抽出できるようなアプリがあるのかどうかです。 もしそのようなアプリをご存知であれば教えて頂ければ大変ありがたいです。 よろしくお願いします。

みんなの回答

  • LHS07
  • ベストアンサー率22% (510/2221)
回答No.4

テキスト化そのようなことができると本当に便利だとは思います。 しかしながら本全体を容易に文書化できることになるので、著作権法に抵触する可能性があります。 とはいえ技術的には簡単なことなのでどこかにあると思います。 英語のいくつかの言葉を入れて検索すれば 何日か辛抱強くやればでてくるでしょうが 日本の著作権法を調べてからのほうがいいと思います。 私は責任は持ちませんよ。私は技術者なので技術には関心はあります。それだけです。

vfx-2000
質問者

補足

ご回答ありがとうございます。 文章を読んで心に響いた部分をメモるという行為の時間を短縮するツールを望んでいるのであって(私的複製)、それを公衆送信したり複製したり販売したりは運用の問題です。 一部のメディアで私的にコピーすることそのものが禁止されるケースが増えてきてはいますが この件に関しては現状問題ないと思われます。 著作権法に抵触するならOCR技術そのものが法に触れることになりますし、そもそも本を電子化する自炊行為そのものも法に触れることになります。 自炊に関しては現状、(業者などが)代行することが法に触れるかどうかが論点になっているようです。 >日本の著作権法を調べてからのほうがいいと思います。 >私は責任は持ちませんよ。 私は技術者ではないので作れませんし、誰かに依頼するつもりはありません。 そういうアプリが無いかが知りたいのです。 失礼に思われたら申し訳ありませんが LHS07さんも著作権法を調べてから回答された方が良いのではと思いました。

  • lv4u
  • ベストアンサー率27% (1862/6715)
回答No.3

>>便利だと思うのですが。。 たぶん、便利さ、必要とするユーザの数と、そういうソフトを作成するかたの技術的な難易度、手間などを比較・検討して作成されないのではないでしょうか? また、PDF関連のソフトは、PDFの基本的な機能を満たすだけでも、プログラマーにとっては、技術的に大変そうです。フリー、あるいは安いPDFソフトに対しての不具合機能に対する質問をここでもたまに見ることあるくらいですからね。 質問にも書かれていますが、「高額なソフトでもOCR機能が完璧でない」と認識されているわけですよね?ですので、プログラマにとっては、「便利かもしれないけど、実現するのは難しい機能である。」ってことで、なかなか実現されないのだと推察します。

vfx-2000
質問者

補足

OCR自体はオープンソースのものも色々と存在しているようですので これらを単に機能として追加するだけであればかなり容易だと思います。 http://www.moongift.jp/tag/ocr PDFアプリとしても、結合したり編集したりするものならともかく 単に閲覧するビューワとしてはそれほど難度は高くないのではないかと思います。 編集ソフトもVectorには沢山の数あります。 なので、組み合わせることを思いついていないか 思いついても便利とは感じていないか‥ 例えば、ブラウザでウェブサーフィンしているとFLASHで作られたページだったり 画像だったりして、文字をコピーしたいのに拾えなくてがっかりすることが頻繁にあります。 今はまだブラウザにOCR機能をと考えたりアドオンを作成したりする人はいないかも知れませんが あると非常に便利になることが容易に想像できるので、そのうち追加されないかな~と思ったりします。 もしもすでにあるならぜひ知りたい、という感じですね。 iPadアプリも同様です。 例えば下記のアプリはフォトギャラリーで画像を選ぶか直接カメラで撮影してそのままテキスト化できるようです。 「Image To Text - OCR」 http://app-liv.jp/431757093/ PDF閲覧アプリで表示したページをスクリンショット保存してから「Image To Text - OCR」を起動してテキスト化することならできそうですね。 ただこれだと手間ですし、海外版ということで日本語の認識には対応していないでしょうね。 ※先の回答への補足で「海外のアプリなら‥」と書きましたが海外アプリではダメですね‥

  • lv4u
  • ベストアンサー率27% (1862/6715)
回答No.2

No.1さんの回答にあるように、現状のソフトにそういうOCR機能があったとしても、読み取れないか、読み取っても文字認識はミスだらけになってテキストは、あまり使い物にならない可能性が大だと思います。 もちろん、将来、認識能力の高いソフトが登場するかもしれませんが。

vfx-2000
質問者

補足

ご回答ありがとうございます。 現行のOCR機能のある高額なソフトでも文字認識は今一つな感じのようなので、そもそも正確性には期待していません。 ですが、iPadのキーボードでPDFビューワとメモ帳アプリと切り替えながら1文字ずつメモ帳に写し取るのと、ミスが目立っても指定範囲をテキスト化してコピペできるのとでは快適さが各段に違うと思います。 なのでそういった機能のあるアプリを探しています。 No.1さんの回答にも補足しましたが、名刺アプリやwindowsの名刺ツールではカメラで撮ってOCR機能でテキスト化するのがポピュラーです。 http://mediadrive.jp/products/index_smartphone.html なので、そういう機能を持たせたPDFビューワを作る人がいてもおかしくないと思っています。 便利だと思うのですが。。

  • yasuto07
  • ベストアンサー率12% (1344/10625)
回答No.1

画像としてjpgのままpdfにしたら、テキストかは無理じゃないでしょうか? 私は富士通の両面スキャナーを所持していますが、、読み取り、pdfにする時に、テキスト検索する、、、というスイッチがあります。 オンにしたことはないですけど、、、そのことでしょうか?。 単に書き込み編集したいだけなら、幾つかソフトはありますよ。

vfx-2000
質問者

補足

ご回答ありがとうございます。 >オンにしたことはないですけど、、、そのことでしょうか?。 そうです。 電子書籍化したいためにスキャンする場合はOCR機能でテキスト化してPDFにするのがポピュラーですね。。 >画像としてjpgのままpdfにしたら、テキストかは無理じゃないでしょうか? いえ、OCRは画像情報から文字を認識してテキスト化する技術なので可能です。 http://pc.mogeringo.com/archives/25740 例えば直接画像からテキスト化するようなフリーソフトも存在します。 iアプリで言うと、名刺をiPhoneのカメラで撮影してそのままOCRでテキスト化するようなものがポピュラーなので、そういった機能をPDFビューワに付けたアプリが海外アプリも含めれば1つ2つはあるんじゃないかな?と思ってはいるのですが・・

関連するQ&A

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • アドビアクロバットのOCR機能について

    アドビアクロバット(目下,無償版)でPDFファイルを読みこんでテキストを取り出すことをやっているのですが、その機能等についてお尋ねします。いわゆるOCRのツール(?)なのですが。 文書ファイルがワードとかTeX経由で作成されていてそれをPDFに変換されている場合、テキスト部をマウスでドラッグすると反転してコピーと貼り付けでテキストの取り出しができます。これはOCRの機能なのでしょうか。 一方でコピー機でドキュメントを読み込んでPDFにした場合、上記のような機能にならないようです。ドキュメントがやや斜めになっているとかだからそれができないのでしょうか。それとも自分のアクロバットにOCR機能がないからでしょうか(つまり前段のテキスト取り出しはOCRではないということ?) アドビのアクロバットはフリーのものでもOCR機能はあり、ということでしょうか。それとも有償版でないとダメということでしょうか。 よろしくお願いします。

  • OCR機能

    Office 2007に読取革命の機能が欲しい。スキャニングした文章をテキスト文として、office上で編集したい。

  • アドビ Acrobat OCR機能について

    Professional 7.0を使っています。 OCRテキスト認識の機能を使って、文字を含んだPDFファイルをテキストとして認識したいのですが、認識されませんでした。 全く別のPDFファイルではテキストとして認識できました。 もともとPDFファイルは1つの画像として取り込まれるので、テキスト認識の機能をかければ、認識すると思ったのですが・・・。 スキャナの解像度も問題ないと思います。 なぜでしょうか。教えてください。お願いします。

  • OCRが不完全な英文PDFを再度OCR認識させたい

    おそらく2000年ごろに作成されたであろう英文のPDFファイルがいくつもあります。元々のテキストデータがあったのではなく、タイプされた文書をOCRスキャンしてPDFにしたのだと思います。印刷して読む分には何の問題もないのですが、テキストファイルをハイライトして抜き出したいときに、文字と文字のスペースや単語間のスペースが広かったりしたため、テキストが例えばWindows is an OSなどとあったときW i n d o w s i s a n O S.と認識されます。 再度OCRスキャンして英単語を英単語として認識させたいのですが、一番簡単にできる方法を教えてください。Microsoft LensというアプリをiPhoneで使ってみましたが、それほど満足できませんでした。最新のiPhoneだとかなり精度が上がっているだろうから試す価値があると思いやってみましたが… 1.Windows上のAdobe Acrobat proで試したが、もともとOCR処理がされているため、再度OCRをかけてくれなかった?2年前のことですが断念しました。 2.PDFをデータファイルとして(再度写真を撮るのではなく)再びOCR処理をしてくれるソフトはあるか? 3.2をMicrosoft Lensでできないか?Windowsでも使えるようですがPDFを読み込むような感じではありませんでした。SnippingToolで画面上の範囲を選択することができればいいですね。 4.iPhoneからMicrosoft Lens を使ってWord化してみたが、実はWordアプリがiPhoneにインストールされていなければWord化されない?Wordにしてあれば自動的にOneDriveにアップロードされるとありましたが、されていません。 使用するソフトはなんでも構いませんが無料もしくは安価でお願いします。PDFはすべて英文です。よろしくお願いいたします。

  • googleドライブのPDF→テキスト化OCR機能

    googleドライブにアップロードした、PDFファイルを テキストに変換するOCR機能というのを利用しています。 漢字がよく中国て使われる繁体字に変換になってしまうことがあるのですが、 日本国内でよく使われる漢字のみに絞って変換するような設定はないでしょうか? 詳しい方いらっしゃいましたら、教えてください。 よろしくお願いします。

  • 文字化けしないOCRアプリ

    スマートフォン(iPhon4S)利用ですが、 カメラで撮った文章をOCRでPDF化できるアプリを探してます。 もちろん完璧に近いものは求めていません。認識率が高く、文字化けが少ないアプリがありましたら、ご紹介ください。 無料有料問いません。

  • PDFファイルからの文章のコピーの仕方がわかりません

    PDFファイルの文章をコピーして、他に貼り付けたいと思っています。が、 「手のひらツール」から「選択ツール」へ変えてクリップボードにコピーをするところまでできたのですが、さて「クリップボードにコピー」というのが理解できません。このコピーした文章はどこにあるのでしょうか?貼り付けたくても、どこに存在しているのかわかりません。 お教えいただけますでしょうか よろしくお願い致します。

  • PDFからWordに貼り付けができない

    PDFのテキストをクリップボードにコピーして Wordに貼り付けたのですが、 ソースネクストの"いきなりPDF_Professional2" 一括出力のアイコンが出てきて(張り付いて) コピーしたはずのテキストが張り付けできません。 同じような現象にあった方、 修復方法ご存知でしたら教えていただけないでしょうか? よろしくお願いします。

  • 【MFC-J6983CDW】PDFをOCRしたい

    ■製品名を記入してください。 【MFC-J6983CDW】 ■どのようなことでお困りでしょうか?  相談したいこと、トラブルに至った経緯、試したこと、エラーなどを教えてください。 【OCRされていないPDFファイルに対してMFC-J6983CDWの  OCR機能を利用してOCRできないでしょうか。  つまり、下記はできないでしょうか。   PDF(OCRなし) → iPrint&Scan → PDF(OCRあり)  紙を資料をスキャンする際にiPrint&Scanを使用して  OCR化しており、本ソフトのOCRの正確性が非常に  高く満足しています。  ただ、OCR化されていないPDFファイルがあり、  このPDFファイルをどうにかOCR化できないか検討  しています。いろいろフリーソフトなどでOCR化を  試してみたのですが、正確性がいまいちでした。  iPrint&Scan(またはControlCenter4)のOCR機能を  利用して、正確にOCR化されたPDFファイルを  生成できないでしょうか。 】 ■お使いの環境について教えてください。 ・パソコンもしくはスマートフォンのOSは何ですか? (例)Windows10/8.1/7・MacOS・iOS・Android 【Windows10】 ・どのように接続されていますか? (例)有線LAN・無線LAN・USBケーブル・bluetooth 【有線LAN】 ・関連するソフト・アプリがあれば教えてください。 【iPrint&Scan、ControlCenter4】 ・電話回線の種類は何ですか? (例)アナログ回線・ISND回線・ひかり回線・IP電話 【ひかり回線】 ※OKWAVEより補足:「ブラザー製品」についての質問です。

専門家に質問してみよう