• ベストアンサー

OCR

読んでココなどのソフトで、デジカメや、スキャナーで読み取った文書は、文書でも画像として扱われますがOCRソフトを使用するとWord文書DEテキスト、HTML,PDF形式で書き込んだり書き換えたりできますか。文字の認識ができ編集や変更や書き直しができるわけでしょうか?

  • aimei
  • お礼率82% (143/174)

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

今現在読んdeココをつかっていますので、お答えします。 (1)OCR設定で読み込んだ物は、白黒画像ですのでカラー画像が希望なら、別途スキャンしなくてはいけません。白黒画像でいいのなら(文書など)そのまま保存すれば後で画像処理ソフトで自由に使えます。 (2)OCRの精度ですが、バージョンによってかなり違います。Ver8までは、精度がかなり低かったですがVer9から認識率がかなりあがりました。現在Ver12を使っていますが普通の文書(レイアウトがあまり凝っていない物)は、ほぼ100%認識します。ルビ、下線、太字などに若干ミスがあります。また、本からとる場合でも、紙質、インクなどでの反射率のちがいで、スキャン段階で画像の質が落ちる場合があります。(この場合は、いったんコピーした物をスキャンするようにすれば一定の画像の質になります。) (3)当然OCRしたものは、テキストなのでワード・一太郎などに貼り付けて自由に編集できます。後は、図の部分も読んdeココで切り取って貼り付ければできあがります。スキャンにOCRソフトがバンドルされていますが、動かし方を見るにはいいですが認識率は製品版にかないません。各ホームページで体験版を入れてみて確かめる方がいいです。

aimei
質問者

お礼

ありがとうございました。 スキャナーのバンドル版や店においてあった体験版CDはだめですね。でもVer11とありました。

aimei
質問者

補足

バンドル版はPersonal Ver3でした。

その他の回答 (3)

  • habburu
  • ベストアンサー率42% (373/880)
回答No.3

読んde!!ココなどOCRソフトを起動し、スキャナーを呼び出しで 文書を読み込みます。 この段階では、画像として保存が可能で、bmp,tif,pdfなどです。 普通はこの後、文字認識をさせ、出来た物をWordやExcelなどへ 転送することが出来るので、WordやExcelのファイルとして 文字を編集したり、保存することが出来ます。 他にもメモ帳へ貼ったり、エディタへ貼ったりも出来ます。 Acrobatへ転送というボタンもありますので、 ここでもpdfとして保存可能です。 実際は認識率を上げるため工夫したり 誤認識の文字を打ち直したり、でけっこう手間がかかりますので そう便利でらくらくといった感じの物ではありません。

aimei
質問者

お礼

ありがとうございました。 もしも、タイピングが上手な人なら自分で書いた方が楽ですか?

回答No.2

OCRソフトは、紙や画像上にある文字や記号を、文字や記号の特徴から識別して、取り出し(コピー)可能とするものです。 >OCRソフトを使用するとWord文書DEテキスト、HTML,PDF形式で書き込んだり書き換えたりできますか。 >文字の認識ができ編集や変更や書き直しができるわけでしょうか? 何を聞きたいのかが、よく分かりません。 もう少し具体的に説明できませんか?

aimei
質問者

補足

すみません。自分でも良くわからないので。

  • char2nd
  • ベストアンサー率34% (2685/7757)
回答No.1

 読んdeココはOCRソフトですから、画像データとして読み込まれた文字情報を文字データに変換することが可能です。  ただし、変換後のデータ形式はあくまでもテキスト形式ですから、それを改めてWORDなどのソフトで読み込んで編集してやる必要があります。  又、変換率も決して高くはないです。文字が小さかったり、アルファベットなどの場合はうまく変換できない場合が多いです(特殊なフォントを使っている場合も同様)。

aimei
質問者

お礼

ありがとうございました。 やはり容易ではないですか。

aimei
質問者

補足

スキャナーで読み込まれたのは、文書でもデジカメなどの写真と同様な画像データーとして扱われますからね。精度の高い者は期待できませんね。

関連するQ&A

  • OCRソフト「読んdeココ」「やさしくPDF OCR」の認識率

    OCRソフト「読んdeココ Ver10」または「やさしくPDF OCR」を持っている方、ぜひ教えてください。 テキストを取り出せないPDFを、スキャナを使わずにテキスト化したいのです。 「読んdeココ Ver10」のクリップOCR機能や、「やさしくPDF OCR」の認識率は、どんなもんでしょうか。 画像から直接読むと精度が落ちたりするのか、それともスキャナでも画像化するのだから同じことなのか? 経験のある方、認識率についての感想をお聞かせください!

  • OCRソフトウエアについて

    スキャナで読み込んだ文章などを、OCRソフトで、文字を認識しワードやエクセルに取り込むソフトですが、認識の精度が高くていいOCRソフトはどれでしょうか? スキャナはPFUのScanSnapを使っています。 このスキャナに付いていた体験版のソフトで、「読んde!!ココ」と「e.Typist」を使い比べてみましたが、後者の方が認識精度は高いように感じました。 この他に、「表OCR/文書OCR for Excel & Word」も有るようですが、いいものがありましたら教えていただきたくお願いします。

  • 認識率のいいOCRソフト

    今度、数ヶ月かけて数千ページに及ぶ文書(日本語文字のみ・明朝体10.5ポイント横書き活字)を、スキャナで文字認識させテキスト化します。 OCRは誤認識があることは十分承知していますが、文書の量が多いので、あとで修正することはできません。どんどん入力していくだけです。とにかく認識率がいいOCRソフトを紹介してください。 eTypistエントリーは持っています。 現在購入を考えているものは、eTypistの製品版か、読んdeココです。(どちらも解像度600dpi)

  • 英文のPDFファイルのOCRソフト

    紙の英文文書をスキャナーで取り込んだ、PDF形式の画像ファイルをOCRソフトで英文の文字認識をさせて、word形式の英文文字ファイルに変換したいのですが、英文の文字認識エンジンを搭載したOCRソフトを紹介してください。 もし、フリーソフトでなければ有料ソフトでもいいのですが、 eTypistとかいろんなメーカーから販売されていて、どの製品が英文の認識率が高いかよくわかりません。どの製品が良いか教えてください。

  • OCRソフトについて

    エプソンGT-7000スキャナーを使っています。 OCRソフト『読んde!!ココ』のV2.0.5が付属していました。 たまにカタログや雑誌から読込んでみましたが、あまり認識率は良いとは言えず誤字だらけの感じで、最近はOCR を使っていません。 ところが今日ショップで『読んde!!ココ』V6と言うのを見つけまして、説明を読んでみると結構よさそうに思えるのですが、相当進歩しているのでしょうか。 表など読込んでいちいち校正するのでは意味ないみたいですし・・・ 御意見お聞かせください。

  • GT-8700でOCRソフトの使い方

    GT-8700で、OCRソフト「読んde!!ココ Ver.13」 を使用して、Word画面でスキャン結果をテキストデ ータとして取り込み編集することができると聞きましたが、その手順は誰にもわかるように記載されていますか?(当方、「読んde!!ココ Ver.13」はまだ入手していません。無料体験版をダウンロードしましたが、GT-8700とどのような手順で操作しあえば「テキストデータとして取り込み編集することができるか」を教えてください。

  • OCRを購入したい

    近々、OCRソフトを購入しようと思っています。 『Word OCR ⅴ.1.0』と『読んde!!ココver.7』 どちらを買おうか迷っています。 より良いのはどちらでしょうか?

  • 完全認識率のスキャナソフト、OCRソフトは?

    ないのでしょうか?? 「e.Typist」と「読んで!ココ」を試用しましたが、テキストの100%の認識率ではありませんでした。 特に雑誌などの独特の字体など不完全です。現状はどのソフトもこうなのでしょうか? 誤認識されたものは、PDFファイルにも、そのまま反映されてしまうのでしょうか? また、完璧とまではいかなくても、完璧に近い、これは満足!というスキャナーやOCRのソフトがあればご紹介ください。

  • スキャナ→OCRソフト→テキスト

    スキャナで取り込んだ文書を読取革命で編集という形でのちにテキストの状態で編集したいのですが、 のちの編集を考えたときに、ワード、エクセル、テキストのうちどれで書き出せばいいのかわかりません。 例えば、文書に商品名、品番、価格といった項目がある場合に、のちの編集でも、その項目ごとに抽出したり、読取革命でずれた部分なども修正できればよいのですが。 ワード、エクセルは持っていますが使ったことはありません。 ほかに、そういうのが得意なOCRソフトなどあれば教えてください

  • 画像とテキストが混在したPDFファイルをOCR認識させる方法

     1ページの中にテキストと画像が混在するWord文書をAcrobat8proでPDFに変換した文書のテキスト認識についの質問です。  この文書の画像部分をテキスト認識させるために、同ソフトのツールから「OCRを使用してテキスト認識」を実行させると、「画像にテキストデータが含まれているため認識できません」というエラーメッセージがでてしまいます。  スキャナーで取り込んだ画像データであれば、問題なく認識できるのですが、今ある大量のPDFファイルはすべてテキストと画像が混在するWordファイルを同ソフトでPDF変換したものです。そしてこのPDFの画像部分の文字をテキスト認識させたいのですが、このままではうまくいかずに困っています。かといって、すべて画像化するなどという手間はかけたくありません。  できるだけ手をかけずにこのPDFの画像部分をテキスト認識させる方法があれば教えて下さい。  なお、当方のOSはWindowsXPです。  以上よろしくお願いします。

専門家に質問してみよう