日本語縦書文書のOCRで縦書時の欧文も認識可能なソフトウェアはあるか?

このQ&Aのポイント
  • 日本語縦書の文書で、外国の地名や人名などが欧文で添え書きされる場合、OCRで読み取ると正確には認識されないことがある。
  • 欧文文字列を範囲指定して、向きの異なる横書きと指定することで読み取らせることも可能だが、煩雑な作業が必要になる。
  • 縦書時の欧文を自動で認識してくれるOCRソフトウェアがあると便利だ。PDFを読み取れるソフトウェアであれば尚更有り難い。
回答を見る
  • ベストアンサー

日本語縦書文書のOCR

日本語縦書の文書で、例えば外国の地名や人名などが欧文で添え書きされる場合、寝かして(90度時計回りで回転されて)記されることがしばしばあります。このような文書をOCRでそのまま読み取ると、欧文の文字列は日本語縦書きと見なされて、正確には読み取ってくれません。欧文文字列を範囲指定して、向きの異なる横書きと指定することによって読み取らせることも可能ですが、欧文文字が多い場合は非常に煩雑ですし、読み取り後の編集作業が文字列毎に必要になってしまいます。 このような縦書時の欧文を自動で認識してくれるOCRソフトウェアはないでしょうか。 通常、PDF化した後でまとめてOCR処理していますので、PDFを読み取ることが可能なソフトウェアであれば尚更有り難いです。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • shintaro-2
  • ベストアンサー率36% (2266/6244)
回答No.2

読んde!!ココver.13で試してみました。 縦書きで、漢字(英単語90度回転:始まりは上側)漢字の文章で、日英混在という設定で読ませれば、何も問題なく処理してくれました。 pdfも、readerではなくacrobatがあれば、pdf文書からの文字認識もしてくれます。

manobuta
質問者

お礼

ありがとうございました。 早速体験版をダウンロードして試してみましたところ、うまく読み込むことができました。 しかも、スキャン済みPDFファイルの一括OCR処理が可能で(恐らくその処理にはAcrobatは必要ない)、数十頁をまとめて処理することの多い私の使用法にぴったりです。早速購入することとします。 これまでe.Typistを使って、縦書き時の欧文は必要に応じて手書きで入れてきましたが、その不便さも解消されそうです。 御礼まで。

その他の回答 (1)

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1

私はそうした文書サンプルを持っていないので試せないのですが、体験版があるので試してみてください。http://www.vector.co.jp/soft/winnt/writing/se347707.html

manobuta
質問者

お礼

ご回答ありがとうございました。 あいにくご紹介いただいたメディアドライブの「やさしくPDF OCR」は、縦書き時の欧文には対応していないようです。

関連するQ&A

  • PDF文書で日本語検索ができません

     PDFの文書(OCR付)で検索を使おうとして、「編集>検索」で検索boxを開いて、検索語を入力してもアルファベットでの入力しかできず、日本語変換ができません。 同じ状態で、日本語入力ができて検索が可能な文書も有ります。どこかに日本語入力のスイッチのようなものがあるのでしょうか。 よろしくお願いいたします。

  • Adobe PDF 日本語縦書文書のデータ化

    Adobe Reader で作成した日本語縦書き文書のPDFをデータ化することは可能でしょうか?もし、可能であれば、文字化けさせずにデータ化する方法を教えて下さい。

  • PDF(画像)→日本語OCR

    画像をPDFにしたものを日本語OCR認識するソフトはありますか。探せなかったので情報をお待ちします。

  • 認識率のいいOCRソフト

    今度、数ヶ月かけて数千ページに及ぶ文書(日本語文字のみ・明朝体10.5ポイント横書き活字)を、スキャナで文字認識させテキスト化します。 OCRは誤認識があることは十分承知していますが、文書の量が多いので、あとで修正することはできません。どんどん入力していくだけです。とにかく認識率がいいOCRソフトを紹介してください。 eTypistエントリーは持っています。 現在購入を考えているものは、eTypistの製品版か、読んdeココです。(どちらも解像度600dpi)

  • 日本語の認識率が高いOCR

    活字文字データですが画像として認識されているPDFファイルがあります。このPDFを元に文字データとしてWordやExcelで使いたいためOCRを探しています。 データは例えば住所氏名電話番号などのように日本語(漢字カタカナひらがな)と英数字です。 出来るだけ高い認識率がいいです。できればフリー、有償でも2,3万以内でないでしょうか。有償の場合試用期間があり試せるものが良いです。 パソコンはWindows7です。 よろしくお願いします。

  • OCR

    読んでココなどのソフトで、デジカメや、スキャナーで読み取った文書は、文書でも画像として扱われますがOCRソフトを使用するとWord文書DEテキスト、HTML,PDF形式で書き込んだり書き換えたりできますか。文字の認識ができ編集や変更や書き直しができるわけでしょうか?

  • OS 10.3.対応で欧文が読み取れるOCRソフトについて

     教えていただきたいことがあります。  先日修理に出していたPCが却って来たのですが、頼みもしないのに(そういうものらしいのですが)、Mac のOSが10.3.にversion-upされていました。  それはそれで有り難かったのですが、困ったことに以前から使っていたTexte BridgeというOCRソフトが使えなくなりました。主にフランス語の文献の読み取りに使用していたソフトです。日本でも、欧文対応のOCRソフトが市販されてはいるのですが、どれも高価で私にはとても手が出ません。  それで、フランスで販売されているものを購入しようと思うのですが、今のところOmnipage Xというものが目に留まっています。  もしどなたか、Mac OS 10以降に対応するOCRソフトで欧文文書も読み取れるものをご存知、あるいはお使いの方がいらっしゃいましたら、教えていただけないでしょうか。  よろしくお願いします。  

    • 締切済み
    • Mac
  • OCR機能:縦文字の単行本と横文字の雑誌の結果?

    ScanSnap ix1600を最近購入しました(米国在住です)。本や雑誌の横書きをスキャンした際、OCR機能を利用してスキャンすれば、文字が読解できるようになるのはわかってますが。日本語の縦文字の単行本をスキャンした場合も、OCR機能を利用してスキャンすれば、問題なく文字を読解できるのでしょうか? アメリカで購入して、現在ロサンゼルスで使用してますので、確認させてください。アメリカのサポートのスタッフには確認出来ない内容なので、お願いします。キムラ ※OKWAVEより補足:「「ScanSnap/fiシリーズ/HHKB」商品について」についての質問です。

  • PDF文書

    PDFをHTMLワード文書に変換して文字入力できるようにできますか? OCRはスキャナーの画像文書をPDFにするわけですか?

  • PDFから日本語が消える

    お世話になります 取扱説明書を(図、ワードアート、文字列)の文書をExcelで作りました。 PDFに変換すると日本語だけが消えてしまいます。 他は変換されますが、文字列(セル内、テキストボックス内)のうち日本語のみ空白になります。(英字は残る) Wordで試しましたが同じ症状です 関わりありそうなインストールされているソフトは以下です Vista Office2007 瞬間PDF Xelo クセロReader AdobeReader9

専門家に質問してみよう