• 締切済み

PDFから抽出したテキストが記号化(文字化け?)

PDFからテキストを抽出したいのですが、コピペしてワードに貼付けると文字化けしてしまいます。 原因また、解決法方をご存知の方、解答をお願いします。(pcはmacを使用しています)  www.econ.kyoto-u.ac.jp/~ida/2Kyouiku/1Gakubu/2009/BE1.pdf こちらが問題のPDFファイルへのURLです。 【依田高典 著  『行動経済学』中公新書】の第1章 大学の研究レポートでこちらの内容を引用として使用することが目的です。 

  • SOUc
  • お礼率100% (1/1)

みんなの回答

  • HAL007
  • ベストアンサー率29% (1751/5869)
回答No.1

>>大学の研究レポートでこちらの内容を引用として使用することが目的です。 盗用されないようにしてるんでしょ!コピーガードしていとしか思えない。 文頭からのバイナリーコードは  2E 2E 31 2E 2E 20 2E 2E 2E 2E 2E 2E 2E 2E 殆どが「2E」ばっかりでフォントセットの違いとは思えません。 コピー出来ないにPDFにすれば良いものを・・・! >>コピペして そんなことばっかりしている奴がいてねぇ、社会人になってもコピペばかりしているものだか 報告書もまともに書けない、文書を纏められないで仕事にならないので、会社を首になってた。 引用するならきちんと何処のものを持って来たを表示して手打しなさい。 そんなことも惜しむから頭の中に何も残らず社会に出て苦労するだけよ!

SOUc
質問者

お礼

ですよねw 頑張って自力でやります! 解答ありがとうございました。

関連するQ&A

  • 【PDF】これはOCRなのでしょうか?

    エプソンのPX-404A使用です。 雑誌を取り込み、その際PDF化して保存したファイルをAdobe Reader Xで開いたテキスト部分をWordにコピペしたところ、文字化けしているところが多く見られます。 (1)PDF化したファイルからテキスト部分をコピペできるということは、保存の際、OCR化されているのでしょうか?(PX-404Aの取説などではとくにそう説明されていませんが…) (2)そのように文字化けしてしまうので、困っています。どのような対処方法があるでしょうか?

  • 「せめぎあい」は不快な表現?

    「せめぎあい」は不快な表現? 野口悠紀雄著 「超」文章法 中公新書2002年発刊 によると 「せめぎあい」という言葉は、「手垢のついた」や「ふれあい」と並んで、 不快感を与える表現なので使用は避けたい、とありますが これは何故でしょうか?

  • Dirac方程式から水素原子のエネルギー準位

    derac方程式から水素エネルギー準位をもとめることをしたいです。 klein-gorden方程式の意味は理解できました。 しかしdirac方程式になるとさっぱりです。いろいろ本やネットで調べましたが、 大体計算過程が省略されており、難しいです。 多分やり方と記述方法が何通りかあるようで、いくつか印刷して比較しても共通点がなく、困っています。 かなり計算の過程が詳しく書いてあるものを知っていたら教えていただきたいです。 または、ネット上にあるものを詳しく説明していただきたいです。いくつかあげました。 http://www-he.scphys.kyoto-u.ac.jp/gakubu/P1/P1-10/P1report.2010.pdf(2章から) http://starfall.ddo.jp/~superstring/physics/Dirac.pdf http://members3.jcom.home.ne.jp/nososnd/qu/dirac.pdf http://www.th.phys.titech.ac.jp/~muto/lectures/QMII10/QMII10_chap16.pdf http://www.th.phys.titech.ac.jp/~muto/lectures/QMII11/QMII11_chap17.pdf よろしくおねがいします。

  • ★台湾と中華人民共和国★

    私は、某大学で 中国・アジア経済学部を学ぶ者です。 ★台湾と中華人民共和国★ 18日↑というテーマで私が発表するのですが、 まだ自分自身よく理解していません。。。 ホント困っています(>_<,) ※ゼミで使っている本は、 中公新書 1487 小島朋之著 【中国現代史】        ~建国50年、検証と展望~  です。 ※その中で私の担当は、   第8章・台湾と中華人民共和国 1.武力解放から平和的統一へ 2.「台湾経験」の成功 3.両岸交渉  です。 ゼミ生全員にデジュメを配り、 私が発表をするという形をとります。 どういう風にまとめていけばよいでしょう?? 過去に書かれた卒論やレポート等、 何かそのまま使えたり、参考になるものがあったら 詳しく教えてください。 至急 m(__)m よろしくお願いします!

  • 卒論について

    私は今、マスメディアにおける英語について卒業論文を書いています。 そこで日本に外来語が入ってきた歴史を設定した後、マスメディアで英語外来語使用が増加した経緯を考察しているのですが、歴史を説明する章がどうしても引用(コピペ?)だらけになってしまいます。引用だらけではいけませんよね?なんなら歴史説明がいらないのでしょうか?

  • 大学の卒業論文について

    クズな質問なので真面目な方は無視してください。 卒論にまったく意欲が湧きません。 そもそも書きたくありません。 でも書かないと卒業できないので、とりあえずテーマを決めました。 私の考えたテーマは、所属ゼミの教授の専攻と全く関係ありません。 それに使えるネタをネットで見つけて、それをコピペして、適当に書き直し、自分の言葉も付け加えて、第一章まで書き終えました。 しかし、「引用・参考文献一覧」に、使用した資料のページ数まで示す必要があることに気付きました。 「引用・参考文献一覧」には、コピペに利用したサイトは全て載せる予定です。 当初は、ネットからのコピペを繰り返し、それを打ち直していけば簡単に完成するだろうと考えていました。 でも、私はコピペしかしていないので、「引用・参考文献一覧」に載せる書籍がありません。 ネットで適当に探した書籍の情報と、適当な書籍のページを載せるのはバレる危険性があるのでしょうか? そもそも卒論で、コピペがバレる理由がよくわかりません。 ウィキペディアの情報をそのままコピペしただけのものならわかります。 でも、私はコピペですが一通り文章を全て打ち直しています。 後は、これに適当に探したダミーの資料一覧と、適当な使用ページを書けばバレない気がします。 もし真面目に資料を見つけ、それを参考に書いたとしても、それ自体コピペと大差ない気がします。 資料を参考にして書くなら、それもまったくコピペと同じじゃないですか? 終始クズな質問ですみません。 とりあえず私が聞きたいことは、触ってもいない書籍の情報と、思いつきのページを、「引用・参考文献一覧」に載せて大丈夫かと言うことです。 よろしくお願いします。 本当にクズですみません。

  • 文字化け、記号の含まれるフィールド抽出

    アクセス初心者です。 現在6万件ほどの住所と名前のデーターべースから、文字化けしていたり記号が入っているデータを探し出すクエリを作成していますが、なかなかうまくいきません。 1. 文字化けを探し出すことは可能でしょうか? 2. 記号が入っているフィールドを探しだすいい方法は無いでしょうか? 3. 名前のフィールドに文字列に数値が入っているものも抽出したいのです。 皆さんでしたら、どのように記述しますか? ど素人な質問ですみません。 どなたかアドバイスをよろしくお願いします。

  • このロシェフコー公爵の発言の意味が分かりません。

    以下のロシェフコー公爵の発言の意味が分かりません。 「もしわれわれが高慢なるものをもち合わせなかったら、他人の高慢さをこぼしなどしないはずである。」 この文章は中島義道著「ウィーン愛憎」(中公新書)のp.55で、ロシェフコー公爵が言ったものとして引用されています。 この文書は、西洋人が日本人の自分たちに対する対等意識へ不満を抱き、それゆえに傲慢な態度で日本人に接する…という下りで引用されています。 知りたいのは次の2点です。 (1)「われわれ(西洋人)は高慢なものを持ち合わせているので、それゆえ他人(被差別民族)の高慢さをこぼす」という風に解釈していいのでしょうか?それとも逆なのでしょうか? 複文の接続のせいか意味を考えると、頭がこんがらがってしまいます。 (2)相手の高慢さをこぼすとはどのようなことなのでしょうか?相手の高慢さに寛容であるという解釈でいいのでしょうか? 中学校時代に国語の勉強を怠っていたため、このような複文の読解が苦手です。 後学のため、この様な文章はどのような文法(副詞?助動詞?)を用いて解釈するのが適切なのかアドバイスを頂けると非常にうれしいです!! 一箇所の回答でも結構なので、何卒よろしくお願いします。

  • PDFの透明化テキストを抽出したい。

    Androidスマートフォンで小説等を読むために、業者に依頼してPDF+透明化テキストしましたが、端末画面が小さくて読めません。 もちろん拡大すれば読めるのですが、スクロールするのは使い勝手が悪く、テキストビューワーなら表示フォントを大きくしてみることが出来ますが、PDF+透明化テキストされたファイルからテキストのみを抽出する方法を教えていただけないでしょうか。 フリーのソフトを希望します。 よろしくお願い致します。

  • PDFそのものから、テキストの抽出

    PDFそのものから、テキストの抽出は可能ですか? Acrobat 6では、テキスト保存機能がついているのでPDFをテキストファイルに保存できますよね。 ということは、PDFでもテキストファイルで保存したものは、PDFそのものからテキスト抽出できるということですか? 逆に、Acrobat 6以前ので作られた、バイナリデータとしてのPDFからは、そのままでは抽出できないということですか?

専門家に質問してみよう