• ベストアンサー

テキストを比較するソフトを教えて下さい!

代理質問で申し訳ありませんが、質問させて頂きます。 現在、私は大学4年で教授の補佐のアルバイトをしております。 現在教授に頼まれていることが、提出された論文が「インターネットからパクッてきたものでないか」という検証です。 正直、慕っている教授とは言えこの作業は気が狂ってきます。 そこで質問させて頂きたいのが、AとBのテキストを比較してどれだけ 類似しているか表示させるようなソフトはないでしょうか? AとBのテキストを比較してパーセンテージで分かればベストです。 こんな都合のいいソフトがあればいいのですが・・・。 どなたかご存知の方がいらっしゃいましたらご教授ください。

質問者が選んだベストアンサー

  • ベストアンサー
noname#80264
noname#80264
回答No.2

ご利用の基本ソフト名とその版を補足することをおすすめします。 フリーソフトでご希望の実用的役目を果たしてくれるものは少ない気がします。 あえて言うなら 『Google デスクトップ』 のような。 98、Me、2k、XP で利用可能な 「テキストを比較」 ものとしては 『Rekisa』 http://www.forest.impress.co.jp/lib/sys/file/filecompare/rekisa.html が知られています。 『ちゃうちゃう!』 http://www.forest.impress.co.jp/lib/sys/file/filecompare/chawchaw.html もあります。 そのほかは文字単位ではなくて行単位が多いです。 「パーセンテージ」 というからには、文字の一致度と、文字の並びの類似度を検出する必要があるので、そういう需要の低いソフトは自作するのがいちばんかもしれません。 PC は、相違を検索するのは得意ですが、ファジーな一致度を検索するのは苦手です。 Prorog 言語なども、末は大臣かと持ちあげられたりもしましたが。 高速に大量の文書を処理する必要があるので、結局は、レポートのうさんくさい一部を抽出して Google Web 検索したほうが早い気がします。 ご質問の 「インターネットから」 が 『Journal@rchive』 http://www.journalarchive.jst.go.jp/japanese/top_ja.php のような論文用のデータ ベースを指しているのであれば Google というわけにもいきませんが。

hamu1985
質問者

お礼

ご回答ありがとうございます。Rekisaを使ってみましたがとても使いやすいですね。 パーセンテージの表示はさすが無いですか・・・・。 自分でソフトウェアを作るのも全然プログラミングの知識がないので難しいですね・・・。 諦めるしかなさそうですね((+_+))

その他の回答 (2)

  • don_go
  • ベストアンサー率31% (336/1059)
回答No.3

学生の「コピペ論文」検出サービス日本へ http://www.nikkansports.com/general/news/f-gn-tp1-20080701-378588.html > 米アイパラダイムス社の「turnitin(ターンイットイン)」 >というシステムで、現在は英、スペイン、ドイツ、フランスの4カ国語 >に対応。インターネットから収集した約90億ページの文字情報、約1 >万点の学術雑誌からなるデータベースと学生のリポートなどを照合し、 >内容の類似性を瞬時に判定する。 「コピペ」を発見するソフト 金沢工大教授が開発 http://www.j-cast.com/2008/05/26020566.html >2008年2月に特許申請を終え、来年早々にも産学連携の形で発売する >という。

  • violet430
  • ベストアンサー率36% (27472/75001)
回答No.1
hamu1985
質問者

お礼

ご回答ありがとうございます。早速使ってみたいと思います。

関連するQ&A

  • テキストの比較

    2つのテキストファイルを比較するソフトを探しています。 具体的に言うと、 例えば映画のタイトルが書かれた2つのテキストファイルA,Bがあったとします。 Aの中にBのタイトルが含まれているかという比較がしたいのですが、 今まではBのテキストファイルを開いて1つのタイトルごとにコピーして Aのテキストファイルを開き、検索窓にペーストしてという形で含まれているかを確認していたのですが、 A,Bともにタイトル数が多くなってきたので一括で比較を行ってくれるソフトを探しています。書式はA,Bともに同じです。 ご存知の方はお教え願えないでしょうか。

  • 2つのテキスト文章を比較したいのですが良いソフトはありますでしょうか?

    こんばんは。 いつもありがとうございます。 2つのテキスト文章を比較したいのですが 文章Aの文字が文章Bにあるかを比較したいのです。 私のパソコンにはワードは入ってないのですが良いソフトがあればお教え ください。 どうぞよろしくお願いします。

  • テキスト比較について

    テキストファイルを比較して抽出したいのですが、 どのようなソフトがいいのかわかりません。 私がしたいことは a.txt (検索) aac = bcf = cag = dai = b.txt (ベース) aaa = 123456789 aac = 234567891 bbf = 345678912 bcf = 456789123 cae = 567891234 cag = 678912345 dae = 789123456 dai = 891234567 efg = 912345678 このような二つのテキストがあったら b.txtからa.txtの文字列を検索してc.txtに抽出するようにしたいのです。 なので、文字列を抽出したc.txtは以下のようになっているはずです。 c.txt aac = 234567891 bcf = 456789123 cag = 678912345 dai = 891234567 こんな感じです。 必要な文字列を一括で抽出するソフトはありますでしょうか? ちなみに検索文字列は300弱あります。 当方 windows 7 64bitでwordとexcelは入っております。 もし、良いソフトがありましたら教えてください。 また、excelやwordのマクロでできるなら、優しく教えてください。 当方excelは初心者なもので… よろしくお願いします。

  • テキスト比較コマンドのdiffについて

    unixコマンドにdiffというのがありますね。2つのテキストファイルを比較してその違いを出力するというものです。このコマンドの意味がわからないところがあります。 テキストAとBの比較とは、 1 両者が全く同じかどうかを比較するということなのか、 2 テキストAとBに含まれている各行を取り出してどこかに一致する行があるかどうかをチェックするということなのか 3 あるいはそれ以外の意味 どのようなことを意味するのでしょうか。 1だったら、1行付け加わっただけでそれ以降が同じものであったとしても全部検索対象となり出力されます。 2だったら、何をしたことになるのでしょうか。全く同じ内容で行構成を入れ替えたら検索に引っかからないことになります。 私の希望としては1なのですが、そうするとわけがわかなないぐらい多くの出力結果となることが多いはずです。オプションなどで対応するとは思いますが、基本的には何をするコマンドなのでしょうか。 よろしくお願いします。

  • 二つのファイルのある範囲の比較できるソフト

    エクセルでAファイルaシートのある範囲、 Bファイルbシートのある範囲 の比較をして違いを見つけたいのですが、 よいソフト・アドインはないでしょうか? 検索してみたのですが、どうもぴったりくるものがありませんでした ので質問に参りました。

  • 2つのテキスト中身の違いを抽出

    2つのテキストの中身で一致しないテキストだけ抽出できるようなソフトってないでしょうか? 探してみましたが、同じ行(場所)にないといけないソフト(比較ソフト)ばかりでこちらの希望条件に合うようなソフトが見つからないので・・・。 例えば、下記の2つのテキストファイル(ファイルA とファイルB)でいうと テキストSとテキストZを抽出するような感じです。 よろしくお願いします。 ファイルA | ファイルB ----------- テキストA | テキストA(一致) テキストB | テキストB(一致) テキストD | テキストV(一致) テキストS | テキストZ テキストV | テキストD(一致)

  • 連続で画像の比較をするソフトを教えてください。

    Aのフォルダに30枚の画像があり、Bのフォルダに30枚の画像があります。 この画像を「A-1、B-1」「A-2、B-2」といったように比較したいのですが、「横に並べる」、「重ねる」、「違いのある場所に印をつける」などの機能を持ったソフトがあれば教えて下さい。

  • テキストを自動色替えしてくれるソフト

    テキストを読み込んで、自動的に色を付けてくれるソフトを探しています。 具体的には 【A】「○○○○○○○」 【B】「○○○○○○○」 【C】「○○○○○○○」 というようなテキストがあれば、 【A】のある一行は、赤 【B】のある一行は、黄 【C】のある一行は、青 というように、頭文字、或いは、行中の文字列を判別して、色分けしたいと考えています。 そのようなソフトがありましたら、教えていただけますでしょうか。 よろしくお願いします。

  • テキストファイルを連結するソフト

    複数のテキストファイルを連結するソフトを教えてください。 ただし連結部に「適度な改行」と「後ろのファイルのファイル名」を自動で入れる設定が出来るものをお願いします。 テキストA、B、C、を連結したら Aのファイル名 Aの内容 ・ ・ ・ Bのファイル名 Bの内容 ・ ・ ・ Cのファイル名 Cの内容 ・ ・ ・ という新たなテキストファイルを作成するという感じで。

  • テキストについて

    通信制の大学生です。 教科によって様々ですが 今勉強している教科は、教科書に近いタイプのテキストです(市販品)。 パソコンの内部構造を、全くの初心者に向けて 分かりやすく説明したものです。 そこの中でA+B=Cという記述がありました(もちろんA+B=Cはたとえですが)。 その前後で不明な箇所があったので、上記文面も込みで質問したところ A+B=Cは間違っているという指摘を受けました。 正確にはA+B=CまたはD…だそうで Cも合っているが、100%Cではなく(マジョリティーではあるが) DやEの可能性もあるとの事です。 そうだとしても、このテキストを基にレポートを書かなくてはいけないので、 教授がこのテキストを選んだ以上 A+B=CまたはD…が正解だとしても、レポートにその部分を書くのであればA+B=Cと書くのが正しいのですが これは、初心者向けのテキストだから 断定的に1個だけの回答(C)を書いているだけと考えるのが妥当でしょうか? 後、レポートはテキストに対して自分の反論等を書くものだから そういうものだ的な回答を頂いた事があるのですが この教科はそういう教科では無いので…。 確かに自分の意見、テキストに対しての反論を書くべき教科もありますが 全ての教科がそうではないので。

専門家に質問してみよう