テクスト・ファイルの種類と性質について

このQ&Aのポイント
  • テクスト・ファイルの種類と性質について調査しました。
  • テクスト文書の変換ソフトによって作成されたDOSテクスト文書は、通常のテクスト・ファイルとは異なる性質を持っている可能性があります。
  • Nortonをインストールすると、DOSテクスト文書のファイル操作に問題が発生し、バックアップやファイルの開閉に時間がかかることがあります。
回答を見る
  • ベストアンサー

テクスト・ファイルの種類と性質について

  奇妙な質問タイトルですが、次のような背景があります。 十年以上前のワープロの文書が、5インチ2DDフロッピで大量にあったものを、ある変換ソフトを使い、DOS-テクストに数年前、変換したのです。 rich text converter もあったのですが、5インチ2DDというのは特殊なフロッピで、かなり原始的な変換ソフトを使いました。 こうしてできたDOSテクスト文書を、これまでもコピーして使っていました。しかし、最近、ダブルクリックしても開きにくくなったり、上書きに時間がかかります。 また、バックアップを取ろうとすると、それらのファイルの部分で、確認のためか、時間がかかります。 これは、どうも、同じテクスト文書と言っていても、変換ソフトで作ったDOSテクスト文書は、何か違っているようなのです。 Nortonでウィルス・スキャンしてみると、これらのファイルに対し、必要以上の時間をかけていることがわかりました(数キロのファイルに、5秒以上かかります。100ファイルのスキャンに10分近くかかります)。 少し前まで、この変換文書と、普通のテクスト文書と同じ扱いだったのが、どうも、Nortonをインストールしてからおかしくなったようです。 つまり、ファイルを開くときにも、Nortonがチェックしていて、それで、問題が起こるように思えます。 同じテクストのはずなのですが、Nortonでは、扱いが違うようで(極度に慎重なようです)、すると、何か、違うタイプのテキスト・ファイルだということになります。 バックアップもファイルを開くのも、不便です。通常のテクスト・ファイルにする方法はないでしょうか。色々試しているのですが、エディターでは見えない違いがあるようです。 OSはWIN-ME、変換に使ったのは「どす恋」、WZエディターです。  

質問者が選んだベストアンサー

  • ベストアンサー
noname#8602
noname#8602
回答No.5

ノートンのウイルス解析の詳細が分からなければ、解決しそうにない問題ですね。 改行コードやEOFマークあたりに問題がないとすると、他の正常なテキストファイルとノートンが異常な動きをするテキストとの「違い」が見あたりません。 はずしていて当然のことですが、貴方が例にあげれられた「複数の小さな文書を大きな文書に変更」という項目では、元のファイル名に漢字を使っていて、それが悪さをしているというような可能性があることには気づきました。もしも、変更後の文書が1.txtというような半角英数字だけによるファイル名であれば、可能性だけは残ります。 漢字のファイル名を使っていて問題が出るのは、英語文化圏の素のままのアプリケーションにおいてのファイルの読み書きや、大昔のC言語のバグ(2バイト系のファイル名に非対応)によるエラーなどが思い浮かびますが、今さらその程度のことで日本語化された著名なウイルス監視アプリケーションが変な動きをするのも奇妙なことです。 まったくお役に立てず申し訳ありません。

maris_stella
質問者

お礼

  (補足で、以下のお礼を記したと思ったのですが、登録されていません。最後までステップを完了していなかったようです。お礼欄に追記します)。 回答してくださった皆様。長く締め切らずにいまして、申し訳ありません。問題が簡単に解けそうなような気がして、実際は、考えれば考えるほど、難しいのではないかという思いがあり、また、最初は、何かコンヴァーションで訂正できると思ったのですが、どうもそういう訳には行かないようだと感じました。 変換テクスト・ファイルは開かないのではなく、ウィールス・チェックを多分しているので、開くのに時間ががかるのです。何百も変換ファイルがありますので、たとえ解決方法が分かっても、手動書き換えだと、これを全部、どうにかするというのも無理があります。 少し不便ですが、ファイルが使えないというのでもないので、仕方ないとも考えておりました。 締め切ろうか、もう少しまとうかと思い悩んでいるうちに、Time flies で時間が経過しました。 回答、たいへん有り難うございます。_P2B-B さんには、この補足でお礼を述べたく思います。わたしは、ファイル名は、ときに、大文字を使うことはありますが、すべて、英数字です。漢字は使いません。 ともあれ、最後まで丁寧なお言葉、有り難うございます。なお、この回答へのお礼は、将来、何か、情報を書き込む必要ができた場合のため、開けておきたく思います。宜しくお願いいたします。 それでは、再度、たいへん、遅くなって申し訳ありません。有り難うございました。これで、質問を締め切らせて戴きます。 (2003/0226/2055) (2003/0226/2107)  

その他の回答 (4)

noname#8602
noname#8602
回答No.4

バイナリエディタで中身を確認して一般的なテキストと差異が認められないというのに、少し疑問が残ります。改行コードなども確認されていると思いますが、違いがあるとしたら、こんなことしか今は思い当たりません。 5inch2DDはAT互換機では読めないので、「どす恋」との組み合わせなら、取り込んだPCは98x1シリーズでしょうか。 「どす恋」は手持ちがありますので、実際に検証できるものなら試してみたいと思います。ビジネス文豪・OASYS・キャノワードなどなど、5inch2DDを使ったワープロも多々ありますので、元になるFDがないのが残念です。

参考URL:
http://tohoho.wakusei.ne.jp/wwwxx011.htm
maris_stella
質問者

お礼

  回答たいへんありがとうございます。お礼が、極端に遅くなって申し訳ありません。 改行コード等も調べてみまして、おかしい1ビット記号が付いていることも分かっていますが、これを削除しても問題が解決しません。 もっと奇妙なのは、どうしても、おかしくなるファイルは、ファイルの「本文」のなかに何か問題があるとしか考えられないのですが、ファイルを20とか30とか、一つの新しく作ったテクスト・ファイルに、順番にコピーして、総合ファイルのようなものを作ると、これは、「本文」は変化していないはずなのに、そのまま、ノートンのチェックは素通りしてしまうということです。 特定の間違った文字コードが入っているというより、確かに何か入っているのでしょうが、ノートンが、ウィールスではないかと疑う「機構・チェック用基準」が原因のような気がします。 それは、大サイズの画像ファイルなど、なかを全部チェックしていると、相当な時間が必要なはずが、簡単にスキャンが終わるということは、拡張子と、ファイルの特定の部分をチェックして、合っていれば、合格としているのではないかと思えるからです。 ノートンの側の機構で、ウィールスではないかという判定をして、そこで、定義ファイルに参照して確認しているので、時間がかかるのだというのが結論です。何が、ウィールスだと疑わせているのか、見当が付きません。 「本文文字列」に、疑わしいものがあれば、疑うというのでしたら、先に述べた、「合成ファイル」も疑うはずですが、合成すると、どうも疑わないようなので、結局、ノートンのウィールス・スキャン・プログラムのメカニズムは何かという問題になります。 長い時間が経過してしまっていますので、いま締め切りたいとも思いますが、何か、メッセージがあります場合は、いま締め切りますと、投稿の機会がなくなりますので、あと、2,3日して締め切りたく思います。なお、回答して戴き、色々と参考になりましたので、締め切るときは、お礼の意味で、20P発行させて戴きますので、宜しくお願い致します。 再度、回答たいへんありがとうございました。お礼が非常に遅くなって申し訳ありません。 (2003/0225/0037)  

noname#8602
noname#8602
回答No.3

テキストファイルは、時折、EOFの後にゴミ(関係ないバイナリファイル)がくっついていることがあります。 Wzエディタで再保存すれば、ゴミは削除できそうな気がします。心配なら、一度バイナリモードでファイルの中を覗いてみてください。 バイナリエディタも紹介しておきます。

参考URL:
http://www.vector.co.jp/soft/win95/util/se032859.html
maris_stella
質問者

お礼

  回答たいへんありがとうございます。お礼が遅くなって申し訳ありません。 実は、質問する前に、実に色々なことを試みております。例えば、変換した際、確かに、変なごみが出てくるのですし、(変換ソフトが十分でないためだと思います)、WZエディターで、これらのごみをすべて取り除いて、WZエディターで見る限り、普通のテクスツオ・ファイルと違いがないように処理しても、問題が解決しません。 また、古いワープロの文書を変換したものを、別のワープロに取り込み、一旦、別のワープロの文書にしたものを、再度、そのワープロのテクスト変換機能を使って、DOSテクストに変換したものも、これに引っかかるのです。 これは、第二のワープロから変換した文書ファイルで、一つだけが、同じような症状になりますので、内容を確認してみますと、古いワープロの変換文書を取り込んだ文書が元になっているということがわかったのです。 バイナリー・エディターの紹介をありがとうございます。vectorに行き、適当なものをダウンロードして、問題のファイルを見ますと、確かに、末尾に、普通のテクスト文書にない文字が一字入っています。しかし、これを削除してみても、問題は解決しません。 バイナリー・エディターを使って、色々と文字列を眺めて、正常なテクスト文書のそれと比較してみたり(疑わしい文字を削除したり)しましたが、理由がわかりません。 変換したときに、特有のヘッダーができるので、このヘッダーを外してみて文書を作っても、やはり、問題が解決しません(変換ヘッダー部分が、問題ではないということになります)。 Norton のウィールス・スキャンは、その後も複数回実行していますし、スキャン・ディスクは、無論、この質問を行う前にも幾度か実行しています。従って、質問の表題通り、テクスト・ファイルに何か種類があるのか、特徴があるのか、というような形になりました。 変換文中に、何か問題となる文字列が含まれているのか、あるいは別の理由なのか、まったくわかりません。新しいファイルを作って、そこに内容を全体選択でコピー・複写しても問題は解決しませんから、何か文字列か、問題となる記号が入っているのだとは考えられるのです。 問題が解決していませんが、もう少し調べてみましてから、質問を締め切りたく考えています。 再度、回答ありがとうございました。お礼が遅くなって申し訳ありません。 (2002/1120/0915)  

  • Zz_zZ
  • ベストアンサー率44% (756/1695)
回答No.2

あと、「スキャンディスク」も試してみて下さい。

  • Zz_zZ
  • ベストアンサー率44% (756/1695)
回答No.1

メディア(記憶媒体)の一部(ブートセクターなど)がウィルスに 感染しているかも。 メモ帳(エディタ)で開いて、文字だけなら、そのファイルは、 テキストファイルですから問題は無いと思います。

maris_stella
質問者

補足

  回答ありがとうございます。お礼が遅くなって申し訳ありません。 ただ、疑問に感じることでございますが、「質問内容」を読まれた上での回答なのでしょうか? 何でも適当なことを回答すればよいということではないはずです。というか、そのような回答は、逆に迷惑です。 Norton を使ってウィールス・スキャンをしていておかしいので、どうも、Norton が、変換ファイルの文字列にウィールスに似た特徴を見出して、それで過去のデータを参照して調べているので、処理が遅くなっているのではないかというのが、わたくしの想定でございます。 そのように質問で、明確に記したと思います。つまり、ウィールス・スキャンを実行しているのです。その時点でのウィールス情報が、一週間遅れで、未知ウィールスに感染していたというのならまだありえるかも知れませんが、すぐ単純に「ウィールスに感染」などと、回答に書くその安易な適当な姿勢は許容しがたいです。 迷惑ですから、あなたのような方は回答を差し控えられるのがよいともおもいます。 お礼になっていませんが、状況を具体的に説明するため、質問文をずいぶんと推敲した上で、このような適当な思いつきの回答をかかれるのは不本意であり不愉快であると申し上げましょう。  

関連するQ&A

  • PDFファイルからテキストへ

    皆様こんにちは。パソコン初心者の者です。 スキャナーでイメージとして読み込んだPDFファイルを、テキストに変換する事は出来るのでしょうか?出来るのであれば、どうすれば良いのでしょうか?そういうことが出来るソフトはあるのでしょうか? ワードで作成した文書等から、PDFに変換した文書であれば、テキストに変換することは出来るようなのですが。

  • リッチテキストコンバータで

    リッチテキストコンバータ(ファイル変換ソフト)で一太郎の文書を文豪JXに変換しようとしたら、「JX用のフロッピーを入れてください」とメッセージがでたのですが、JX用のフロッピーって、パソコンで読み書きする普通のフロッピーとちがうのでしょうか?フォーマットの関係なのでしょうか。でも、JX専用のフォーマットだとしたら、それをパソコンで認識できるのでしょうか?ご存じの方教えてください。

  • テキスト(マニュアル本)をPDFファイルにしたい

    約100ページほどのテキスト(マニュアル)のpdfファイルを作成したいのですが、テキストをコピーする際には、1ページずつスキャナーでスキャンするしか方法はないのでしょうか? これでは時間がすごくかかってしまうので、コピー機などを使って短時間にスキャンする方法とかってないんでしょうか? なお、スキャンしたファイルは、pdf変換ソフト(いきなりpdf)で変換するつもりです。 以上、よろしくお願い致します。

  • スキャンした文章をテキストへ変換したいです

    教えてください 例えば、本の文章等何でもいいのですが ページをスキャンして、その内容をテキストエディタ等で 編集したいと思っています。 スキャンすると(JPEG、GIF,PDF)での保存になると思うのですが そのファイルをテキストエディタに変換するにはどうすればよいでしょうか? 教えていただければ助かります

  • アウトラインプロセッサファイルの一括テキスト化

    Story Editorを使っているんですがタイトルの通り 一括でテキストファイルに変換できるソフトはないのでしょうか? テキストで残した方がテキスト管理ソフトで閲覧できたり 将来的な互換性を考えてもベターなテキスト形式で残したいと思ったんですが。

  • テキストファイル(.txt)のdataを間引き。

    テキストファイル(.txt)が100000行位あり、 それをエクセル(エクセル2000)に変換したいのですが、 65536行までした表示出来ません。(後は切られました) テキストファイルの状態で、1/10位に平均的に間引きたいのですが、 その様な、エディタの様なフリーソフトはないでしょうか? 宜しくお願い致します。

  • 印刷物をテキストファイルに変換するソフト

    印刷物などを(例えば、新聞など)スキャンしてそれをそのまま自動的にテキストファイルへ変換するソフトというものはあるのでしょうか。

  • 2ギガByteデータのテキストファイルを読めるエディターって知りませんか?

    2ギガByteデータ(数十万件レコード)のテキストファイルを読めるエディターって知りませんか? できればフリーソフトが欲しいです。 利用OSは、Windows2000Pro(DOS/V機)です。

  • テキストファイルについて

    拡張子にtxtのついたものは基本的にプレーンテキストだと認識していますが正しいでしょうか?しかしながら、ウインドウズのメモ帳のみならず、TeraPadのようなよりプログラミングのソースコードを記述するのに適していると言われるエディタでさえもフォント設定のメニューがあります。 ワープロではないいわゆるテキストエディタと言われるものにもこうしたフォントのメニューがあるということは、「txt」という拡張子を持つファイルはプレーンテキストだがそれをエディタで表示する際、エディタがフォントと呼ばれるものを付加しているのだと自分は思っていますが、「txt」拡張子のついたいわゆるプレーンテキストファイルというものであっても、再びそれらのファイルがエディタに読み込まれた時に作成時に設定したフォントが呼び出されるような最低限の情報が「txt」の拡張子のテキストファイルも持っているということでしょうか?そう考えると、フォント情報の全くない完全なプレーンテキストというものが本当に実在するのかよく分からないのですが・・・。「txt」拡張子付きのファイルはやはり何のフォント情報も持たないプレーンテキストであり、プレーンテキストにはそうしたフォントに関する情報は一切付与されておらず、エディタというソフトがそのテキストファイルのフォントに関する情報を覚えていて再び読み込んだとき前のテキスト表示が再現できるといった感じでしょうか?それでも最低限ソースコードを書いた時のフォント情報に繋がる最低限のデータはプレーンテキストというものも持っているのでしょうか? それともそうしたプレーンテキストとフォントの接続はOSがそうした働きをするのでしょうか?そのあたりの仕組みについてよく分かりません。

  • テキストファイルって何?

    ある人が、WORDやEXCELで作った長い文章だけのファイルを「テキストファイルに変換してその後、編集するからいいよ。」ってな事を申しておりました。が、このテキストファイルって一体何ですか? また、変換したら、どういうメリットがありますか? また、簡単に変換できますか?変換用ソフトなどがあるのでしょうか?参考URLもご存知でしたら、宜しくお願いします。

専門家に質問してみよう