テクスト・ファイルの種類と性質について

2023/07/27 04:27

このQ&Aのポイント

テクスト・ファイルの種類と性質について調査しました。
テクスト文書の変換ソフトによって作成されたＤＯＳテクスト文書は、通常のテクスト・ファイルとは異なる性質を持っている可能性があります。
Ｎｏｒｔｏｎをインストールすると、ＤＯＳテクスト文書のファイル操作に問題が発生し、バックアップやファイルの開閉に時間がかかることがあります。

ベストアンサー

テクスト・ファイルの種類と性質について

2002/11/02 10:08

　奇妙な質問タイトルですが、次のような背景があります。十年以上前のワープロの文書が、５インチ２ＤＤフロッピで大量にあったものを、ある変換ソフトを使い、ＤＯＳ－テクストに数年前、変換したのです。 rich text converter もあったのですが、５インチ２ＤＤというのは特殊なフロッピで、かなり原始的な変換ソフトを使いました。こうしてできたＤＯＳテクスト文書を、これまでもコピーして使っていました。しかし、最近、ダブルクリックしても開きにくくなったり、上書きに時間がかかります。また、バックアップを取ろうとすると、それらのファイルの部分で、確認のためか、時間がかかります。これは、どうも、同じテクスト文書と言っていても、変換ソフトで作ったＤＯＳテクスト文書は、何か違っているようなのです。Ｎｏｒｔｏｎでウィルス・スキャンしてみると、これらのファイルに対し、必要以上の時間をかけていることがわかりました（数キロのファイルに、５秒以上かかります。１００ファイルのスキャンに１０分近くかかります）。少し前まで、この変換文書と、普通のテクスト文書と同じ扱いだったのが、どうも、Ｎｏｒｔｏｎをインストールしてからおかしくなったようです。つまり、ファイルを開くときにも、Ｎｏｒｔｏｎがチェックしていて、それで、問題が起こるように思えます。同じテクストのはずなのですが、Ｎｏｒｔｏｎでは、扱いが違うようで（極度に慎重なようです）、すると、何か、違うタイプのテキスト・ファイルだということになります。バックアップもファイルを開くのも、不便です。通常のテクスト・ファイルにする方法はないでしょうか。色々試しているのですが、エディターでは見えない違いがあるようです。ＯＳはＷＩＮ－ＭＥ、変換に使ったのは「どす恋」、ＷＺエディターです。　

maris_stella
お礼率40% (34/85)

みんなの回答 （5）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

noname#8602

2003/02/25 01:23 回答No.5

ノートンのウイルス解析の詳細が分からなければ、解決しそうにない問題ですね。改行コードやEOFマークあたりに問題がないとすると、他の正常なテキストファイルとノートンが異常な動きをするテキストとの「違い」が見あたりません。はずしていて当然のことですが、貴方が例にあげれられた「複数の小さな文書を大きな文書に変更」という項目では、元のファイル名に漢字を使っていて、それが悪さをしているというような可能性があることには気づきました。もしも、変更後の文書が1.txtというような半角英数字だけによるファイル名であれば、可能性だけは残ります。漢字のファイル名を使っていて問題が出るのは、英語文化圏の素のままのアプリケーションにおいてのファイルの読み書きや、大昔のC言語のバグ（2バイト系のファイル名に非対応）によるエラーなどが思い浮かびますが、今さらその程度のことで日本語化された著名なウイルス監視アプリケーションが変な動きをするのも奇妙なことです。まったくお役に立てず申し訳ありません。

質問者

お礼 2003/02/25 21:10

　（補足で、以下のお礼を記したと思ったのですが、登録されていません。最後までステップを完了していなかったようです。お礼欄に追記します）。回答してくださった皆様。長く締め切らずにいまして、申し訳ありません。問題が簡単に解けそうなような気がして、実際は、考えれば考えるほど、難しいのではないかという思いがあり、また、最初は、何かコンヴァーションで訂正できると思ったのですが、どうもそういう訳には行かないようだと感じました。変換テクスト・ファイルは開かないのではなく、ウィールス・チェックを多分しているので、開くのに時間ががかるのです。何百も変換ファイルがありますので、たとえ解決方法が分かっても、手動書き換えだと、これを全部、どうにかするというのも無理があります。少し不便ですが、ファイルが使えないというのでもないので、仕方ないとも考えておりました。締め切ろうか、もう少しまとうかと思い悩んでいるうちに、Time flies で時間が経過しました。回答、たいへん有り難うございます。_P2B-B さんには、この補足でお礼を述べたく思います。わたしは、ファイル名は、ときに、大文字を使うことはありますが、すべて、英数字です。漢字は使いません。ともあれ、最後まで丁寧なお言葉、有り難うございます。なお、この回答へのお礼は、将来、何か、情報を書き込む必要ができた場合のため、開けておきたく思います。宜しくお願いいたします。それでは、再度、たいへん、遅くなって申し訳ありません。有り難うございました。これで、質問を締め切らせて戴きます。 (2003/0226/2055) (2003/0226/2107) 　

その他の回答 (4)

noname#8602

2002/11/20 21:02 回答No.4

バイナリエディタで中身を確認して一般的なテキストと差異が認められないというのに、少し疑問が残ります。改行コードなども確認されていると思いますが、違いがあるとしたら、こんなことしか今は思い当たりません。 5inch2DDはAT互換機では読めないので、「どす恋」との組み合わせなら、取り込んだPCは98x1シリーズでしょうか。「どす恋」は手持ちがありますので、実際に検証できるものなら試してみたいと思います。ビジネス文豪・OASYS・キャノワードなどなど、5inch2DDを使ったワープロも多々ありますので、元になるFDがないのが残念です。

参考URL：: http://tohoho.wakusei.ne.jp/wwwxx011.htm

質問者

お礼 2003/02/25 00:43

　回答たいへんありがとうございます。お礼が、極端に遅くなって申し訳ありません。改行コード等も調べてみまして、おかしい１ビット記号が付いていることも分かっていますが、これを削除しても問題が解決しません。もっと奇妙なのは、どうしても、おかしくなるファイルは、ファイルの「本文」のなかに何か問題があるとしか考えられないのですが、ファイルを２０とか３０とか、一つの新しく作ったテクスト・ファイルに、順番にコピーして、総合ファイルのようなものを作ると、これは、「本文」は変化していないはずなのに、そのまま、ノートンのチェックは素通りしてしまうということです。特定の間違った文字コードが入っているというより、確かに何か入っているのでしょうが、ノートンが、ウィールスではないかと疑う「機構・チェック用基準」が原因のような気がします。それは、大サイズの画像ファイルなど、なかを全部チェックしていると、相当な時間が必要なはずが、簡単にスキャンが終わるということは、拡張子と、ファイルの特定の部分をチェックして、合っていれば、合格としているのではないかと思えるからです。ノートンの側の機構で、ウィールスではないかという判定をして、そこで、定義ファイルに参照して確認しているので、時間がかかるのだというのが結論です。何が、ウィールスだと疑わせているのか、見当が付きません。「本文文字列」に、疑わしいものがあれば、疑うというのでしたら、先に述べた、「合成ファイル」も疑うはずですが、合成すると、どうも疑わないようなので、結局、ノートンのウィールス・スキャン・プログラムのメカニズムは何かという問題になります。長い時間が経過してしまっていますので、いま締め切りたいとも思いますが、何か、メッセージがあります場合は、いま締め切りますと、投稿の機会がなくなりますので、あと、２，３日して締め切りたく思います。なお、回答して戴き、色々と参考になりましたので、締め切るときは、お礼の意味で、２０Ｐ発行させて戴きますので、宜しくお願い致します。再度、回答たいへんありがとうございました。お礼が非常に遅くなって申し訳ありません。 (2003/0225/0037) 　

noname#8602

2002/11/02 13:34 回答No.3

テキストファイルは、時折、EOFの後にゴミ（関係ないバイナリファイル）がくっついていることがあります。 Wzエディタで再保存すれば、ゴミは削除できそうな気がします。心配なら、一度バイナリモードでファイルの中を覗いてみてください。バイナリエディタも紹介しておきます。

参考URL：: http://www.vector.co.jp/soft/win95/util/se032859.html

質問者

お礼 2002/11/20 09:23

　回答たいへんありがとうございます。お礼が遅くなって申し訳ありません。実は、質問する前に、実に色々なことを試みております。例えば、変換した際、確かに、変なごみが出てくるのですし、（変換ソフトが十分でないためだと思います）、ＷＺエディターで、これらのごみをすべて取り除いて、ＷＺエディターで見る限り、普通のテクスツオ・ファイルと違いがないように処理しても、問題が解決しません。また、古いワープロの文書を変換したものを、別のワープロに取り込み、一旦、別のワープロの文書にしたものを、再度、そのワープロのテクスト変換機能を使って、ＤＯＳテクストに変換したものも、これに引っかかるのです。これは、第二のワープロから変換した文書ファイルで、一つだけが、同じような症状になりますので、内容を確認してみますと、古いワープロの変換文書を取り込んだ文書が元になっているということがわかったのです。バイナリー・エディターの紹介をありがとうございます。ｖｅｃｔｏｒに行き、適当なものをダウンロードして、問題のファイルを見ますと、確かに、末尾に、普通のテクスト文書にない文字が一字入っています。しかし、これを削除してみても、問題は解決しません。バイナリー・エディターを使って、色々と文字列を眺めて、正常なテクスト文書のそれと比較してみたり（疑わしい文字を削除したり）しましたが、理由がわかりません。変換したときに、特有のヘッダーができるので、このヘッダーを外してみて文書を作っても、やはり、問題が解決しません（変換ヘッダー部分が、問題ではないということになります）。 Norton のウィールス・スキャンは、その後も複数回実行していますし、スキャン・ディスクは、無論、この質問を行う前にも幾度か実行しています。従って、質問の表題通り、テクスト・ファイルに何か種類があるのか、特徴があるのか、というような形になりました。変換文中に、何か問題となる文字列が含まれているのか、あるいは別の理由なのか、まったくわかりません。新しいファイルを作って、そこに内容を全体選択でコピー・複写しても問題は解決しませんから、何か文字列か、問題となる記号が入っているのだとは考えられるのです。問題が解決していませんが、もう少し調べてみましてから、質問を締め切りたく考えています。再度、回答ありがとうございました。お礼が遅くなって申し訳ありません。 (2002/1120/0915) 　

Zz_zZ
ベストアンサー率44% (756/1695)

2002/11/02 10:39 回答No.2

あと、「スキャンディスク」も試してみて下さい。

Zz_zZ
ベストアンサー率44% (756/1695)

2002/11/02 10:37 回答No.1

メディア(記憶媒体)の一部(ブートセクターなど)がウィルスに感染しているかも。メモ帳(エディタ)で開いて、文字だけなら、そのファイルは、テキストファイルですから問題は無いと思います。

質問者

補足 2002/11/20 09:18

　回答ありがとうございます。お礼が遅くなって申し訳ありません。ただ、疑問に感じることでございますが、「質問内容」を読まれた上での回答なのでしょうか？　何でも適当なことを回答すればよいということではないはずです。というか、そのような回答は、逆に迷惑です。 Norton を使ってウィールス・スキャンをしていておかしいので、どうも、Norton が、変換ファイルの文字列にウィールスに似た特徴を見出して、それで過去のデータを参照して調べているので、処理が遅くなっているのではないかというのが、わたくしの想定でございます。そのように質問で、明確に記したと思います。つまり、ウィールス・スキャンを実行しているのです。その時点でのウィールス情報が、一週間遅れで、未知ウィールスに感染していたというのならまだありえるかも知れませんが、すぐ単純に「ウィールスに感染」などと、回答に書くその安易な適当な姿勢は許容しがたいです。迷惑ですから、あなたのような方は回答を差し控えられるのがよいともおもいます。お礼になっていませんが、状況を具体的に説明するため、質問文をずいぶんと推敲した上で、このような適当な思いつきの回答をかかれるのは不本意であり不愉快であると申し上げましょう。　

テクスト・ファイルの種類と性質について

テクスト・ファイルの種類と性質について