- ベストアンサー
Excelへのデータのインポート
Excelへのデータのインポートにテキストファイルをインポートする際に、タブ区切り、CSV区切り、Unicode?区切りなどがありますが、区切り文字単位で、データが列に割り当てられるという意味はわかりますが元のファイルがなぜそれぞれの区切りで作成されているのか、意味がわかりません。稚拙な質問でもうしわけありませんが詳細をおしえてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
テキストからのエクセル(とかそういうソフト)へのデータの受け渡しには、CSVが使われることが多いです。 ABCとかそのままだと、区切りが判らないので、 A,B,Cの様にカンマで区切られます。 CSVは、カンマセパレーテッドヴァリューなので、 カンマで区切られているというだけのルールですが、 文字列は、""で囲むとかのローカルルールがある場合もあります。 ですが、それは、あくまでローカルルールなので、CSVで信用できるのは、カンマで区切られているということだけです。 なので、文字列中にカンマが存在する場合に (x,y)=(4,5) などの文字列があった場合、 "(x,y)=(4,5)" なのか "(x","y)=(4","5)" なのか判らない場合があります。 そういうときには、タブを文字の区切りにするといいと思いません? タブは、通常の文字には含まれないので、カンマが文字列中に含まれていることがあってもタブは(そうそうは)含まれてはいないのじゃないか?と期待することができます。(もちろん、タブが文字列として必要な場合もあるでしょうけど、そういう場合は、区切り文字を別のものを考えないといけません) まあ、そんな感じじゃないですかね~。 (何かの規格を読んだというわけじゃないので)
その他の回答 (2)
- BLUEPIXY
- ベストアンサー率50% (3003/5914)
>Unicodeテキストとしてエクスポートする 成る程、確かに、unicode(txt)ってありますね。 この場合、区切り文字は(unicodeの)タブになるようです。 unicodeで出力する理由は、#2で答えたような意味だと思います。 普通に(例えばcsvテキストで)出力すれば文字コードは、シフトJISになりますが、これって日本だけの規格なので、ワールドワイドでマルチバイト文字(日本語とか韓国語とかアラビア語とか)を統一的に扱おうとするとユニコードにしておくことが都合がいいと考えられる場合にunicode出力するんでしょうね。
- BLUEPIXY
- ベストアンサー率50% (3003/5914)
>あとunicode区切りなどについてわかればお願いします。 エクセルでテキストファイルをインポートする時に、unicode区切りというのは、無かったと思います。 今、エクセルを立ち上げて確認してみましたが、やはり、そのような項目は無いようでした。 エクセルに取り込むファイルを出力する側でUnicode出力をしているとしたら、その理由は、2バイトコードを他のコードで扱っているような環境で、その出力が使い回しが利くようにしようというような意味合いだと思います。 例えば、シフトJISコードの中に、部分的に、Unicodeの文字が区切りで入っているというようなことは、ちょっと考えにくいと思います。 もしかして勘違いコメントかもしれません。 「Unicode区切り」というのがどういう処からでてきたのか補足をお願いします。
お礼
有難うございます。Microsoft office Sp問題集のエクセルファイルをテキストファイルに変換可能。その種類は、という内容でした。 エクスポートの方でした。申し訳ありません。Unicodeテキストとしてエクスポートすると、どのような結果が得られるんでしょうか?自分でも研究してみますがおわかりでしたらお願いします。何度もすみません。
お礼
有難うございます!よくわかりました。 そのように使い分けるのですね。 あとunicode区切りなどについてわかればお願いします。