• 締切済み

データベースの勉強について

皆さん、お世話になります。 データベースの勉強をしようと思っています。 そこで皆さんに質問があります。 サンプルデータ(CSVファイル)を探しています。 ※できれば大量のデータ(100万件以上) 例えば日本郵政公社のホームページからダウンロードできる郵便番号(KEN_ALL)データみたいなCSVファイル以外でありませんでしょうか。 ご存知の方がいましたら教えて下さい。 宜しくお願いします。

みんなの回答

回答No.1

12万件だけど、恒星データベース HYG 2.0はなぜかgzipで二重圧縮されているので、2回展開してください。

参考URL:
http://www.astronexus.com/node/34

関連するQ&A

  • 漢字の画数のCSVデータはありますか?

    郵便番号と住所の対応CSVデータは郵政公社HPからダウンロードできますが、そのような感じで、漢字と画数のデータはどこかで公開されていないのでしょうか?

  • 高速なデーターベースは?

    今ネット上でcgi/perlをつかって会員データーをcsv形式でデーターベース化しています。 1万件ほどなの問題ないのですが、これが10万件やそれ以上になってきた場合より高速なデーターベースが必要となるのでその際早いデーターベースに変更したいのですが、どのデーターベースが速いと思いますか? 一概には言えないと思いますが、mysqlやpostgresqlなどなど。 mysqlは使ったことがあるのですが大量なデーターは扱ったことがないので実際の速度は体感してません。

  • データファイルの形式について

    早速ですが、宜しくお願いします。 一覧形式のデータを提供する場合、広く普及している"*.xls"が一般的かと思っていたのですが、郵政公社の7桁郵便番号などは"*.csv"で提供されていることに気付きました。 1.CSVファイルはOSやソフトを問わずにデータとして利用でき、ファイルサイズも小さくできるから、と解釈して間違いないでしょうか? 2.提供した相手がXLSファイルを利用できないということがあるのでしょうか? 3.2番の場合、変換などの手間はどの程度のものなのでしょうか? 以上、宜しくお願いします。

  • データベースについて

    csv形式のファイル(データ)があるのですが、これを PHP又はPRELを利用して検索できるようにしたいのです。 データの項目数は5×12000件です。 MySQLというのがインストールされているサーバなのですがCSV形式のファイルをデータベース形式に変換して(?)インターネット上からブラウザで検索できるような CGI又はPHPをご存知ありませんか?

  • 事業所郵便番号をダウンロードしたら一部の地番が日付化して表示される

     事業所郵便番号をデータベース化するため、郵政公社のゆうびんホームページから事業所の個別郵便番号をDL、フォルダを解凍したところ、Excel形式のCSVファイルが表示されました。  このファイルを開いて見たところ、何と地番の一部が、「3月16日」や「Oct-42」のように日付表示となっているのです。  早速公社の郵便サービスセンターに質問したところ、多分上記の例の場合は「3-16」「10-42」が何らかの理由で日付表示になったのだろうとのことで、(応答者自身も)おかしいと思うから本社に聞いてみるとのことでした。(本社からは未回答です。)  何ともお粗末な話ですが、調べてみたところ、元の地番が「数字-数字」となっていて、左側の数字が1~12のものが日付表示に変わっているようでした。  それにすべてが○月○日となっているのならまだしも、例示のように欧文表示のものも多数混在し、しかも右側の数字が31以下の場合でも例えば「5月13日」でなく「May-13」となっているものもあって全く不統一なのです。  そこで質問ですが、この誤って表示された地番をすべて元どおり「数字-数字」に修正する最も簡単な方法(手順)又は計算式をお教えください。  注:全事業所数は2万件を超えています。  なお、参考までに付記しますと、郵便番号にも誤表示があり、ゼロから始まる北海道や東北の一部でゼロの部分が欠け、6桁の郵便番号となっていました。(この修正は簡単でしたが…。)

  • ロータスアプローチのデータベース

    最近、ちょっとずつロータスを使い始めたのですが 顧客管理データを作ろうとがんばっています。 そこで分からなくなったのが、郵便番号フィールドなんです。 以前、どこかで使わせてもらったアプローチでは住所かもしくは郵便番号をある程度まで入力すると、自動的に番号なり、住所なりが入力されていました。 郵政省なので配布されていた7桁対応のROMからデータベースを作るところまではなんとか分かるのですが、そのあとのフィールドとの関連付けがいまいちわかりません。 是非、教えてください、お願いします。

  • 郵便番号データのMYSQLへのインポートについて

    郵便番号データのMYSQLへのインポートについて質問をさせていただきます。よろしくお願いします。 郵便番号のデータベースを日本郵政が配布しているCSVファイルを利用して作成しようと思い、下記の手順でMYSQLにインポートしようと試みましたが、失敗してしまいます。 1.日本郵政のHPからダウンロードしてきたファイルをそのままではサイズが大きすぎてインポートできないためken1.txt(1340KB)、ken2.txt(1339KB)、ken3.txt(1386KB)、ken4.txt(1444KB)に分割。 2.サイトの文字コードがUTF-8を使用しているため、上記のファイルの文字コードをUTF-8に変換。 3.PHPMyAdminを使用し、yubinbangoテーブル(フィールドは以下の4つ bango、ken、shi、machi 上記ファイルについてもフィールドは4つにしてあります。)を作成。 4.PHPMyAdminでyubinbangoテーブルを選び、『テーブルにテキストファイルを追加する』のリンクをクリック。 5.表示された画面で テキストファイルの場所→上記分割したファイル ファイルでテーブルを置き換える→チェックボックスのチェックなし フィールド区切り記号→, フィールド囲み記号→" オプションのチェックボックスのチェックなし フィールドのエスケープ記号→\ 行の終端記号→\r\n 列(カラム)名→『bango,ken,shi,machi』 漢字コード変換→non LOAD 手段→DATA LOCAL として、実行ボタンを押したところ、データは追加されたと出るのですが、実際にデータベースの中を見てみると『bango』の1つ目のデータのみ文字化けし、以降全てのデータで『ken,shi,machi』がNULLとなってしまっています。 どのようにすれば、データを正常にインポートできるでしょうか? どうかご教授のほどよろしくお願いいたします。

  • 【至急!】京都府の郵便番号データありませんか?

    現在、エクセルの郵便番号を入力すると、住所を生成してくれる機能を使って住所入力をしています。 ですが、京都のみ原本に記載されている住所と、生成された住所が、全然違うものがたくさん出てきてしまいます。 似ても似つかない結果も多いので、想像で置き換えることも難しいです。 どこかに現状に即したCSVファイルはないでしょうか。 郵便番号と住所が入っているものがあれば、VLOOKUP関数で引っ張りたいと思います。 ちなみに当り前ですが、日本郵政公社からダウンロードしたファイルは使えませんでした…

  • 郵便番号検索に使用するデータについて

    現在、郵便番号検索表示のPGをPHPで作成しています。 この郵便番号検索はできれは自分の手元にDBを置かずに郵政公社のデータを利用したいと考えています。  以前に日本郵政公社にアクセスしてその検索したデータだけを返してくれるという話を聞いた記憶があるのですが、そのようなサービスは実際にあるのでしょうか? よい方法や情報がありましたら宜しくお願いいたします。

    • ベストアンサー
    • PHP
  • 事業所郵便番号をダウンロードしたら一部の地番が日付表示になっている

     事業所郵便番号のデータ化のため、日本郵政公社のゆうびんホームページから事業所の個別郵便番号をダウンロードし、フォルダを解凍したところ、Excel形式のCSVファイルが現れました。  このファイルを開いて見たところ、何と地番の一部が、「2月18日」や「May-66」のように日付表示となっているのです。  早速公社の郵便サービスセンターに質問したところ、多分上記の例の場合は「2-18」「5-66」が何かの理由で日付表示になったのだろうとのことで、(応答者自身も)おかしいと思うから本社に聞いてみるとのことでした。(まだ回答はもらってません。)  何ともお粗末な話ですが、調べてみたところ、元の地番が「数字-数字」となっていて、左側の数字が1~12のものが日付表示に変わっているようでした。  それにすべてが○月○日となっているのならまだしも、例示のように欧文表示のものも多数混在し、しかも右側の数字が31以下の場合でも例えば「1月13日」でなく「Jan-13」となっているものもあって全く不統一なのです。  そこで質問ですが、この誤って表示された地番をすべて元どおり「数字-数字」に修正する最も簡単な方法(手順)又は計算式をお教えください。  注:全事業所数は2万件を超えています。  なお、参考までに付記しますと、郵便番号にも誤表示があり、ゼロから始まる北海道や東北の一部でゼロの部分が欠け、6桁の郵便番号となっていました。(この修正は簡単でしたが…。)