• ベストアンサー

カナ氏名、漢字氏名が含まれる大量テスト用CSVないですか?

大量(数十万件)の顧客マスタを作ろうとしています。 カナ氏名、漢字氏名が個人情報を含まない(歴史上の人物とか)で構成されたデータベース(できればCSV形式がうれしい)がどこかにないか探しています。 コツコツデータベースを作っていくのが大変なので;; 世の中のどこかにはそういうのがありそうな気がするので 質問です。どなたか知りませんでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.3

自社の社員名簿を使うのが手っ取り早いでしょうか。 実名 → 仮名への変更は、姓と名を1レコードずつずらして結合することで実現しました。 (姓と名の間がスペースで区切られていることを利用) 必要に応じて、住所、e-mailアドレス等も加工して架空の内容に変更します。 件数が足りなければ、必要な回数だけループしてレコードを増やします。(同姓同名の人がN人いることにする) 元のレコードが数100件程度あれば、レコードのカーディナリティはじゅうぶんに実用的だと思います。

その他の回答 (2)

noname#13214
noname#13214
回答No.2

CSVではありませんが、「文字を打込まずに検索するためのサイト」に機械的に考えられる男性名称、女性名称を列挙してあります。これを元に機械的にテストデータを作成することができそうです。ただし、実名とはヒットするので、外部にデータ出力するようなテストケースの場合には、テスト方法を問題のないようにご考慮ください。また、当HPの利用規定がみつからず、利用目的違反にあたるのかが判明していません。そのあたりもご考慮ください。 芸能人名は生年月日もあるので個人情報として抵触するかもしれないので、使用しないほうが賢明と思われます。

参考URL:
http://www.rock.sannet.ne.jp/mmmm/index.html
回答No.1

テストならば架空の氏名で十分では? 例えば「テスト1 太郎1」として、数値の部分のみを変更するとか。 VBAなどで簡単に作れますが。 (まさか手入力でやろうとは思ってないですよね?)

SEAMOON
質問者

お礼

ありがとうございます。 それでも良いと言えばいいのですが (今まではそうやってました) どうもいまいち・・なので。

関連するQ&A

  • EXCEL(csv)で全角カナを半角カナに一括変換できないでしょうか

    ある年賀状ソフトに入力してあるデータを 別の顧客管理ソフトにCSVでインポートとしようとしております。 しかし年賀状ソフト側は氏名のふりがなが全角カナで入っており (氏名を入力するとそのままふりがな欄に入力される) 顧客管理側はふりがなが半角カナ管理のためインポートでエラーになってしまいます。 EXCEL(csv)にて全角カナを半角カナに一括変換するような方法をどなたかご存じないでしょうか。 お知恵を拝借できれば助かります。

  • Unicode漢字をCSVファイルで使うには

    宛名印刷で使用するデータがCSV形式のファイルになっています。 住所や氏名の中で1から3文字程度JIS第4水準と言うんでしょうか、Unicodにしかない漢字が含まれており、クェスチョンで表示(印刷)されてしまいます。 Unicodにしかない漢字をCSV形式のファイルで使う方法を教えていただけないでしょうか。 例えば、Unicod69ab、69ae、69ba 69a6などの漢字をCSV形式のファイルの住所、氏名などの中で1から3文字使いたいのです。 よろしくお願いします。

  • CSVデータの情報分析がしたいです。

    CSVデータの情報分析がしたいです。 全くの素人ですので、不備があるかもしれませんがよろしくお願いいたします。 数千件ある顧客データをCSVにすることはできますが、その後の情報の分析を行いたいです。 ひと顧客が持っているデータも30項目ほどあり、それらの組み合わせの情報収集が目的です。 何から手をつけてよいかもわかりません。。。。。 ACCESSなどのデータベースソフトを購入して勉強すればよいのでしょうか? どなたか、お教えください。 よろしくお願いいたします。

  • アクセスでの同姓同名の抽出について

    お世話になります。 アクセスで顧客データ(漢字氏名、カナ氏名、生年月日、住所)を管理しています(16000件程度) その中で、同姓同名(カナが同じ人)のデータのみをピックアップしたいのですが、どうしたらよいでしょうか? 流石にデータをカナ順に並び替えて全部プリントアウトして調べるのはあほくさいし・・・。 どなたかご存じの方よろしくお願いします。

  • ACCESSについて質問させてください。

    ACCESSの勉強中の者です。 現在,基礎的なデータベースファイルを作成し「顧客マスター」というフォーム上に「顧客番号」,「顧客氏名漢字」,「顧客氏名ふりがな」,「顧客職業」というテキストボックス等を配置しています。 このフォーム上に新たに「顧客氏名」というコンボボックスを配置して,「顧客氏名漢字」,「顧客氏名ふりがな」に入力済みのデータからコンボボックスのデータを選択できるようにしたいと思っています(※例えば,テキストボックス「顧客氏名漢字」欄に「山田太郎」,テキストボックス「顧客氏名ふりがな」欄に「ヤマダタロウ」と入力されているのであれば,コンボボックス「顧客氏名」欄には「山田太郎」,「ヤマダタロウ」から選択させる。)。 コンボボックスのプロパティのコントロールソース(又は値集合ソース,値集合タイプ)の記述でなんとかできるものでしょうか?それともVBAが必要なのでしょうか? 方法があるのであれば,その方法は問いませんのでどなたかご教示いただければと思います。 よろしくお願いいたします。

  • 高速なデーターベースは?

    今ネット上でcgi/perlをつかって会員データーをcsv形式でデーターベース化しています。 1万件ほどなの問題ないのですが、これが10万件やそれ以上になってきた場合より高速なデーターベースが必要となるのでその際早いデーターベースに変更したいのですが、どのデーターベースが速いと思いますか? 一概には言えないと思いますが、mysqlやpostgresqlなどなど。 mysqlは使ったことがあるのですが大量なデーターは扱ったことがないので実際の速度は体感してません。

  • レコード件数が0件なら印刷をしない。

    おはようございます。 アクセス2000でVBAを書いています。 あるテーブル(テーブルA)を元にレポート(レポートB)を作成しました。テーブルAのレコード件数が0件の時、印刷をさせたくないのですが、うまく書けません。IF文で分岐したいのでよろしくお願いします。 ちなみにテーブルAには顧客ID、カナ氏名、漢字氏名等が入っています。 誰か、助けて~!

  • 会社名のよみ仮名に規制はあるか?

    概要 氏名(自然人)のよみ仮名には法律上の規制はない、という事らしいですが、法人のよみ仮名には規制はありますか? 詳細 日本人は漢字とかなを使い分けます。 人名においては漢字の名前に対して、どのような読み仮名をあてても法規制はない、と聞きました。 ですので、昔からよく使われるのが 大 と書いて まさる、と読む とか 愛 と書いて めぐみ、と読む、とか 洋 と書いて、ひろし、と読む、とか このような当て字のような命名がよく見受けられます。 (最近はさらにパワーアップして、「キラキラネーム」と言って、アニメ人物や外国人のような読み方をする名前が流行っているようですが) 法人においてはこのような規制はないのでしょうか? たとえば、元プロ野球の選手に漢字で「芝草宇宙」と書いて「しばくさ(姓) ひろし(名)」という選手がいました。 宇宙は広いから という理由だそうですが、もしも法人名で 「株式会社 宇宙開発センター」という会社が 「かぶしきかいしゃ ひろしかいはつせんたー」 という読みだったら、かなりの人が 「こんな読み方しねえよ。普通に読んだら うちゅうかいはつせんたー だろ?」 と思う事でしょう。まあ、そんな名前をつけて損するのは会社の方だとは思いますが。 とりあえず、 自然人の命名と同じく、法人の漢字名称に、どの漢字名にどのようなよみがなを振っても構わないのか、否か、だけを教えてください。 回答の際は、根拠となる法律や判例などを付記していただけると嬉しいです。 よろしくお願いします。

  • データベース用の画像付きデータのテストデータ

    mysqlにて画像と文章を合わせたデータベースを作製しようとしているのですが、肝心のテストデータがありません。 wikipediaのような一つの記事の中に、画像、文章、関連する記事へのリンクが含まれるデータを、せめて100件程度は欲しく、探したのですがよいものが見つかりません。 例えば、 [事件名,年,事件概要,画像,関連人物データへのリンク] [人物名,年,人物概要,画像,事件データへのリンク] といったような歴史データが想定されているデータですので、あればそのようなものが一番良いです。 ですが、動作テスト用のデータなので、年のようなソート出来る要素と,画像,データベース内データへのリンクがあれば形式や内容は問いません。 wikipediaではデータの一括ダウンロードからmysqlへの取り込みがサポートされているようですが、現在肝心の画像ファイルの提供がされていないようで、今回の目的では使えません。 画像リンクは提供されているので、画像収集のプログラムを組んでクローリングさせようかとも考えましたが、クローリングは禁止されているのでそれも不可です。 どこかよいサイトまたは、テストデータの生成方法はありませんでしょうか? 書式はxmlであろうが、csvやであろうが、そのままwebページであろうが、プログラムによって抜き出しやすそうな書式であれば問題ありません。

  • エクセルのVLOOKUP関数で・・・

    3時間ほど色々頑張ったのですが、もうお手上げなので教えて下さい・・・。 エクセルでシートが2つあり、シート2から一致するデータのみをシート1に持って行きたいのです。 具体的にはシート1には「F列/カナ氏名・G列/漢字氏名・H列/顧客番号・I列/生年月日」が設定されています。 ただしH列には顧客番号が入力されていません。 シート2より生年月日をキーにして引っ張ってくる予定です。 シート1には1000件データがあり、シート2に載っている該当者が200件程ヒットする予定です。 シート2には「A列/生年月日・B列/カナ氏名・C列/漢字氏名・E列/顧客番号」が設定されています。 仮に1行目からデータが入っているものとして、シート1のH1のセルに次の式を入れました。 =VLOOKUP(I1,'シート2'!範囲,5,FALSE) 範囲には実際の範囲を指定し、5列目がシート2の生年月日なので合ってると思うのですが・・・。 エラーは#N/Aというのが出てしまいます。 何処に問題があるのか分かりません。 説明が下手かもしれませんが、分かる方教えて下さい!