MySqlでのデータソートについて

2023/09/05 19:22

このQ&Aのポイント

MySqlでのデータソートにおいて、EXPLAINの結果で「Extra: Using where; Using filesort」が発生する問題について解決方法を探っています。
現在のテーブル構造では、複合インデックスを使用せずに「Using filesort」を発生させなくする方法を模索しています。
テーブル全体のデータが1億件であり、1userあたり100～200件を想定しています。

ベストアンサー

MySqlでのデータソートについて

2014/04/17 16:59

MySqlバージョン：5.1.61で、下記のSQLを実行すると、１件しかデータが無いにも関わらず、EXPLAINの結果で「Extra: Using where; Using filesort」が発生します。 ---------------- CREATE TABLE IF NOT EXISTS tbl ( user int(11) NOT NULL, item int(11) NOT NULL, prm1 int(11) NOT NULL, prm2 int(11) NOT NULL, prm3 int(11) NOT NULL, PRIMARY KEY (user,item) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO tbl (user,item,prm1,prm2,prm3) VALUES (1,1,10,10,10); EXPLAIN SELECT * FROM tbl WHERE user=1 ORDER BY prm1; EXPLAIN SELECT * FROM tbl WHERE user=1 ORDER BY prm2; EXPLAIN SELECT * FROM tbl WHERE user=1 ORDER BY prm3; ---------------- ORDER BY句で使用する項目(prm[n])は10項目以上になりますので 10件を超える複合インデックスを張る事は避けたいと考えております。また、tbl全体のデータは1億件、1userあたり100～200件を想定しています。複合インデックスを使用せず「Using filesort」を発生させなくする事はできるのでしょうか？

ootasuke
お礼率0% (0/3)

MySQL
回答数3
ありがとう数0

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

maiko0318
ベストアンサー率21% (1483/6970)

2014/04/17 19:34 回答No.3

＞10数件のインデックスを張ったテーブルは普通に運用できるものなのでしょうか……？＞または、「Using filesort」は大きな問題ではないと考えたほうがよいのでしょうか？インデックスを貼るとデータの追加、削除のスピードは落ちます。よって検索と更新、どちらを頻繁にするかということも関連してきます。私が持っているデータで言えば、２０年前のアメリカ某大手の大型コンピュータで１万件をソートして５０秒というのがありました。顧客が電話で問い合わせてくるものに対してデータを表示するソフトでしたので、５０秒は待てないと言われました。問い合わせのパターンを絞ってもらってインデックスを１０個作成して検索したら３秒になりました。サーバーの処理能力にもかかってきますが、１億件を考えるとテストで打ち込んでもタイムアウトするか、しばらくそのサーバーを専有してしまうかもしれません。（他のすべての処理を止めかねない）

質問者

補足 2014/04/17 21:12

ご回答、ありがとうございます。検索が多くなりがちになりますが、更新もそれなりに頻繁に行うことになると思います。現在、テスト環境で、総データ約1千万、1user約100件のテーブルを作成しテストしていますが、「Using where; Using filesort」は出るものの、約0.001秒で応答が返ってきています。 ---------------- EXPLAIN実行結果　id: 1 　select_type: SIMPLE 　table: tbl 　type: ref 　possible_keys: ref 　key: PRIMARY 　key_len: 4 　ref: const 　rows: 96 　Extra: Using where; Using filesort ---------------- サーバーの性能や、ユーザー数・同時接続数等を見つつ調整を行っていくしかないかなと、ひとまず納得する事にいたしました。

その他の回答 (2)

yambejp
ベストアンサー率51% (3827/7415)

2014/04/17 17:21 回答No.2

where句に利用するカラムとorder by句で利用するカラムを複合インデックスしないと order by にインデックスは利用されません。 https://dev.mysql.com/doc/refman/5.1/ja/order-by-optimization.html 今回の命題であれば 10個のカラムにまたがるインデックスではなく userとprm1,userとprm2,・・・という感じで個別に貼っていけばよいでしょう

質問者

補足 2014/04/17 19:05

早速のご回答、誠にありがとうございます。「10件を超える複合インデックスを張る事は避けたい」とは、下記の様な大量のインデックスを作成する事を避けたいという旨のつもりでした。 ---------- ALTER TABLE tbl ADD INDEX idx1(user,prm1); ALTER TABLE tbl ADD INDEX idx2(user,prm2); 　… ALTER TABLE tbl ADD INDEX idx[n](user,prm[n]); ---------- 理由は、INSERT,UPDATEのパフォーマンスの低下を懸念しての事です。とはいえ、いろいろ調べてみても、インデックスの張りすぎはパフォーマンスの低下をまねくとしか書かれておらず、具体的にどの程度の負荷となるかは分かっていません。 10数件のインデックスを張ったテーブルは普通に運用できるものなのでしょうか……？または、「Using filesort」は大きな問題ではないと考えたほうがよいのでしょうか？こちらも、いろいろなサイトで避けるべき項目として記載されていましたので。

maiko0318
ベストアンサー率21% (1483/6970)

2014/04/17 17:12 回答No.1

できません。ORDER BY 句に従ってインデックスが必要になります。インデックスを張って事前にソートしておくか、はらずに実行時にソートするかの２択です。

関連するQ&A

EXPLAINのUsing filesortについて
explain select * from address where area =1 order by id desc limit 10,1\G 上記クエリーをexplainで確認すると Extra: Using where; Using filesort が表示されてしまいます。 1. Using filesortを消したいのですが、idを降順で表示するのに order by id desc 以外の方法はありますか？このような場合、Using filesortは仕方ないのでしょうか？ 2. Using whereは効率の悪いクエリーの要素になるのでしょうか？
- ベストアンサー
- MySQL
sqlplusの処理が途中でとまる
oracle10gを使用しています。 sqlplusでいくつかのDDLとDMLを一度にコピーペーストで流しました。一つ一つの処理後にcommit;も入っています。しかし、最後のDMLで処理がとまってしまい、エラーもでません。内容は以下のようになっています。 insert into tbl_a (select distinct col1,'2006/01/01' from tbl_b where col1 is not null union select distinct col2,'2006/01/01' from tbl_b where col2 is not null union select distinct col3,'2006/01/01' from tbl_b where col3 is not null union select distinct col4,'2006/01/01' from tbl_b where col4 is not null union select distinct col5,'2006/01/01' from tbl_b where col5 is not null union select distinct col6,'2006/01/01' from tbl_b where col6 is not null); COMMIT; この処理を単独で実行すると、成功します。sqlpulsは、実行コマンドの量に制限などあるのでしょうか？なぜ、このようになるかわかりません。ちなみに、コマンドの全文字数は3990目で、処理が停止するのは、3648文字目です。この3648文字目にあたるのが、上記の >select distinct col3,'2006/01/01' の >select disti です。大変急を要ししています。よろしくお願いします。
- ベストアンサー
- Oracle
シンプルなＳＱＬの書き方がわかりません。
以下のＳＱＬをシンプルに一つにしたいのですが、どのように書いたらよろしいでしょうか？どうぞご返答頂けますようお願い申し上げます。 --test1_tblの抽出 select a1 as a1, b1 as b1 from a_tbl where c=1 --test2_tblの抽出 select a1 as a1, e1 as e1 from b_tbl where rowid in (select min(rowid) from ee group by a1) and a1 is not null and a1 !=' ' order by a1 --test1_tblとtest2tblの結合 select t0.a1 as a1, t0.b1 as b1, t1.e1 as e1 FROM test1_tbl t0, test2_tbl t1 WHERE (t0.a1 = t1.a1)
- ベストアンサー
- Oracle
MySQLでJOINを使った検索について
MySQLについて質問があります。下記のような2テーブルがあります。 ----------------------------- ・item 商品情報を格納。・usersitem ユーザーが所有している商品の個数を格納。 ----------------------------- この２つのテーブルから２つのリストを取り出したいと考えています。【Ａ】特定のユーザーが複数所有している商品の一覧【Ｂ】特定のユーザーが所有していない商品の一覧【Ａ】は出来たのですが、【Ｂ】のSQL文がわかりません。どうかご教授いただけませんでしょうか。 ■テーブルを作成したSQL ----------------------------- CREATE TABLE `test`.`item` ( `itemid` SERIAL NOT NULL DEFAULT NULL UNIQUE, `itemname` VARCHAR( 256 ) ); CREATE TABLE `test`.`usersitem` ( `id` SERIAL NOT NULL DEFAULT NULL UNIQUE, `userid` INT, `itemid` INT, `count` INT ); ----------------------------- ■【Ａ】を実現したSQL 条件：userid「1」のユーザーがcount「2」以上の一覧。 ----------------------------- SELECT * FROM `item` LEFT JOIN `usersitem` ON (`item`.`itemid` = `usersitem`.`itemid`) WHERE `usersitem`.`userid` = 1 AND `usersitem`.`count` >= 2 ----------------------------- ■【Ｂ】を実現しようとしたが違っていたSQL 条件：userid「1」のユーザーがcount「0」以下、または登録されていない一覧。 ----------------------------- SELECT * FROM `item` LEFT JOIN `usersitem` ON (`item`.`itemid` = `usersitem`.`itemid`) WHERE ( `usersitem`.`userid` = 1 AND `usersitem`.`count` <= 0 ) OR `usersitem`.`userid` != 1 ----------------------------- 結果：個数情報が登録されていない商品が表示されない。違うユーザーの情報が表示されてしまう。使用しているのは MySQL 5.5.29です。よろしくお願いいたします。
- 締切済み
- その他(ソフトウェア)
★年度ごとに情報を一覧表示
各情報を、年度ごとに表示したいと考えています。基となる年度の条件指定方法が分かりません。（？？？？と記述しているところです。）各サブクエリは、年度ごとに情報がない時もあります。 select ？？？？,1tbl.day ,2tbl.day ,3tbl.day from 　(select nen,max(day) from 1tbl 　where　nen < '2006' and nen > '2001' 　group by nen 　order by nen desc ) 1tbl, 　(select nen,max(day) from 2tbl 　where　nen < '2006' and nen > '2001' 　group by nen 　order by nen desc ) 2tbl, 　(select nen,max(day) from 3tbl 　where　nen < '2006' and nen > '2001' 　group by nen 　order by nen desc ) 3tbl where ？？？？各サブクエリの情報 1tbl－－－－－－－2tbl－－－－－－3tbl－－－－－－－ nen－－day－－－－nen－－day－－－－nen－－day－－－ 2005－2005/12/12－2005－2005/12/13－－－－－－－－－－－－－－－－－－2004－2004/11/10－2004－2004/12/30 2002－2002/09/01－－－－－－－－－－－－－－－－－－表示 nen－－1day－－－－－2day－－－－－3day－－－ 2006－－－－－－－－－－－－－－－－－－－－ 2005－2005/12/12－－2005/12/13－－－－－－－ 2004－－－－－－－－2004/11/10－－2004/12/30 2003－－－－－－－－－－－－－－－－－－－－ 2002－2002/09/01－－－－－－－－－－－－－－ 2001－－－－－－－－－－－－－－－－－－－－ ↑上記のように表示したいと考えています。この形で取れるSQLの書き方はあるでしょうか。（2006年や2003年のように、情報が０件のところは取れなくてもいいです。）サブクエリ部分をばらばらでSQL発行すれば済む話なのですが、一度に取れる方法は無いのか気になりまして。（年度のみのテーブルはありません。）よろしくお願いします。
- ベストアンサー
- Oracle
ハッシュ値のパスワードMYSQL検索で一致しない
PHPでMYSQLにハッシュ値にしたパスワードを登録して、同じハッシュ値で検索を行いましたが、どうしても検索結果で一致しません。パスワードの文字列をMD5を使ってハッシュ値に変換して次のようにMYSQLに登録しました。 $email = htmlspecialchars($_POST["email"]); $user_name = htmlspecialchars($_POST["user_name"]); $password = md5(htmlspecialchars($_POST["password"])); $sql = 'INSERT INTO user_tbl (email,user_name,password) VALUES ( "' . $email . '","' . $user_name . '","' . $password . '" )'; $sth = $dd->prepare($sql); $sth->execute( array() ); $qid = $dd->lastInsertId(); ※user_tblの定義のこんな感じにしてあります。 CREATE TABLE user_tbl ( email varchar(50) NOT NULL, user_name varchar(20) NOT NULL, password VARCHAR(50) NOT NULL ); 検索する処理でSQL等は次のように処理しましたが、検索結果がゼロ件でした。 $email = htmlspecialchars($_POST["email"]); $beforepass = md5(htmlspecialchars($_POST["beforepass"])); $afterpass = md5(htmlspecialchars($_POST["afterpass"])); $sql = 'SELECT count(password) FROM user_tbl WHERE email = "' . $email . '" and password = "' . $beforepass . '"'; $q = $dd->prepare( $sql ); $q->execute(); if($q->fetchColumn() == 1){ //ここでパスワードが一致した場合の処理を書く } そこで次の2パターンのようにSQL文を少し変えてみたらそれぞれの検索結果が1件でした。 $sql = 'SELECT count(password) FROM user_tbl WHERE email = "' . $email . '" and password = "' . $beforepass . '"'; 　　　　　　　　　　　　　　　　　　　　↓ $sql = 'SELECT count(password) FROM user_tbl WHERE email = "' . $email . '"'; $sql = 'SELECT count(password) FROM user_tbl WHERE email = "' . $email . '" and password = "' . $beforepass . '"'; 　　　　　　　　　　　　　　　　　　　　↓ $sql = 'SELECT count(password) FROM user_tbl WHERE email = "' . $email . '" and user_name = "tanaka"'; （MYSQLのuser_tblのuser_nameには'tanaka'と入っている状態で実行したものです） SQLに渡される各変数には文字列が代入済みであることが確認できています。 MD5でハッシュ化した文字列同士を比較してどうして検索結果が一致しないのでしょうか？ちなみに検索したいパスワードのハッシュ値とDBに格納されているパスワードのハッシュ値を目で比較したら一致していました。以上です。ハッシュ値を検索条件に入れる場合に特殊な事をするのでしょうか？ヒントだけでもよいので教えて下さい。宜しくお願いします。 os: windows 7 eclipse: Version: 4.2.0 Build SDK: Android 4.1(API 16) PHP 5
- ベストアンサー
- PHP
UNION / UNION ALL 時のORDER BY について
初めて質問させていただきます。表A(以下,TBL_A) と表B(以下,TBL_B)があり,表名が異なるだけでカラムの項目数,データ型は一致していてそれぞれ [TBL_A] SELECT * FROM TBL_A ORDER BY 1, 2 [TBL_B] SELECT * FROM TBL_B ORDER BY 2, 1 を UNION / UNION ALL したいのですが,上記のように ORDER BY が異なっている場合にはどのようにすればいいのでしょうか? 苦戦中の成果物としてはそれぞれに固有の区分カラムを設け, その区分で判断し DECODE で ORDER BY しようとしたのですが「"右カッコがありません"」と出て行き詰っています。 SELECT 区分, ○○, □□ FROM TBL_A WHERE ○○ = ??? UNION ALL (SELECT 区分, ○○, □□ FROM TBL_B) ORDER BY 区分, DECODE(区分,A,(1,2),B,(2,1)) 宜しくお願いします。
- 締切済み
- Oracle
★Mysql 同じ条件で●●から同じ数だけ抽出！
SELECT * FROM `table` WHERE `abc`=1 and `def`=3 and GROUP BY ●● order by rand(); この条件なら、●●が1件ずつ計30件が抽出されます。が、私がやりたいのは、●●から3件ずつで、 3×30＝90件　抽出したいです。一文でできるのでしょうか？初心者ですみません。よろしくお願いします。
- 締切済み
- MySQL
別テーブルのカラムを利用してソートしたい
別テーブルのカラムを利用してソートしたい MySQLバージョン4.1.16を使用しています。テーブル「tbl1」をテーブル「tbl2」のcountというカラムを利用してソートしたいのですが、どのようなSQL文になるのでしょうか？「tbl2」のidというカラムは外部キーで「tbl1」のidと関係しています。テーブル「tbl1」 +------+---------+ |　　　id |　　userid　　| +------+---------+ |　　1　　|　tanaka　　| |　　2　　|　sato　　　| +------+---------+ テーブル「tbl2」 +------+---------+ |　　　id |　　count　　| +------+---------+ |　　1　　|　　　10　　| |　　2　　|　　　3　　　| +------+---------+ 次のような文かなと思ったのですが、エラーが返ってきます・・・ SELECT * FROM tbl1 ORDER BY (SELECT id FROM tbl2 ORDER BY count)
- ベストアンサー
- MySQL
Using temporary; Using filesort を回避したい
はじめまして。よろしくお願いします。下記の場合、Using temporary; Using filesort を回避するにはどうしたらよいでしょうか。次の 2 つのテーブルがあります。 CREATE TABLE `test1` ( `f1` int(11) NOT NULL, `f2` int(11) NOT NULL, PRIMARY KEY (`f1`,`f2`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `test1` VALUES ('1', '2'); INSERT INTO `test1` VALUES ('1', '3'); INSERT INTO `test1` VALUES ('1', '4'); INSERT INTO `test1` VALUES ('2', '1'); INSERT INTO `test1` VALUES ('2', '3'); CREATE TABLE `test2` ( `f1` int(11) NOT NULL, `f2` varchar(20) default NULL, `f3` varchar(20) default NULL, PRIMARY KEY (`f1`), KEY `ix_f2_f3` (`f2`,`f3`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `test2` VALUES ('1', 'A', 'a'); INSERT INTO `test2` VALUES ('2', 'B', 'b'); INSERT INTO `test2` VALUES ('3', 'C', 'c'); INSERT INTO `test2` VALUES ('4', 'D', 'd'); 次の SELECT を実行すると Using temporary; Using filesort が現れてしまいます。 explain select test2.f2, test2.f3 from test1, test2 where test1.f1 = 1 and test1.f2 = test2.f1 order by test2.f2, test2.f3; order by ... をなくすと問題ないのですが、ソートは必要です。複数のキーに対してORDER BYを実行する場合インデックスを使用できないとあるので ix_f2_f3 は使用されず Using filesort となるのはわかるのですが、 Using temporary となる理由と回避方法がわかりません。ご教示よろしくおねがいいたします。
- 締切済み
- MySQL

MySqlでのデータソートについて

MySqlでのデータソートについて