MySQL的範圍查詢:
$id_list = implode(',',$arr);$sql = "select name,id from user where id in ($id_list)";//可能還會left join連表//如果$arr數組非常大會很慢,對這種查詢如何最佳化?
回複內容:
MySQL的範圍查詢:
$id_list = implode(',',$arr);$sql = "select name,id from user where id in ($id_list)";//可能還會left join連表//如果$arr數組非常大會很慢,對這種查詢如何最佳化?
提供幾個方案:
1) 如果記憶體足夠用的話(這個表都沒有特別大),可以使用mysql的memory engine,即把查詢都放到記憶體裡就行了。memory engine可以使用hash index。
2)使用memcache或者redis作為cache,相當於每次查詢時都要multi_get一次,沒有命中的再回mysql查,可以大大的降低mysql的in後面跟的數量。查詢回來之後,再multi_set一次。如果memcache或者redis被sharding了,那麼這個效率也沒太高,因為要一個server query一部分。
3) 可以採用一些分布式key-value儲存,比如在可以訂閱或者follow種情形下,比如資料A修改了,那麼把訂閱A的全部人都非同步寫到他們自己的一個inbox裡面,那個inbox每次只要O(1)的get就OK了。在一些大V很多的地方(少數使用者的follower特別多),會把一堆followers最多的人資料單拿出來cache好用類似in的方法查詢,剩下的少的newsfeed直接塞到inbox裡,這一在儲存和時間上折中一下。
我曾經目睹過csdn的in,那一大長竄子in數字,我都被嚇尿了。
雖然我不知道這個怎麼最佳化,但我知道一般需要這個的最好考慮中間加上一層高速cache,或者乾脆將這些I/O全部放到redis中,定期寫入到資料庫。
然後,等大神怎麼回答這個問題。