資料庫
全是 IP區間 我查詢喲個IP 的的歸屬地,有什麼好的方式,主要是資料庫有400多萬條資料,要不要用緩衝?
回複內容:
資料庫
全是 IP區間 我查詢喲個IP 的的歸屬地,有什麼好的方式,主要是資料庫有400多萬條資料,要不要用緩衝?
mysql> select inet_aton("127.0.0.1");+------------------------+| inet_aton("127.0.0.1") |+------------------------+| 2130706433 |+------------------------+1 row in set (0.00 sec)mysql> select inet_aton("127.0.0.255");+--------------------------+| inet_aton("127.0.0.255") |+--------------------------+| 2130706687 |+--------------------------+1 row in set (0.00 sec)
我想你看到上面的就知道大概要怎麼做了,不過我們的ip資料一般都直接存為無符號整形的,並且對ip欄位建索引,因此400萬條資料查詢毫無壓力。
1:資料庫方式。由於你的資料本身就是排好序的,所以只要將StartIP按256進位的方式轉化為10進位整數然後存入建立的一列中,並對該列加索引。當要求某個ip歸屬地時將該ip轉化為數字然後 Select * from table where IPBase10
2:二叉樹。就是自己建平衡樹然後尋找。400多萬條資料不算多,記憶體放的下。
3:歸併。適用於你有極大量ip需要同時確認歸屬地。只需要對歸屬地資訊數組A和待查詢ip數組B進行歸併即可,歸併的過程中即可確定歸屬地,在大量資料下效率高於上面兩張。時間複雜度為O(NlogN)+O(MN),前面為對數組B排序,後面為歸併。
可以下載純真ip庫,安裝後複製出安裝資料夾裡的qqwry.dat, 網上找個php調用樣本直接調用,以後更新ip庫也方便。
http://segmentfault.com/blog/joyqi/1190000000352578
http://www.ipip.net/
為什麼不使用ip2long