顯示文章

這裡允許您檢視這個會員的所有文章。請注意, 您只能看見您有權限閱讀的文章。


文章 - oscars80

頁: 1 2 3 [4]
91
目前來說,因為這是用於統計資料,
要搜尋的檔案只會統計一次,之後就不會在去做同樣的動作了。

所以這個關連性的部分,可能沒辦法建立就是了 >"<

其實如果用於重複搜尋的話,用time stamp的方式真的很好。

不過還是感謝大大的提供^^

92
目前碰到的問題:
一個目錄裡面有一千多個檔案,然後目前我要搜尋這個目錄當中的所有檔案中,
出現的關鍵字總共有幾次(關鍵字總共有五百多種)。

本來之前的作法是把關鍵字放入mysql當中,
然後每次fread檔案然後用for迴圈去比對,
可以這樣子一方面來說太操資料庫了,另一方面效率也慢。
(程序:先mysql select => 把關鍵字寫入array => for比對)

後來改用,將關鍵字全部dump出來,變成一個變數list,
每次使用前include檔案。
這樣子可以省去mysql select的時間跟效能,
但是每次都要include一次有點小累。
加上關鍵字改變的時候,去處理那個檔案會有點累人。

現在有個想法,就是把這些關鍵字放到shm當中,
只要是重開機或有變動的時候再去改變就好了,
然後從shm拉資料出來比對。有更動就是shm砍掉再重新load...

我的疑問是,第二種方法跟第三種方法的效率來說,會相差很多嗎?
因為來源的關鍵字會成長,以及比對的檔案數量也會增加,
所以相對的效率來說看能不能增快一點這樣子,
還是說第二種方式就是最佳解了,
或者是有更快的方式可以處理這種的字串搜尋... ? @@

頁: 1 2 3 [4]