酷!學園

其他討論區 => 雜七雜八 => 主題作者是: dark 於 2015-12-09 18:34

主題: 海量資料的疑問
作者: dark2015-12-09 18:34
小弟猜想 ..
目前網路上的空間 (如百度等)
所存放的檔案依據 MD5 編碼做為索引
抓 BT 或別人檔案就只是加入 link

應該是如此吧 ?

那是否有不同檔案類型的分類呢 ?
(如文件放在文件主機/壓縮磁區 .. 如此猜測不知對否 ?)


若以上猜測正確 ...
那 MD5 雖不可逆 , 但卻可能發生碰撞
目前全球的資料量 , 理當超過 16^43 了吧 ?

就算加上檔案標頭辨識 ... 光只純文字檔 , 有天也會達標吧 ?


有點杞人憂天 ... 但 , 冥王星近照不也花九年  ;)
主題: Re: 海量資料的疑問
作者: twu22015-12-15 09:33
md5 嗎? 還是 sha1? tth?
看資料 md5 是 2^128, sha1 是 2^160. tth 好像有 128/160/192 三種版本.

以 magnet link 來看... 是可以加上其他參數, 也許實際儲存時, 也加上那些參數.
如果有加上檔案大小來看, 就幾乎很難碰撞了.