作者 主題: 海量資料的疑問  (閱讀 727 次)

0 會員 與 1 訪客 正在閱讀本文。

dark

  • 俺是博士!
  • *****
  • 文章數: 1481
    • 檢視個人資料
海量資料的疑問
« 於: 2015-12-09 18:34 »
小弟猜想 ..
目前網路上的空間 (如百度等)
所存放的檔案依據 MD5 編碼做為索引
抓 BT 或別人檔案就只是加入 link

應該是如此吧 ?

那是否有不同檔案類型的分類呢 ?
(如文件放在文件主機/壓縮磁區 .. 如此猜測不知對否 ?)


若以上猜測正確 ...
那 MD5 雖不可逆 , 但卻可能發生碰撞
目前全球的資料量 , 理當超過 16^43 了吧 ?

就算加上檔案標頭辨識 ... 光只純文字檔 , 有天也會達標吧 ?


有點杞人憂天 ... 但 , 冥王星近照不也花九年  ;)

twu2

  • 管理員
  • 俺是博士!
  • *****
  • 文章數: 5363
  • 性別: 男
    • 檢視個人資料
    • http://blog.teatime.com.tw/1
Re: 海量資料的疑問
« 回覆 #1 於: 2015-12-15 09:33 »
md5 嗎? 還是 sha1? tth?
看資料 md5 是 2^128, sha1 是 2^160. tth 好像有 128/160/192 三種版本.

以 magnet link 來看... 是可以加上其他參數, 也許實際儲存時, 也加上那些參數.
如果有加上檔案大小來看, 就幾乎很難碰撞了.