技術討論區 > Python程式設計討論區

求救:urllib2 進不了網站(非普級網站,如有不恰當請刪除)

(1/1)

sj2018:
我的script:

def get_jlib_url(code):
    req = urllib2.Request("http://www.javlibrary.com/en/vl_searchbyid.php?keyword=" + code, headers={'User-Agent' : "Magic Browser"})
    html = urllib2.urlopen(req)
    time.sleep(wait_time)

試圖進入http://www.javlibrary.com

出現錯誤:

HTTPError: HTTP Error 503: Service Temporarily Unavailable

請問要怎麼bybass 網站的browser checking?



asako:
User-Agent 改成 IE ?

dark:
http://www.javlibrary.com/en/vl_searchbyid.php?keyword=
只是一個中繼頁面
最後出現的頁面
http://www.javlibrary.com/en/?v=javl123456
後面 6 碼 , 就是 vl_searchbyid.php 中的 javascript 運算結果

研究那段 javascript 就能知道 keyword => 123456 是怎麼做的
不過小弟解不出來 ...
丟給 phantomjs 也沒跑出來

不過 phantomjs 跑 4 秒(那頁中setTimeout=4000)
卻跟等待其他秒數結果不同 , 多出另一個中繼頁面

有時間的話再來猜猜看什麼手法 ...

dark:
http://blog.zengrong.net/post/2366.html

有空再來研究 ... 您先加油

導覽

[0] 文章列表

前往完整版本