摘要:登錄知乎后通過獲取模擬登錄登錄知乎
#encoding=utf8 import requests,time #登錄知乎后通過document.cookie獲取cookie cookie = "_zap=78503ecc-9420-482c-a747-5761a7c9de8c; _za=de220e47-6e79-4c2d-80c6-74a86eb567ce; _ga=GA1.2.932820854.1429357203; udid="xxxxxxxxxxx";" Default_Header = {"X-Requested-With": "XMLHttpRequest", "Referer": "http://www.zhihu.com", "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; " "rv:39.0) Gecko/20100101 Firefox/39.0", "Host": "www.zhihu.com", "Cookie":cookie} _session = requests.session() _session.headers.update(Default_Header) header = {"X-Requested-With": "XMLHttpRequest", "Referer": "http://www.zhihu.com", "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; " "rv:39.0) Gecko/20100101 Firefox/39.0", "Host": "www.zhihu.com"} url = "https://www.zhihu.com/noti7/stack/default?limit=10&r=1473558020498" cookies={} for line in cookie.split(";"): name,value=line.strip().split("=",1) cookies[name]=value #r = requests.get(url, headers=Default_Header) r = requests.get(url, headers=header,cookies=cookies) #r = _session.get(url) #print(r.content) #print(cookies) print(r.json()) #模擬登錄 def login(): """登錄知乎""" username = "xxx" password = "xxx" cap_content = _session.get("https://www.zhihu.com/captcha.gif?r="+str(int(time.time())*1000)+"&type=login").content cap_file = open("cap.gif","wb") cap_file.write(cap_content) cap_file.close() captcha = input("capture:") data = {"email":username,"password":password,"captcha":captcha} r = _session.post("https://www.zhihu.com/login/email", data) print ((r.json())["msg"])
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/38175.html
摘要:下面我們傳入多個(gè)參數(shù)構(gòu)建一個(gè)來感受一下在這里我們通過四個(gè)參數(shù)構(gòu)造了一個(gè),即請(qǐng)求,在中指定了和,傳遞的參數(shù)用了和方法來轉(zhuǎn)成字節(jié)流,另外指定了請(qǐng)求方式為。運(yùn)行結(jié)果如下通過觀察結(jié)果可以發(fā)現(xiàn),我們成功設(shè)置了,以及。用于處理重定向。 上一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---19、代理基本原理下一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---21、使用Urllib:處理異常 學(xué)習(xí)爬蟲,最初的操作便...
摘要:比如我們以知乎為例,直接利用來維持登錄狀態(tài)。測(cè)試后,發(fā)現(xiàn)同樣可以正常登錄知乎。上一篇文章網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)基本使用下一篇文章網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)正則表達(dá)式 上一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---24、requests:基本使用下一篇文章:Python3網(wǎng)絡(luò)爬蟲實(shí)戰(zhàn)---26、正則表達(dá)式 在前面一節(jié)我們了解了 Requests 的基本用法,如基本的 GET、POST 請(qǐng)求以及 Response...
摘要:爬蟲和反爬蟲就是一個(gè)貓和老鼠的游戲,道高一尺魔高一丈,兩者反復(fù)糾纏。由于協(xié)議的無狀態(tài)性,登錄驗(yàn)證都是通過傳遞來實(shí)現(xiàn)的。通過瀏覽器登錄一次,登錄信息的是就會(huì)被瀏覽器保存下來。模塊就是這樣一個(gè)從瀏覽器提取保存的的工具。 showImg(https://segmentfault.com/img/bVbsjnC?w=741&h=488); 很多用Python的人可能都寫過網(wǎng)絡(luò)爬蟲,自動(dòng)化獲取網(wǎng)...
摘要:前言利用實(shí)現(xiàn)抓取微博評(píng)論數(shù)據(jù),廢話不多說。讓我們愉快地開始吧開發(fā)工具版本相關(guān)模塊模塊模塊模塊模塊模塊以及一些自帶的模塊。環(huán)境搭建安裝并添加到環(huán)境變量,安裝需要的相關(guān)模塊即可。 ...
摘要:所以只要得到登錄后的并必要時(shí)進(jìn)行更新,服務(wù)器就會(huì)認(rèn)定其為登錄狀態(tài)。看看人家知乎,加密到連名字都沒有了,還混淆,如何下手綜上,適用于沒有加密的登錄或者加密算法比較簡單并且不常更新的網(wǎng)站。遇上無解的加密算法要么手操拷貝,要么請(qǐng)大佬出場(chǎng)。 某些網(wǎng)站,登錄和沒登錄,用戶的權(quán)限是不一樣的,帳號(hào)登錄之后才能獲取更多的信息。更有甚者一上來就是登錄界面,不登錄就不給你進(jìn)去(如p站)。爬取目標(biāo)不用登錄固...
閱讀 2368·2021-11-18 10:07
閱讀 2318·2021-09-22 15:59
閱讀 3077·2021-08-23 09:42
閱讀 2276·2019-08-30 15:44
閱讀 1191·2019-08-29 15:06
閱讀 2303·2019-08-29 13:27
閱讀 1210·2019-08-29 13:21
閱讀 1412·2019-08-29 13:13