摘要:作為爬蟲(chóng)的入門教程,我想有必要來(lái)個(gè)爬蟲(chóng)程序壓壓驚,爬取性感美女的圖片,然后保存到自己的電腦里面。爽歪歪先看下效果吧,這是我把爬取的圖片自動(dòng)存儲(chǔ)到的文件夾里邊爬蟲(chóng)三步驟抓取,分析,存儲(chǔ)。相關(guān)文章入門基礎(chǔ)有趣的教程
作為 Python 爬蟲(chóng)的入門教程,我想有必要來(lái)個(gè)爬蟲(chóng)程序壓壓驚,爬取性感美女的圖片,然后保存到自己的電腦里面。爽歪歪~
先看下效果吧,這是我把爬取的圖片自動(dòng)存儲(chǔ)到的文件夾里邊:
爬蟲(chóng)三步驟:抓取,分析,存儲(chǔ)。
抓取首先我們要有個(gè)目標(biāo)對(duì)吧,我們想要抓取美女照片,就去找找看哪里的網(wǎng)站妹紙多,那咱們就從哪里下手唄。
我發(fā)現(xiàn)這網(wǎng)站 http://www.meizitu.com 的妹紙圖不錯(cuò)啊,那還等什么,抓取唄。
在 python 中有個(gè)叫做 requests 模塊,直接 pip install 就可以了,然后訪問(wèn)這個(gè)網(wǎng)址獲取相應(yīng)的源碼:
response = requests.get(url) return response
比如我想獲取性感美女的源碼,那么我的 url 就是 http://www.meizitu.com/a/sexy... 通過(guò)get請(qǐng)求我們就可以獲取返回的響應(yīng)體了,我們通過(guò)response.text就可以或源碼。部分源碼截圖如下:
分析抓取完了之后,我們對(duì)我們感興趣的內(nèi)容要進(jìn)行分析了,這時(shí)候就涉及到「正則表達(dá)式」,根據(jù)我們定義的一些規(guī)則,來(lái)獲取我們想要的內(nèi)容。
我們現(xiàn)在當(dāng)然是對(duì)返回源碼中的美女圖片感興趣啦,從返回的源碼中就可以看到,美女的圖片都是包裹在 img 標(biāo)簽中的:
那么我們就可以用 re 模塊來(lái)匹配獲取我們想要的圖片鏈接了:
p = r"獲取到的部分圖片鏈接截圖:
存儲(chǔ)既然獲取到圖片鏈接了,那么接下來(lái)就可以存儲(chǔ)了,這里暫時(shí)存儲(chǔ)到自己本地電腦上吧:
with open(filename,"wb") as f: img = url_open(each).content f.write(img)ok,這樣就完成了,是不是很簡(jiǎn)單?當(dāng)然爬蟲(chóng)說(shuō)簡(jiǎn)單也簡(jiǎn)單,說(shuō)復(fù)雜也復(fù)雜,關(guān)鍵是要看自己想做什么事情,如果你從這個(gè)例子中發(fā)現(xiàn)自己對(duì) python 又多了些許興趣,那不妨多關(guān)注我,我往后給你寫(xiě)一些 python爬蟲(chóng) 所需要的知識(shí)點(diǎn),例如其它的爬蟲(chóng)模塊如Scrapy ,一些表單的請(qǐng)求參數(shù),反爬蟲(chóng),cookie,多進(jìn)程抓取等等。
專門為 Python 開(kāi)了個(gè)公眾號(hào):學(xué)習(xí)python的正確姿勢(shì) ,在里面發(fā)送 「meizi」獲取抓美女的源代碼吧。
不說(shuō)了,我再去抓取多一點(diǎn)美女的圖片了。
相關(guān)文章python3入門基礎(chǔ)有趣的教程
Categories: python
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/42711.html
摘要:很多人學(xué)習(xí)爬蟲(chóng)的第一驅(qū)動(dòng)力就是爬取各大網(wǎng)站的妹子圖片,比如比較有名的。最后我們只需要運(yùn)行程序,即可執(zhí)行爬取,程序運(yùn)行命名如下完整代碼我已上傳到微信公眾號(hào)后臺(tái),在癡海公眾號(hào)后臺(tái)回復(fù)即可獲取。本文首發(fā)于公眾號(hào)癡海,后臺(tái)回復(fù)即可獲取最新編程資源。 showImg(https://segmentfault.com/img/remote/1460000016780800); 閱讀文本大概需要 1...
摘要:爬蟲(chóng)入門聽(tīng)說(shuō)你寫(xiě)代碼沒(méi)動(dòng)力本文就給你動(dòng)力,爬取妹子圖。分別進(jìn)入每個(gè)套圖中去,下載相應(yīng)的圖片。最大線程數(shù)設(shè)置為正在下載頁(yè)好了,之后運(yùn)行,我們的爬蟲(chóng)就會(huì)孜孜不倦的為我們下載漂亮妹子啦。 Python 爬蟲(chóng)入門 聽(tīng)說(shuō)你寫(xiě)代碼沒(méi)動(dòng)力?本文就給你動(dòng)力,爬取妹子圖。如果這也沒(méi)動(dòng)力那就沒(méi)救了。 GitHub 地址: https://github.com/injetlee/Python/blob/ma...
摘要:為了寫(xiě)好爬蟲(chóng),我們需要準(zhǔn)備一個(gè)火狐瀏覽器,還需要準(zhǔn)備抓包工具,抓包工具,我使用的是自帶的,加上,這兩款軟件的安裝和使用,建議你還是學(xué)習(xí)一下,后面我們應(yīng)該會(huì)用到。 妹子圖網(wǎng)站----前言 從今天開(kāi)始就要擼起袖子,直接寫(xiě)Python爬蟲(chóng)了,學(xué)習(xí)語(yǔ)言最好的辦法就是有目的的進(jìn)行,所以,接下來(lái)我將用10+篇的博客,寫(xiě)爬圖片這一件事情。希望可以做好。 為了寫(xiě)好爬蟲(chóng),我們需要準(zhǔn)備一個(gè)火狐瀏覽器,還需...
摘要:為了寫(xiě)好爬蟲(chóng),我們需要準(zhǔn)備一個(gè)火狐瀏覽器,還需要準(zhǔn)備抓包工具,抓包工具,我使用的是自帶的,加上,這兩款軟件的安裝和使用,建議你還是學(xué)習(xí)一下,后面我們應(yīng)該會(huì)用到。 妹子圖網(wǎng)站----前言 從今天開(kāi)始就要擼起袖子,直接寫(xiě)Python爬蟲(chóng)了,學(xué)習(xí)語(yǔ)言最好的辦法就是有目的的進(jìn)行,所以,接下來(lái)我將用10+篇的博客,寫(xiě)爬圖片這一件事情。希望可以做好。 為了寫(xiě)好爬蟲(chóng),我們需要準(zhǔn)備一個(gè)火狐瀏覽器,還需...
閱讀 3807·2023-04-25 19:07
閱讀 3553·2021-11-22 12:02
閱讀 3138·2021-10-12 10:11
閱讀 3907·2021-09-03 10:49
閱讀 2891·2019-08-30 13:21
閱讀 2997·2019-08-30 11:14
閱讀 2088·2019-08-29 15:40
閱讀 2872·2019-08-28 18:29