摘要:是這樣的有一次想要斗圖配圖就在網(wǎng)上搜索表情包然后發(fā)現(xiàn)了一個(gè)表情巨多的網(wǎng)站不小心動(dòng)起了邪念產(chǎn)生了興趣那就把它們存下來吧用請(qǐng)求了一下發(fā)現(xiàn)這個(gè)網(wǎng)站沒有做反爬發(fā)現(xiàn)這里有的頁面簡(jiǎn)單的切換一下頁面可以發(fā)現(xiàn)第一頁的鏈接是這樣的所以以此類推構(gòu)建一下所有這樣
是這樣的
有一次想要斗圖
配圖
就在網(wǎng)上搜索表情包
然后發(fā)現(xiàn)了一個(gè)表情巨多的網(wǎng)站
不小心動(dòng)起了邪念
產(chǎn)生了興趣
那就
把它們存下來吧
用 requests 請(qǐng)求了一下
發(fā)現(xiàn)這個(gè)網(wǎng)站沒有做反爬
發(fā)現(xiàn)這里有 4k+ 的頁面
簡(jiǎn)單的切換一下頁面
可以發(fā)現(xiàn)
第一頁的鏈接是這樣的
https://fabiaoqing.com/biaoqi...
所以以此類推
構(gòu)建一下所有url
_url = "https://fabiaoqing.com/biaoqing/lists/page/{page}.html"
這樣我們就可以得到所有表情包的鏈接了
我們來看一下頁面里面的信息
在這里
我們只需要圖片的地址和圖片的名稱即可
所以我們只要獲取到每個(gè)頁面的
所有 img 標(biāo)簽就可以了
可以使用??BeautifulSoup?根據(jù)類名獲取
response = requests.get(url)
拿到了頁面里面的所有 img
那么就可以獲取每個(gè)圖片的地址和名稱
從而下載到我們想要的位置
for img in img_list:
至此
幾行代碼就搞定了
大家在學(xué)python的時(shí)候肯定會(huì)遇到很多難題,以及對(duì)于新技術(shù)的追求,這里推薦一下我們的Python學(xué)習(xí)扣qun:784,758,214,這里是python學(xué)習(xí)者聚集地!
先來測(cè)試一下
下載一個(gè)頁面的圖片
可以發(fā)現(xiàn)
每張圖片都獲取到了
效果還行
不過
要下載那么多張表情包的話
這樣寫的代碼有點(diǎn)慢了
還是開啟多線程吧
對(duì)于這種 IO 操作
還是能加快不少下載時(shí)間的
queue = Queue()
在這里創(chuàng)建了?DownloadBiaoqingbao 這個(gè)線程類
然后創(chuàng)建 10 個(gè)線程
把 url 添加到隊(duì)列中
來運(yùn)行一下
這時(shí)候文件夾就寫入表情包啦
經(jīng)過一段時(shí)間
小帥b的文件夾就存滿了各種表情包了哈哈哈
誰敢跟我斗圖
我就砸死他
不過呢
有個(gè)問題
文件夾里面的圖片太多了
需要檢索一下才行
比如我們要找到關(guān)于
小老弟
的表情包
那么我們可以使用?
glob
import glob for name in glob.glob("/home/wistbean/biaoqingbao/*小老弟*.*"): print(name)
通過 * 這個(gè)符號(hào)進(jìn)行模糊匹配
運(yùn)行一下可以得到所有含有“小老弟”的表情包
到這里
已經(jīng)有了大量的表情包
也可以通過關(guān)鍵詞檢索到表情包了
那么如何進(jìn)一步用到微信來呢
嘿嘿,我得意的笑
開下腦洞
我們使用微信的接口和 python 對(duì)接一下
比如
我發(fā)送給我的微信說
我要關(guān)于沙雕的表情包,發(fā) 6 張來
這個(gè)時(shí)候
python接收到指令
然后就去檢索表情包
發(fā)送回我的微信
可以使用 itchat 這個(gè)模塊
使用網(wǎng)頁版微信的方式登錄
itchat.auto_login(hotReload=True) itchat.run()
運(yùn)行這段代碼可以得到二維碼
掃一下就可以登錄進(jìn)去操作微信了
接著就可以根據(jù)小帥b發(fā)送過來的關(guān)鍵詞
進(jìn)行文件搜索
imgs = [] def searchImage(text): print("收到關(guān)鍵詞: ", text) for name in glob.glob("/home/wistbean/biaoqingbao/*"+text+"*.jpg"): imgs.append(name) 大家在學(xué)python的時(shí)候肯定會(huì)遇到很多難題,以及對(duì)于新技術(shù)的追求,這里推薦一下我們的Python學(xué)習(xí)扣qun:784758214,這里是python學(xué)習(xí)者聚集地!
然后就可以在回復(fù)微信的時(shí)候發(fā)送圖片給自己了
在這里就給自己發(fā)前 6 張圖片吧
@itchat.msg_register([PICTURE, TEXT]) def text_reply(msg): searchImage(msg.text) for img in imgs[:6]: msg.user.send_image(img) time.sleep(0.3) print("開始發(fā)送表情:", img) imgs.clear()
但這里有個(gè)問題
就是 itchat 在發(fā)送圖片的時(shí)候
中文名的文件發(fā)了沒有反應(yīng)
后來小帥b發(fā)現(xiàn)是 requests 庫(kù)的問題
修改它的 fields.py
value = email.utils.encode_rfc2231(value, "utf-8") # value = "%s*=%s" % (name, value) value = "%s="%s"" % (name, value.encode("utf-8"))
也就是將
value = "%s*=%s" % (name, value)
改成
value = "%s="%s"" % (name, value.encode("utf-8"))
ok
搞定
ok
以上
當(dāng)然還可以優(yōu)化一下
比如每次加載更多同類型的表情包
將表情包發(fā)送給特定的人等等
自己去玩吧
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/43883.html
摘要:因當(dāng)時(shí)項(xiàng)目組人手嚴(yán)重不足,故兼做部分功能測(cè)試的工作。年下半年,我的工作職能發(fā)生了調(diào)整,不再跟進(jìn)系統(tǒng)相關(guān),工作職能偏向文職,無法有更大的進(jìn)步空間。后來從網(wǎng)上了解到自動(dòng)化測(cè)試,去年下半年也開始通過視頻學(xué)習(xí)自動(dòng)化測(cè)試相關(guān),決心轉(zhuǎn)行做自動(dòng)化測(cè)試。 本人大學(xué)專業(yè)非計(jì)算機(jī)相關(guān),畢業(yè)六年一直從事運(yùn)營(yíng)相關(guān)工...
摘要:文章目錄前言爬取分析視頻教學(xué)成果展示福利入門到就業(yè)學(xué)習(xí)路線規(guī)劃小白快速入門爬蟲路線前言皮皮蝦一個(gè)沙雕而又有趣的憨憨少年,和大多數(shù)小伙伴們一樣喜歡聽歌游戲,當(dāng)然除此之外還有寫作的興趣,,日子還很長(zhǎng),讓我們一起加油努力叭話 ...
摘要:本文轉(zhuǎn)載自微信公眾號(hào)賬號(hào),作者為海航生態(tài)科技技術(shù)研究院大數(shù)據(jù)開發(fā)工程師高顏。文章介紹了海航生態(tài)科技輿情大數(shù)據(jù)平臺(tái)的容器化改造經(jīng)驗(yàn),包括初期技術(shù)架構(gòu)應(yīng)用容器化架構(gòu)遷移持續(xù)發(fā)布與部署。 本文轉(zhuǎn)載自微信公眾號(hào)Docker(賬號(hào):dockerone),作者為海航生態(tài)科技技術(shù)研究院大數(shù)據(jù)開發(fā)工程師高顏。 文章介紹了海航生態(tài)科技輿情大數(shù)據(jù)平臺(tái)的容器化改造經(jīng)驗(yàn),包括初期技術(shù)架構(gòu)、應(yīng)用容器化、架構(gòu)遷...
摘要:今天我就用爬取了一個(gè)斗圖網(wǎng)站上的所有表情包,用來充實(shí)自己的表情包庫(kù)。下載完所有圖片,總共有思路主要通過解析頁面的源代碼來獲取圖片的地址,然后通過圖片地址下載圖片到本地,所以要學(xué)會(huì)使用瀏覽器進(jìn)行分析。 跟朋友聊天總會(huì)用到大量表情包,有些人甚至專門收集各種各樣的表情包,看看誰能打敗誰。今天我就用java爬取了一個(gè)斗圖網(wǎng)站上的所有表情包,用來充實(shí)自己的表情包庫(kù)。代碼邏輯有可能并不完美,哈哈,...
摘要:時(shí)間永遠(yuǎn)都過得那么快,一晃從年注冊(cè),到現(xiàn)在已經(jīng)過去了年那些被我藏在收藏夾吃灰的文章,已經(jīng)太多了,是時(shí)候把他們整理一下了。那是因?yàn)槭詹貖A太亂,橡皮擦給設(shè)置私密了,不收拾不好看呀。 ...
閱讀 1686·2021-09-22 10:02
閱讀 1930·2021-09-02 15:40
閱讀 2835·2019-08-30 15:55
閱讀 2242·2019-08-30 15:44
閱讀 3592·2019-08-30 13:18
閱讀 3223·2019-08-30 11:00
閱讀 1944·2019-08-29 16:57
閱讀 564·2019-08-29 16:41