国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

十年老Python程序員:給我一個(gè)鏈接,沒有我不能爬的視頻,只有我頂不住的視頻

Jrain / 1155人閱讀

摘要:算了算了,不整游戲了,反正你們也不愛看今天來試試把頭條上扭腰上熱門的那些妹子爬一爬,不知道我頂不頂?shù)米《?zhǔn)備工作使用的環(huán)境專業(yè)版要用的第三方模塊三大致流程鑒于你們不喜歡我啰嗦,但是流程呢,我還是要給你們寫出來,所以我就多帶帶把它列出來了。

一、寫在前面

真的,為什么別人發(fā)游戲這么多人看,我發(fā)了兩次了加起來才一百個(gè)。

算了算了,不整游戲了,反正你們也不愛看~

今天來試試把頭條上扭腰上熱門的那些妹子爬一爬,不知道我頂不頂?shù)米

二、準(zhǔn)備工作

1、使用的環(huán)境
  • python 3.8
  • pycharm 2021.2 專業(yè)版
2、要用的第三方模塊
  • selenium
  • requests
  • parsel

三、大致流程

鑒于你們不喜歡我啰嗦,但是流程呢,我還是要給你們寫出來,所以我就多帶帶把它列出來了。

1、網(wǎng)站分析(明確需求)
  1. 在視頻網(wǎng)頁源代碼當(dāng)中找到 embedUrl 對(duì)應(yīng)的鏈接;
  2. 在鏈接當(dāng)中找到視頻播放地址,在元素面板當(dāng)中;
  3. 發(fā)現(xiàn)規(guī)律 embedUrl上面的 groupby_id 其實(shí)就是當(dāng)前視頻鏈接上的id,下載視頻的時(shí)候 就只需要 一個(gè) id 就可以下載視頻;(https://www.ixigua.com/embed?group_id=7029910152576926238)
2、代碼實(shí)現(xiàn)過程
  1. 構(gòu)建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238
  2. 使用selenium訪問該鏈接
  3. 提取視頻鏈接地址
  4. 拼接視頻鏈接地址
  5. 使用requests發(fā)送請(qǐng)求 并且獲取視頻二進(jìn)制數(shù)據(jù)
  6. 保存視頻

如果大家在學(xué)習(xí)Python的過程中不知道學(xué)習(xí)方向,該怎么學(xué),沒有好的系統(tǒng)的學(xué)習(xí)資料、沒人交流解答等等,都可以私我,我都給大家準(zhǔn)備好了。

四、代碼展示分析

首先導(dǎo)入一下模塊

import requestsfrom selenium import webdriver

進(jìn)入瀏覽器設(shè)置

options = webdriver.ChromeOptions()

1、構(gòu)建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238

group_id = input("請(qǐng)輸入你要下載視頻的id:")url = "https://www.ixigua.com/embed?group_id=" + group_id

無頭瀏覽器

options.add_argument("--headless")

加一個(gè)偽裝

options.add_argument("User-Agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"")

2、使用selenium訪問該鏈接
driver: 瀏覽器

driver = webdriver.Chrome(executable_path="chromedriver.exe", options=options)

打開一個(gè)網(wǎng)頁
驅(qū)動(dòng)配置: 代碼操作瀏覽器的一個(gè)中間人

driver.get(url)

隱式等待: 最多等待五秒 如果一秒鐘加載完了 繼續(xù)執(zhí)行

driver.implicitly_wait(5)

3、提取視頻鏈接地址

info = driver.find_elements_by_xpath("http://*[@id="player_default"]/xg-controls/xg-definition/ul/li[1]")video_url = info[0].get_attribute("url")

4、拼接視頻鏈接地址

video_url = "http:" + video_url

5、使用requests發(fā)送請(qǐng)求 并且獲取視頻二進(jìn)制數(shù)據(jù)

video_data = requests.get(video_url).contentwith open("1.mp4", mode="wb") as f:    f.write(video_data)

所有代碼

import requestsfrom selenium import webdriver# 進(jìn)入瀏覽器設(shè)置options = webdriver.ChromeOptions()# 1. 構(gòu)建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238group_id = input("請(qǐng)輸入你要下載視頻的id:")url = "https://www.ixigua.com/embed?group_id=" + group_id# 無頭瀏覽器options.add_argument("--headless")# 加一個(gè)偽裝options.add_argument("User-Agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"")# 2. 使用selenium訪問該鏈接# driver: 瀏覽器driver = webdriver.Chrome(executable_path="chromedriver.exe", options=options)# 打開一個(gè)網(wǎng)頁# 驅(qū)動(dòng)配置: 代碼操作瀏覽器的一個(gè)中間人driver.get(url)# 隱式等待: 最多等待五秒 如果一秒鐘加載完了 繼續(xù)執(zhí)行driver.implicitly_wait(5)# 3. 提取視頻鏈接地址info = driver.find_elements_by_xpath("http://*[@id="player_default"]/xg-controls/xg-definition/ul/li[1]")video_url = info[0].get_attribute("url")# 4. 拼接視頻鏈接地址video_url = "http:" + video_url# 5. 使用requests發(fā)送請(qǐng)求 并且獲取視頻二進(jìn)制數(shù)據(jù)video_data = requests.get(video_url).contentwith open("1.mp4", mode="wb") as f:    f.write(video_data)print("爬取成功!!!")#留了報(bào)錯(cuò),看看大家夠不夠機(jī)智找出來

兄弟們看完覺得有幫助,記得點(diǎn)贊三連哇~

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://specialneedsforspecialkids.com/yun/124771.html

相關(guān)文章

  • 年老Python序員一個(gè)鏈接沒有不能視頻只有不住視頻

    摘要:算了算了,不整游戲了,反正你們也不愛看今天來試試把頭條上扭腰上熱門的那些妹子爬一爬,不知道我頂不頂?shù)米《?zhǔn)備工作使用的環(huán)境專業(yè)版要用的第三方模塊三大致流程鑒于你們不喜歡我啰嗦,但是流程呢,我還是要給你們寫出來,所以我就單獨(dú)把它列出來了。 ...

    JiaXinYi 評(píng)論0 收藏0
  • Python爬蟲:一個(gè)鏈接,虎牙視頻隨便下載

    摘要:爬取的原理我們來到虎牙視頻主界面,鏈接為虎牙視頻主界面然后隨便點(diǎn)擊一下某個(gè)視頻的發(fā)布者,來到這個(gè)發(fā)布者的主界面,點(diǎn)擊到視頻,如下我們可以看到這個(gè)界面下有許多視頻可以觀看,那么怎樣下載呢我們隨便點(diǎn)擊其中的一個(gè)視頻進(jìn)入,按 ...

    lvzishen 評(píng)論0 收藏0
  • 交封不殺!——python獲取bilibli視頻封面

    摘要:我又回頭看那個(gè)爬京東的程序哦我好像被反爬蟲發(fā)現(xiàn)了解決反爬蟲問題這下可以了吧直接點(diǎn)開鏈接看一下沒錯(cuò),火狐才是我的默認(rèn)瀏覽器終于不用再說交封不殺了。 昨晚終于提交了該死的31條CPU,今天十節(jié)課翹了八節(jié),躺在宿舍睡覺,不幸遇到幾百年難得一見的點(diǎn)名……然而當(dāng)時(shí)我在吃炸雞,沒法(懶)趕過去,達(dá)成第一次翹課就點(diǎn)名。 心情郁結(jié)的我打算看一看漂亮小姐姐開心一下,于是我發(fā)現(xiàn)了這個(gè)視頻:showImg(...

    dance 評(píng)論0 收藏0
  • Python

    摘要:最近看前端都展開了幾場而我大知乎最熱語言還沒有相關(guān)。有關(guān)書籍的介紹,大部分截取自是官方介紹。但從開始,標(biāo)準(zhǔn)庫為我們提供了模塊,它提供了和兩個(gè)類,實(shí)現(xiàn)了對(duì)和的進(jìn)一步抽象,對(duì)編寫線程池進(jìn)程池提供了直接的支持。 《流暢的python》閱讀筆記 《流暢的python》是一本適合python進(jìn)階的書, 里面介紹的基本都是高級(jí)的python用法. 對(duì)于初學(xué)python的人來說, 基礎(chǔ)大概也就夠用了...

    dailybird 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<