十年老Python程序員：給我一個(gè)鏈接，沒有我不能爬的視頻，只有我頂不住的視頻

Jrain 發(fā)布于2021-11-24 09:38 / 1155人閱讀

摘要：算了算了，不整游戲了，反正你們也不愛看今天來試試把頭條上扭腰上熱門的那些妹子爬一爬，不知道我頂不頂?shù)米《?zhǔn)備工作使用的環(huán)境專業(yè)版要用的第三方模塊三大致流程鑒于你們不喜歡我啰嗦，但是流程呢，我還是要給你們寫出來，所以我就多帶帶把它列出來了。

文章目錄

一、寫在前面
二、準(zhǔn)備工作
- - - - 1、使用的環(huán)境
      - 2、要用的第三方模塊
三、大致流程
- - - - 1、網(wǎng)站分析(明確需求)
      - 2、代碼實(shí)現(xiàn)過程
四、代碼展示分析

一、寫在前面

真的，為什么別人發(fā)游戲這么多人看，我發(fā)了兩次了加起來才一百個(gè)。

算了算了，不整游戲了，反正你們也不愛看~

今天來試試把頭條上扭腰上熱門的那些妹子爬一爬，不知道我頂不頂?shù)米

二、準(zhǔn)備工作

1、使用的環(huán)境

python 3.8
pycharm 2021.2 專業(yè)版

2、要用的第三方模塊

selenium
requests
parsel

三、大致流程

鑒于你們不喜歡我啰嗦，但是流程呢，我還是要給你們寫出來，所以我就多帶帶把它列出來了。

1、網(wǎng)站分析(明確需求)

在視頻網(wǎng)頁源代碼當(dāng)中找到 embedUrl 對(duì)應(yīng)的鏈接；
在鏈接當(dāng)中找到視頻播放地址，在元素面板當(dāng)中；
發(fā)現(xiàn)規(guī)律 embedUrl上面的 groupby_id 其實(shí)就是當(dāng)前視頻鏈接上的id，下載視頻的時(shí)候就只需要一個(gè) id 就可以下載視頻；（https://www.ixigua.com/embed?group_id=7029910152576926238）

2、代碼實(shí)現(xiàn)過程

構(gòu)建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238
使用selenium訪問該鏈接
提取視頻鏈接地址
拼接視頻鏈接地址
使用requests發(fā)送請(qǐng)求并且獲取視頻二進(jìn)制數(shù)據(jù)
保存視頻

如果大家在學(xué)習(xí)Python的過程中不知道學(xué)習(xí)方向，該怎么學(xué)，沒有好的系統(tǒng)的學(xué)習(xí)資料、沒人交流解答等等，都可以私我，我都給大家準(zhǔn)備好了。

四、代碼展示分析

首先導(dǎo)入一下模塊

import requestsfrom selenium import webdriver

進(jìn)入瀏覽器設(shè)置

options = webdriver.ChromeOptions()

1、構(gòu)建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238

group_id = input("請(qǐng)輸入你要下載視頻的id:")url = "https://www.ixigua.com/embed?group_id=" + group_id

無頭瀏覽器

options.add_argument("--headless")

加一個(gè)偽裝

options.add_argument("User-Agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"")

2、使用selenium訪問該鏈接
driver: 瀏覽器

driver = webdriver.Chrome(executable_path="chromedriver.exe", options=options)

打開一個(gè)網(wǎng)頁
驅(qū)動(dòng)配置: 代碼操作瀏覽器的一個(gè)中間人

driver.get(url)

隱式等待: 最多等待五秒如果一秒鐘加載完了繼續(xù)執(zhí)行

driver.implicitly_wait(5)

3、提取視頻鏈接地址

info = driver.find_elements_by_xpath("http://*[@id="player_default"]/xg-controls/xg-definition/ul/li[1]")video_url = info[0].get_attribute("url")

4、拼接視頻鏈接地址

video_url = "http:" + video_url

5、使用requests發(fā)送請(qǐng)求并且獲取視頻二進(jìn)制數(shù)據(jù)

video_data = requests.get(video_url).contentwith open("1.mp4", mode="wb") as f:    f.write(video_data)

所有代碼

import requestsfrom selenium import webdriver# 進(jìn)入瀏覽器設(shè)置options = webdriver.ChromeOptions()# 1. 構(gòu)建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238group_id = input("請(qǐng)輸入你要下載視頻的id:")url = "https://www.ixigua.com/embed?group_id=" + group_id# 無頭瀏覽器options.add_argument("--headless")# 加一個(gè)偽裝options.add_argument("User-Agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"")# 2. 使用selenium訪問該鏈接# driver: 瀏覽器driver = webdriver.Chrome(executable_path="chromedriver.exe", options=options)# 打開一個(gè)網(wǎng)頁# 驅(qū)動(dòng)配置: 代碼操作瀏覽器的一個(gè)中間人driver.get(url)# 隱式等待: 最多等待五秒 如果一秒鐘加載完了 繼續(xù)執(zhí)行driver.implicitly_wait(5)# 3. 提取視頻鏈接地址info = driver.find_elements_by_xpath("http://*[@id="player_default"]/xg-controls/xg-definition/ul/li[1]")video_url = info[0].get_attribute("url")# 4. 拼接視頻鏈接地址video_url = "http:" + video_url# 5. 使用requests發(fā)送請(qǐng)求 并且獲取視頻二進(jìn)制數(shù)據(jù)video_data = requests.get(video_url).contentwith open("1.mp4", mode="wb") as f:    f.write(video_data)print("爬取成功!!!")#留了報(bào)錯(cuò)，看看大家夠不夠機(jī)智找出來

兄弟們看完覺得有幫助，記得點(diǎn)贊三連哇~

GPU云服務(wù)器云服務(wù)器 webrtc只有聲音沒有視頻 html給我留言板一個(gè)完整的python程序沒有廣告的視頻網(wǎng)站

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://specialneedsforspecialkids.com/yun/124771.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

Jrain

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

十年老Python程序員：給我一個(gè)鏈接，沒有我不能爬的視頻，只有我頂不住的視頻

閱讀 1156·2021-11-24 09:38
系統(tǒng)架構(gòu)升級(jí)規(guī)劃

閱讀 3603·2021-11-22 15:32
12.18aria學(xué)習(xí)小計(jì)

閱讀 3457·2019-08-30 15:54
關(guān)于CSS你應(yīng)該知道的基礎(chǔ)知識(shí) - 盒模型篇

閱讀 2567·2019-08-30 15:53
制作生成icon-font步驟

閱讀 1493·2019-08-30 15:52
解決 font-weight 無效的問題

閱讀 2495·2019-08-30 13:15
滑動(dòng)效果的原理及實(shí)踐一個(gè)滑動(dòng)小插件

閱讀 1836·2019-08-29 12:21
Vue.nextTick使用和源碼分析

閱讀 1394·2019-08-26 18:36

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！