国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

十年老Python程序員:給我一個鏈接,沒有我不能爬的視頻,只有我頂不住的視頻

JiaXinYi / 795人閱讀

摘要:算了算了,不整游戲了,反正你們也不愛看今天來試試把頭條上扭腰上熱門的那些妹子爬一爬,不知道我頂不頂得住二準備工作使用的環境專業版要用的第三方模塊三大致流程鑒于你們不喜歡我啰嗦,但是流程呢,我還是要給你們寫出來,所以我就多帶帶把它列出來了。

一、寫在前面

真的,為什么別人發游戲這么多人看,我發了兩次了加起來才一百個。

算了算了,不整游戲了,反正你們也不愛看~

今天來試試把頭條上扭腰上熱門的那些妹子爬一爬,不知道我頂不頂得住~

二、準備工作

1、使用的環境
  • python 3.8
  • pycharm 2021.2 專業版
2、要用的第三方模塊
  • selenium
  • requests
  • parsel

三、大致流程

鑒于你們不喜歡我啰嗦,但是流程呢,我還是要給你們寫出來,所以我就多帶帶把它列出來了。

1、網站分析(明確需求)
  1. 在視頻網頁源代碼當中找到 embedUrl 對應的鏈接;
  2. 在鏈接當中找到視頻播放地址,在元素面板當中;
  3. 發現規律 embedUrl上面的 groupby_id 其實就是當前視頻鏈接上的id,下載視頻的時候 就只需要 一個 id 就可以下載視頻;(https://www.ixigua.com/embed?group_id=7029910152576926238)
2、代碼實現過程
  1. 構建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238
  2. 使用selenium訪問該鏈接
  3. 提取視頻鏈接地址
  4. 拼接視頻鏈接地址
  5. 使用requests發送請求 并且獲取視頻二進制數據
  6. 保存視頻

如果大家在學習Python的過程中不知道學習方向,該怎么學,沒有好的系統的學習資料、沒人交流解答等等,都可以私我,我都給大家準備好了。

四、代碼展示分析

首先導入一下模塊

import requestsfrom selenium import webdriver

進入瀏覽器設置

options = webdriver.ChromeOptions()

1、構建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238

group_id = input("請輸入你要下載視頻的id:")url = "https://www.ixigua.com/embed?group_id=" + group_id

無頭瀏覽器

options.add_argument("--headless")

加一個偽裝

options.add_argument("User-Agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"")

2、使用selenium訪問該鏈接
driver: 瀏覽器

driver = webdriver.Chrome(executable_path="chromedriver.exe", options=options)

打開一個網頁
驅動配置: 代碼操作瀏覽器的一個中間人

driver.get(url)

隱式等待: 最多等待五秒 如果一秒鐘加載完了 繼續執行

driver.implicitly_wait(5)

3、提取視頻鏈接地址

info = driver.find_elements_by_xpath("http://*[@id="player_default"]/xg-controls/xg-definition/ul/li[1]")video_url = info[0].get_attribute("url")

4、拼接視頻鏈接地址

video_url = "http:" + video_url

5、使用requests發送請求 并且獲取視頻二進制數據

video_data = requests.get(video_url).contentwith open("1.mp4", mode="wb") as f:    f.write(video_data)

所有代碼

import requestsfrom selenium import webdriver# 進入瀏覽器設置options = webdriver.ChromeOptions()# 1. 構建embedUrl https://www.ixigua.com/embed?group_id=7029910152576926238group_id = input("請輸入你要下載視頻的id:")url = "https://www.ixigua.com/embed?group_id=" + group_id# 無頭瀏覽器options.add_argument("--headless")# 加一個偽裝options.add_argument("User-Agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.45 Safari/537.36"")# 2. 使用selenium訪問該鏈接# driver: 瀏覽器driver = webdriver.Chrome(executable_path="chromedriver.exe", options=options)# 打開一個網頁# 驅動配置: 代碼操作瀏覽器的一個中間人driver.get(url)# 隱式等待: 最多等待五秒 如果一秒鐘加載完了 繼續執行driver.implicitly_wait(5)# 3. 提取視頻鏈接地址info = driver.find_elements_by_xpath("http://*[@id="player_default"]/xg-controls/xg-definition/ul/li[1]")video_url = info[0].get_attribute("url")# 4. 拼接視頻鏈接地址video_url = "http:" + video_url# 5. 使用requests發送請求 并且獲取視頻二進制數據video_data = requests.get(video_url).contentwith open("1.mp4", mode="wb") as f:    f.write(video_data)print("爬取成功!!!")#留了報錯,看看大家夠不夠機智找出來

兄弟們看完覺得有幫助,記得點贊三連哇~

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/124798.html

相關文章

  • 年老Python序員一個鏈接沒有不能視頻只有不住視頻

    摘要:算了算了,不整游戲了,反正你們也不愛看今天來試試把頭條上扭腰上熱門的那些妹子爬一爬,不知道我頂不頂得住二準備工作使用的環境專業版要用的第三方模塊三大致流程鑒于你們不喜歡我啰嗦,但是流程呢,我還是要給你們寫出來,所以我就單獨把它列出來了。 ...

    Jrain 評論0 收藏0
  • Python爬蟲:一個鏈接,虎牙視頻隨便下載

    摘要:爬取的原理我們來到虎牙視頻主界面,鏈接為虎牙視頻主界面然后隨便點擊一下某個視頻的發布者,來到這個發布者的主界面,點擊到視頻,如下我們可以看到這個界面下有許多視頻可以觀看,那么怎樣下載呢我們隨便點擊其中的一個視頻進入,按 ...

    lvzishen 評論0 收藏0
  • 交封不殺!——python獲取bilibli視頻封面

    摘要:我又回頭看那個爬京東的程序哦我好像被反爬蟲發現了解決反爬蟲問題這下可以了吧直接點開鏈接看一下沒錯,火狐才是我的默認瀏覽器終于不用再說交封不殺了。 昨晚終于提交了該死的31條CPU,今天十節課翹了八節,躺在宿舍睡覺,不幸遇到幾百年難得一見的點名……然而當時我在吃炸雞,沒法(懶)趕過去,達成第一次翹課就點名。 心情郁結的我打算看一看漂亮小姐姐開心一下,于是我發現了這個視頻:showImg(...

    dance 評論0 收藏0
  • Python

    摘要:最近看前端都展開了幾場而我大知乎最熱語言還沒有相關。有關書籍的介紹,大部分截取自是官方介紹。但從開始,標準庫為我們提供了模塊,它提供了和兩個類,實現了對和的進一步抽象,對編寫線程池進程池提供了直接的支持。 《流暢的python》閱讀筆記 《流暢的python》是一本適合python進階的書, 里面介紹的基本都是高級的python用法. 對于初學python的人來說, 基礎大概也就夠用了...

    dailybird 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<