摘要:可以根據(jù)我們的指令,讓瀏覽器自動加載頁面,獲取需要的數(shù)據(jù),甚至頁面截屏,或者判斷網(wǎng)站上某些動作是否發(fā)生。自己不帶瀏覽器,不支持瀏覽器的功能,它需要與第三方瀏覽器結(jié)合在一起才能使用。
Selenium
Selenium是一個Web的自動化測試工具,最初是為網(wǎng)站自動化測試而開發(fā)的,類型像我們玩游戲用的按鍵精靈,可以按指定的命令自動操作,不同是Selenium 可以直接運行在瀏覽器上,它支持所有主流的瀏覽器(包括PhantomJS,Chrome這些無界面的瀏覽器)。
Selenium 可以根據(jù)我們的指令,讓瀏覽器自動加載頁面,獲取需要的數(shù)據(jù),甚至頁面截屏,或者判斷網(wǎng)站上某些動作是否發(fā)生。
Selenium 自己不帶瀏覽器,不支持瀏覽器的功能,它需要與第三方瀏覽器結(jié)合在一起才能使用。但是我們有時候需要讓它內(nèi)嵌在代碼中運行,所以我們可以用一個叫 PhantomJS 的工具代替真實的瀏覽器。
可以從 PyPI 網(wǎng)站下載 Selenium庫https://pypi.python.org/simpl...ChromeDriver
也可以用 第三方管理器 pip用命令安裝(windows 環(huán)境):pip install selenium
Selenium 官方參考文檔:http://selenium-python.readth...
下載ChromeDriver
https://npm.taobao.org/mirror...
找到最新日期的版本,可以查看notes.txt文檔,選擇支持的Chrome瀏覽器的版本
解壓 chromedriver_win32.zip
將 chromedriver.exe 移動到 Python安裝目錄下
(其實放哪都可以,但是需要配環(huán)境變量,放Python安裝目錄下省事)
# coding=utf-8 # 導包 from selenium import webdriver import time if __name__ == "__main__": # 1. 創(chuàng)建瀏覽器對象 driver = webdriver.Chrome() # 2. 發(fā)送請求 driver.get("https://www.baidu.com") # 3. 獲取數(shù)據(jù) # data = driver.page_source # with open("baidu.html", "w") as f: # f.write(data.encode("utf-8")) # 給搜索框 輸入數(shù)據(jù): 數(shù)據(jù) 必須是unicode driver.find_element_by_id("kw").send_keys(u"segmentfault") # 然后點擊 # driver.find_element_by_id("su").click() # webdriver 也支持xpath driver.find_element_by_xpath("http://*[@id="su"]").click() time.sleep(3) # 瀏覽器有幾個標簽頁 print driver.window_handles # 屏幕快照 driver.save_screenshot("baidu.png") # 點擊搜索結(jié)果的第一條 driver.find_element_by_xpath("http://*[@id="1"]/h3/a").click() # time.sleep(3) # 因為點擊之后會打開一個新的標簽,所以需要跳到新的標簽 # driver.switch_to_window(driver.window_handles[1]) print driver.window_handles # 4. 屏幕快照 driver.save_screenshot("baidu1.png")
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/44665.html
摘要:下一篇文章網(wǎng)絡(luò)爬蟲實戰(zhàn)請求庫安裝爬蟲可以簡單分為幾步抓取頁面分析頁面存儲數(shù)據(jù)。相關(guān)鏈接官方網(wǎng)站官方文檔中文文檔安裝驗證安裝進入命令行交互模式,導入一下包,如果沒有報錯,則證明安裝成功。 下一篇文章:Python3網(wǎng)絡(luò)爬蟲實戰(zhàn)---2、請求庫安裝:GeckoDriver、PhantomJS、Aiohttp 爬蟲可以簡單分為幾步:抓取頁面、分析頁面、存儲數(shù)據(jù)。 在第一步抓取頁面的過程中,...
摘要:小白的我想學習開始爬蟲,根據(jù)學習教程感謝哈希大數(shù)據(jù)公眾號的分享需要用到和一款谷歌瀏覽器的驅(qū)動。用命令安裝安裝包以后,下載了安裝包文件,一定要下載對應版本的驅(qū)動,感謝的分享。由于不想每次都設(shè)置的絕對路徑,就按操作設(shè)置環(huán)境變量。 小白的我想學習開始爬蟲,根據(jù)學習教程(感謝哈希大數(shù)據(jù)公眾號的分享)需要用到selenium和一款谷歌瀏覽器的驅(qū)動chromedriver。用pip命令安裝sele...
摘要:在使用截圖時,遇上無法加載,導致了截圖是空白區(qū)。否則無法直接修改的設(shè)置。 在使用 selenium + chromeDriver + python3 截圖時,遇上 Flash 無法加載,導致了截圖 Falsh 是空白區(qū)。 環(huán)境要求:selenium chromeDriver Python3 問題 chrome 無頭瀏覽器無法自動加載 Flash 解決辦法 參考了 allow-flash...
摘要:實戰(zhàn)解決登錄滑塊問題寫在前面遇到的問題解決辦法登錄過程如何使用開發(fā)者模式參考寫在前面嘗試自動化測試或初級爬蟲登錄模塊以及滑塊驗證可參考本篇文章。 python+s...
閱讀 2097·2023-04-26 00:09
閱讀 3115·2021-09-26 10:12
閱讀 3481·2019-08-30 15:44
閱讀 2863·2019-08-30 13:47
閱讀 922·2019-08-23 17:56
閱讀 3226·2019-08-23 15:31
閱讀 475·2019-08-23 13:47
閱讀 2508·2019-08-23 11:56