Selenium + ChromeDriver

aikin 發(fā)布于2019-07-31 11:06 / 806人閱讀

摘要：可以根據(jù)我們的指令，讓瀏覽器自動加載頁面，獲取需要的數(shù)據(jù)，甚至頁面截屏，或者判斷網(wǎng)站上某些動作是否發(fā)生。自己不帶瀏覽器，不支持瀏覽器的功能，它需要與第三方瀏覽器結(jié)合在一起才能使用。

Selenium

Selenium是一個Web的自動化測試工具，最初是為網(wǎng)站自動化測試而開發(fā)的，類型像我們玩游戲用的按鍵精靈，可以按指定的命令自動操作，不同是Selenium 可以直接運行在瀏覽器上，它支持所有主流的瀏覽器（包括PhantomJS，Chrome這些無界面的瀏覽器）。

Selenium 可以根據(jù)我們的指令，讓瀏覽器自動加載頁面，獲取需要的數(shù)據(jù)，甚至頁面截屏，或者判斷網(wǎng)站上某些動作是否發(fā)生。

Selenium 自己不帶瀏覽器，不支持瀏覽器的功能，它需要與第三方瀏覽器結(jié)合在一起才能使用。但是我們有時候需要讓它內(nèi)嵌在代碼中運行，所以我們可以用一個叫 PhantomJS 的工具代替真實的瀏覽器。

可以從 PyPI 網(wǎng)站下載 Selenium庫https://pypi.python.org/simpl...
也可以用 第三方管理器 pip用命令安裝(windows 環(huán)境)：pip install selenium
Selenium 官方參考文檔：http://selenium-python.readth...

ChromeDriver

下載ChromeDriver

https://npm.taobao.org/mirror...

找到最新日期的版本，可以查看notes.txt文檔，選擇支持的Chrome瀏覽器的版本

解壓 chromedriver_win32.zip

將 chromedriver.exe 移動到 Python安裝目錄下
（其實放哪都可以，但是需要配環(huán)境變量，放Python安裝目錄下省事）

簡單的小介紹

# coding=utf-8
# 導包
from selenium import webdriver
import time

if __name__ == "__main__":

    # 1. 創(chuàng)建瀏覽器對象
    driver = webdriver.Chrome()

    # 2. 發(fā)送請求
    driver.get("https://www.baidu.com")

    # 3. 獲取數(shù)據(jù)
    # data = driver.page_source
    # with open("baidu.html", "w") as f:
    #     f.write(data.encode("utf-8"))

    # 給搜索框 輸入數(shù)據(jù): 數(shù)據(jù) 必須是unicode
    driver.find_element_by_id("kw").send_keys(u"segmentfault")
    # 然后點擊
    # driver.find_element_by_id("su").click()
    # webdriver 也支持xpath
    driver.find_element_by_xpath("http://*[@id="su"]").click()

    time.sleep(3)

    # 瀏覽器有幾個標簽頁
    print driver.window_handles
    
    # 屏幕快照
    driver.save_screenshot("baidu.png")

    # 點擊搜索結(jié)果的第一條
    driver.find_element_by_xpath("http://*[@id="1"]/h3/a").click()

    # time.sleep(3)

    # 因為點擊之后會打開一個新的標簽，所以需要跳到新的標簽
    # driver.switch_to_window(driver.window_handles[1])

    print driver.window_handles

    # 4. 屏幕快照
    driver.save_screenshot("baidu1.png")