講講python使用xpath中遇到[<Element a at 0x39a9a80>到

darry 發(fā)布于2019-07-30 15:16 / 1160人閱讀

摘要：在這里我表示所有不經(jīng)驗(yàn)證的轉(zhuǎn)載都是耍流氓，把一篇篇錯(cuò)誤的文章轉(zhuǎn)載的到處都是，不知道浪費(fèi)了多少人的時(shí)間精力去反復(fù)調(diào)試錯(cuò)誤的代碼，尤其是對(duì)初學(xué)者有極大的打擊性。

寫在前面

本人的所有文章只適合善于使用百度的人，因?yàn)樗谢A(chǔ)知識(shí)個(gè)個(gè)博客復(fù)制粘貼了無(wú)數(shù)遍，我這里均不會(huì)詳細(xì)講述。

在這里我表示所有不經(jīng)驗(yàn)證的轉(zhuǎn)載都是耍流氓，把一篇篇錯(cuò)誤的文章轉(zhuǎn)載的到處都是，不知道浪費(fèi)了多少人的時(shí)間精力去反復(fù)調(diào)試錯(cuò)誤的代碼，尤其是對(duì)初學(xué)者有極大的打擊性。

大家在學(xué)習(xí)python爬蟲的過(guò)程中，會(huì)發(fā)現(xiàn)一個(gè)問(wèn)題，語(yǔ)法我看完了，說(shuō)的也很詳細(xì)，我也認(rèn)真看了，爬蟲還是不會(huì)寫，或者沒(méi)有思路，所以我的所有文章都會(huì)從實(shí)例的角度來(lái)解析一些常見的問(wèn)題和報(bào)錯(cuò)。

Element是什么

回歸正題，大家暈頭轉(zhuǎn)腦的看完繁雜的語(yǔ)法之后，已經(jīng)迫不及待寫點(diǎn)什么東西了，然后部分同學(xué)可能遇到了這個(gè)

或者類似 Element a at 0x???????，這樣的一個(gè)值，然后大家?guī)е鴨?wèn)題去搜，然后全是英文啊，什么一大堆亂七八糟的啊，英文不好的同學(xué)就崩潰了，在這里，我會(huì)重點(diǎn)解析一下

某種意義上來(lái)說(shuō)，當(dāng)你打印變量的時(shí)候得到的這個(gè)值，其實(shí)它是一個(gè)列表，然后列表中的每一個(gè)值都是一個(gè)字典

如何使用理解請(qǐng)看半成品開車實(shí)例，證明了本人非常擅長(zhǎng)把學(xué)習(xí)和樂(lè)趣結(jié)合起來(lái)并且切身解決日常需求，滑稽臉.jpg

from bs4 import BeautifulSoup
from lxml import etree
import requests

gjc="SHKD-700"
#定義URL
html = "http://www.btanv.com/search/"+gjc+"-hot-desc-1"
#解碼URL
html = requests.get(html).content.decode("utf-8")
#解析成xml
dom_tree = etree.HTML(html)
#在xml中定位節(jié)點(diǎn)，返回的是一個(gè)列表
links = dom_tree.xpath("http://a[@class="download"]")
for index in range(len(links)):
    # links[index]返回的是一個(gè)字典
    if (index % 2) == 0:
        print(links[index].tag)
        print(links[index].attrib)
        print(links[index].text)

實(shí)例解析

下面重點(diǎn)看看這個(gè)代碼，

        print(links[index])
        print(type(links[index]))
        print(links[index].tag)#獲取標(biāo)簽名a
        print(links[index].attrib)#獲取標(biāo)簽的屬性href和class
        print(links[index].text)#獲取標(biāo)簽的文字部分

打印出來(lái)的是



a
{"href": "magnet:?xt=urn:btih:7502edea0dfe9c2774f95118db3208a108fe10ca", "class": "download"}
磁力鏈接

該節(jié)點(diǎn)的html代碼為

磁力鏈接

看到這里大家應(yīng)該就非常獸血沸騰的了解了三個(gè)屬性的用法了。

總結(jié)

Element類型是"lxml.etree._Element"，某種意義來(lái)說(shuō)同時(shí)是一個(gè)列表

列表的需要使用tagattrib ext三個(gè)不同的屬性來(lái)獲取我們需要的東西

變量.tag獲取到的是標(biāo)簽名是---字符串

變量.attrib獲取到的是節(jié)點(diǎn)標(biāo)簽a的屬性---字典

變量.text獲取到的是標(biāo)簽文本--字符串

歡迎收藏點(diǎn)贊，拒絕轉(zhuǎn)載，因?yàn)槟壳拔乙彩亲詫W(xué)向前摸索，這些都是我目前認(rèn)知到的東西，肯定有講的不準(zhǔn)確的地方，不希望會(huì)誤導(dǎo)到他人

云服務(wù)器 GPU云服務(wù)器 asp中&lt&gt的意思 python &lt&gt asp &lt&gt asp &lt= &gt

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://specialneedsforspecialkids.com/yun/41149.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

darry

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

tensorflow是否安裝成功

閱讀 3785·2023-04-26 02:07
SvenHost：黑色星期五，美國(guó)VPS，免費(fèi)DDOS保護(hù)，全線優(yōu)惠，最高達(dá)40%，月付$4.2起

閱讀 3671·2021-10-27 14:14
InterServer：新增存儲(chǔ)服務(wù)，支持安裝OwnCloud，月付3美元起

閱讀 2859·2021-10-14 09:49
第五第六天

閱讀 1624·2019-08-30 15:43
年終活動(dòng)h5動(dòng)畫總結(jié)

閱讀 2611·2019-08-29 18:33
css3實(shí)現(xiàn)顫動(dòng)的動(dòng)畫

閱讀 2369·2019-08-29 17:01
淺談前端優(yōu)化的幾個(gè)思路

閱讀 915·2019-08-29 15:11
margin詳解

閱讀 582·2019-08-29 11:06

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

講講python使用xpath中遇到[<Element a at 0x39a9a80>到

相關(guān)文章

Python通用驗(yàn)證碼識(shí)別OCR庫(kù)ffffddocr的安裝使用教程

**怎么使用python對(duì)圖片進(jìn)行批量壓縮**

Python+Selenium實(shí)現(xiàn)在Geoserver批量發(fā)布Mongo矢量數(shù)據(jù)

Python xpath,JsonPath,bs4的基本使用方法

發(fā)表評(píng)論

0條評(píng)論

darry

男|高級(jí)講師

TA的文章

tensorflow是否安裝成功

SvenHost：黑色星期五，美國(guó)VPS，免費(fèi)DDOS保護(hù)，全線優(yōu)惠，最高達(dá)40%，月付$4.2起

InterServer：新增存儲(chǔ)服務(wù)，支持安裝OwnCloud，月付3美元起

第五第六天

年終活動(dòng)h5動(dòng)畫總結(jié)

css3實(shí)現(xiàn)顫動(dòng)的動(dòng)畫

淺談前端優(yōu)化的幾個(gè)思路

margin詳解

最新活動(dòng)