主頁(yè) > 知識(shí)庫(kù) > Python爬蟲(chóng)實(shí)現(xiàn)selenium處理iframe作用域問(wèn)題

Python爬蟲(chóng)實(shí)現(xiàn)selenium處理iframe作用域問(wèn)題

熱門(mén)標(biāo)簽:地圖標(biāo)注可以遠(yuǎn)程操作嗎 智能電話機(jī)器人調(diào)研 杭州房產(chǎn)地圖標(biāo)注 如何申請(qǐng)400電話代理 天津塘沽區(qū)地圖標(biāo)注 甘肅高頻外呼系統(tǒng) 江門(mén)智能電話機(jī)器人 滴滴地圖標(biāo)注公司 400電話在線如何申請(qǐng)

項(xiàng)目場(chǎng)景:

在使用selenium模塊進(jìn)行數(shù)據(jù)爬取時(shí),通常會(huì)遇到爬取iframe中的內(nèi)容。會(huì)因?yàn)槎ㄎ坏淖饔糜騿?wèn)題爬取不到數(shù)據(jù)。

問(wèn)題描述:

我們以菜鳥(niǎo)教程的運(yùn)行實(shí)例為案例。
按照正常的定位


會(huì)以文本塊生成xpath為/html/body/text()。這樣的話根據(jù)xpath進(jìn)行如下代碼編寫(xiě)。

#!/user/bin/
# -*- coding:UTF-8 -*-
# Author:Master

from selenium import webdriver
import time

driver = webdriver.Chrome(executable_path="./chromedriver")
driver.get('https://www.runoob.com/try/runcode.php?filename=HelloWorldtype=python3')
time.sleep(2)
text = driver.find_element_by_xpath('/html/body').text
print(text)
time.sleep(5)
driver.quit()

執(zhí)行結(jié)果:


很明顯這并不是想要的結(jié)果。

原因分析:

當(dāng)我們打開(kāi)抓包工具定位到Hello, World!文本的時(shí)候會(huì)發(fā)現(xiàn),該文本是在一個(gè)iframe中。這樣的話我們xpath所定位到的內(nèi)容則是大的html中的路徑。我們需要的內(nèi)容則是在iframe中的小的html中。

解決方案:

通過(guò)分析發(fā)現(xiàn),想要解決問(wèn)題的實(shí)質(zhì)就是改變作用域。通過(guò)switch_to.frame(‘id')方法來(lái)改變作用域就可以了。

重新編寫(xiě)代碼:

#!/user/bin/
# -*- coding:UTF-8 -*-
# Author:Master

from selenium import webdriver
import time

driver = webdriver.Chrome(executable_path="./chromedriver")
driver.get('https://www.runoob.com/try/runcode.php?filename=HelloWorldtype=python3')
time.sleep(2)
driver.switch_to.frame('iframeResult')
text = driver.find_element_by_xpath('/html/body').text
print(text)
time.sleep(5)
driver.quit()

查看運(yùn)行結(jié)果:

到此這篇關(guān)于Python爬蟲(chóng)實(shí)現(xiàn)selenium處理iframe作用域問(wèn)題的文章就介紹到這了,更多相關(guān)selenium iframe作用域內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • selenium學(xué)習(xí)教程之定位以及切換frame(iframe)
  • Python爬蟲(chóng)之Selenium中frame/iframe表單嵌套頁(yè)面
  • Selenium向iframe富文本框輸入內(nèi)容過(guò)程圖解
  • java selenium處理Iframe中的元素示例

標(biāo)簽:廊坊 重慶 德宏 長(zhǎng)春 臨汾 漢中 東莞 河池

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python爬蟲(chóng)實(shí)現(xiàn)selenium處理iframe作用域問(wèn)題》,本文關(guān)鍵詞  Python,爬蟲(chóng),實(shí)現(xiàn),selenium,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python爬蟲(chóng)實(shí)現(xiàn)selenium處理iframe作用域問(wèn)題》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于Python爬蟲(chóng)實(shí)現(xiàn)selenium處理iframe作用域問(wèn)題的相關(guān)信息資訊供網(wǎng)民參考!
  • 企业400电话

    智能AI客服机器人
    15000

    在线订购

    合计11份范本:公司章程+合伙协议+出资协议+合作协议+股权转让协议+增资扩股协议+股权激励+股东会决议+董事会决议

    推薦文章