Selenium 网络驱动程序: 如何找到一个元素的所有属性?

在 Python Selenium 模块中,一旦我有了一个 WebElement对象,我就可以用 get_attribute()获得它的任何属性的值:

foo = elem.get_attribute('href')

如果名为 'href'的属性不存在,则返回 None

我的问题是,如何获得一个元素具有的所有属性的列表?似乎没有 get_attributes()get_attribute_names()方法。

我使用的是针对 Python 的 Selenium 模块的2.44.0版本。

98432 次浏览

它是使用硒网络驱动程序 API 的 不可能,但是你可以使用 执行 javascript 代码 获取所有属性:

driver.execute_script('var items = {}; for (index = 0; index < arguments[0].attributes.length; ++index) { items[arguments[0].attributes[index].name] = arguments[0].attributes[index].value }; return items;', element)

演示:

>>> from selenium import webdriver
>>> from pprint import pprint
>>> driver = webdriver.Firefox()
>>> driver.get('https://stackoverflow.com')
>>>
>>> element = driver.find_element_by_xpath('//div[@class="network-items"]/a')
>>> attrs = driver.execute_script('var items = {}; for (index = 0; index < arguments[0].attributes.length; ++index) { items[arguments[0].attributes[index].name] = arguments[0].attributes[index].value }; return items;', element)
>>> pprint(attrs)
{u'class': u'topbar-icon icon-site-switcher yes-hover js-site-switcher-button js-gps-track',
u'data-gps-track': u'site_switcher.show',
u'href': u'//stackexchange.com',
u'title': u'A list of all 132 Stack Exchange sites'}

为了完整起见,另一种解决方案是获取标记的 outerHTML并使用 HTML 解析器解析属性。例子(使用 BeautifulSoup) :

>>> from bs4 import BeautifulSoup
>>> html = element.get_attribute('outerHTML')
>>> attrs = BeautifulSoup(html, 'html.parser').a.attrs
>>> pprint(attrs)
{u'class': [u'topbar-icon',
u'icon-site-switcher',
u'yes-hover',
u'js-site-switcher-button',
u'js-gps-track'],
u'data-gps-track': u'site_switcher.show',
u'href': u'//stackexchange.com',
u'title': u'A list of all 132 Stack Exchange sites'}

下面是所有属性的列表以及它们的(有时转换为字符串)值,至少使用 PhantomJS 或 Chrome 驱动程序:

elem.get_property('attributes')[0]

只要知道名字就行了:

x.get_property('attributes')[0].keys()

这是我试图找到的答案。我只是在谷歌主页的搜索框中测试了一下。我使用了@alecxe 上面关于‘ outerHTML’的回答在获得 html 之后,我使用了一个正则表达式 ([a-z]+-?[a-z]+_?)='?"?来匹配属性名。我认为只需要修改正则表达式来匹配越来越多的情况。但我们需要的本质名称是“等号背后的东西”

给定一个 webElement

def get_web_element_attribute_names(web_element):
"""Get all attribute names of a web element"""
# get element html
html = web_element.get_attribute("outerHTML")
# find all with regex
pattern = """([a-z]+-?[a-z]+_?)='?"?"""
return re.findall(pattern, html)

在下面的代码中测试它

import re
from selenium import webdriver


driver = webdriver.Firefox()
google = driver.get("http://www.google.com")


driver.find_element_by_link_text("English").click()
search_element = driver.find_element_by_name("q")
get_web_element_attribute_names(search_element)

产出:

['class', 'id', 'maxlength', 'name', 'autocomplete', 'title', 'value', 'aria-label', 'aria-haspopup', 'role', 'aria-autocomplete', 'style', 'dir', 'spellcheck', 'type']

您可以使用 Get _ property ()方法查找。

from selenium import webdriver
from selenium.webdriver.common.by import By


driver = webdriver.Chrome()
driver.get("https://www.ultimateqa.com/complicated-page/")


logo = driver.find_element(By.XPATH, "//img[@id='logo']")
attrs=[]
for attr in logo.get_property('attributes'):
attrs.append([attr['name'], attr['value']])
print(attrs)

产出:

[['src', 'https://www.ultimateqa.com/wp-content/uploads/2019/01/horizontal_on_transparent_by_logaster-2.png'], ['alt', 'Ultimate QA'], ['id', 'logo'], ['data-height-percentage', '100'], ['data-actual-width', '912'], ['data-actual-height', '410']]