from
selenium
.
webdriver
.
support
.
wait
import
WebDriverWait
from
selenium
.
webdriver
.
support
import
expected_conditions
as
EC
from
selenium
.
webdriver
.
common
.
by
import
By
wait
=
WebDriverWait
(
browser
,
1000.0
,
0.1
)
next_page_element
=
wait
.
until
(
EC
.
presence_of_element_located
(
(
By
.
XPATH
,
'//*[@id="AspNetPager1"]/a[last()]'
)
)
)
1、selenium使用xpath定位,想要获取a标签的最后一个元素,使用last()from selenium import webdriver#导入等待对象模块from selenium.webdriver.support.wait import WebDriverWait#导入条件判断模块from selenium.webdriver.support import expected_conditions as EC#导入查询元素模块from selenium.webdriver.com
**目的:**编写RPA流程的时候有多个tr
标签
,tr
标签
特征属性一共存在两种,一种是主账号,一种是子账号。主账号tr
标签
中存在主账号,子账号tr
标签
和主账号
标签
在同一级,如果存在子账号tr,那么该子账号
使用
的账号其实是主账号,所以我们必须
获取
主账号来判断是否已经存在该账号了,当判断存在子账号tr
标签
的时候我就要获得上一级主账号的账户号码。
<tr></tr>
<tr></tr>
<tr></tr>
取
xpath
最后
一个android.view.ViewGroup元素
android.view.ViewGroup[last()]
取
xpath
倒数第二个android.view.ViewGroup元素
android.view.ViewGroup[last()-1]
有value属性的input元素
//input[@name=‘password’ and @pwd=‘123456’]
属性name的值等于password并且属性pwd的值等于123456的input元素
//ul/*[5]
ul的第五个子元素
td_list = html.
xpath
('/html/body/center[3]/table/tbody/tr/td/span/center/center[last()]/table/tbody/tr/td')
2.取某个
标签
下面的所有文本。
在编写爬虫程序的过程中提取信息是非常重要的环节,但是有时
使用
正则表达式无法匹配到
想要
的信息,或者书写起来非常麻烦,此时就需要用另外一种数据解析方法,也就是本节要介绍的
Xpath
表达式。
Xpath
表达式
XPath
(全称:XML Path Language)即 XML 路径语言,它是一门在 XML 文档中查找信息的语言,最初被用来搜寻 XML 文档,同时它也适用于搜索 HTML 文档。因此,在爬虫过程中可以
使用
XPath
来提取相应的数据。
提示:XML 是一种遵守 W3C 标椎的标记语言,..
1.
使用
Selenium
打开网页并找到表单所在的元素。
2. 找到表格中的所有行,可以
使用
`find_elements_by_
xpath
`方法,传入`//table//tr`作为参数,来
获取
所有行的WebElement对象列表。
3.
获取
最后
一行的行索引,通过列表切片
获取
最后
一行的WebElement对象。
4.
获取
最后
一行第一格的文字,通过调用
最后
一行WebElement对象的`find_element_by_
xpath
`方法,传入`./td[1]`作为参数,来
获取
第一格的WebElement对象,然后再调用该对象的`text`属性
获取
文字内容。
下面是一个示例代码:
```python
from
selenium
import webdriver
driver = webdriver.Chrome()
driver.get("http://example.com")
# 找到表格元素
table = driver.find_element_by_
xpath
("//table")
# 找到所有行
rows = table.find_elements_by_
xpath
(".//tr")
#
获取
最后
一行的行索引
last_row_index = len(rows) - 1
#
获取
最后
一行的WebElement对象
last_row = rows[last_row_index]
#
获取
最后
一行第一格的文字
first_cell_text = last_row.find_element_by_
xpath
("./td[1]").text
print(first_cell_text)
driver.quit()
qq_27327279: