xpath实用提取规则 _Code

相关文章推荐

直爽的围巾 · 讲解selenium 获取href ...· 2 月前 ·

犯傻的水桶 · 前端页面json数组的遍历（获取属性名和属性 ...· 2 年前 ·

直爽的小蝌蚪 · go - Alpine docker ...· 3 年前 ·

冷静的签字笔 · [python] ...· 3 年前 ·

可以使用以下语法来提取文本内容中包含“中国银行“并且长度大于20的文本数据：

//text()[contains(.,'中国银行') and string-length(.)>20]
这个XPath表达式用到了以下函数：
text()：表示当前节点的所有文本子节点。
contains(.,'中国银行')：判断文本内容中是否包含“中国银行”。
string-length(.)>20：判断文本内容长度是否大于20。其中，“.”代表当前节点，也就是要提取文本的节点。
最终结果会返回所有符合以上两个条件的文本内容。
可以使用以下XPath定位找到文本内容为"下一页"的标签：
//a[text()='下一页']
上述语句中，//a 表示选择所有的链接标签。[text()='下一页'] 表示在该选定集合中筛选出文本内容为“下一页”的元素。
如果您想限制只在某个特定元素下搜索，可以将//替换为该元素的XPath路径。例如，如果要在带有id属性值为pagination的div元素中搜索下一页链接：
//div[@id='pagination']//a[text()='下一页']
其中 //div[@id='pagination'] 用于在id为“pagination”的 div 元素内搜索子元素。
通过确定父级标签找兄弟标签：
xpath("//strong[text()='公司名称：']/../span/text()").get("").strip()
这个 XPath 表达式的含义是：
//: 从根节点开始搜索
strong: 元素名为 strong 的元素
[text()='公司名称：']: 其中包含文本内容为“公司名称：”（注意这里直接判等，如果 strong 标签内有其他字符可能会匹配不成功）
/..: 向上查找一级，即到这个 strong 标签的父标签
/span: 在 strong 标签的父标签中寻找一个子标签名为 span 的元素
/text(): 获取该 span 元素的文本内容
.get(''): 获取获取到的元素文本内容。如果元素不存在则返回空字符串。
.strip(): 去除内容首尾的空白符和换行符等。
    pycode
        77.0k


   
    
     
      
       粉丝
      
      
       
       
       
      
      
       
        
         
          目录
         
         
          
           收起
          
          
         
        
        
         
         
        
       
       
       
        
         相关推荐
        
        
         
          
           
            operation not permitted
           
           
            
            
             436阅读
            
            
             ·
            
            
             0点赞
            
           
          
          
           
            xpath定位元素总结（附好用的浏览器xpath插件）
           
           
            
            
             3.6k阅读
            
            
             ·
            
            
             10点赞
            
           
          
          
           
            15 分钟无门槛构建服务器性能监控系统
           
           
            
            
             6.1k阅读
            
            
             ·
            
            
             19点赞
            
           
          
          
           
            「大数据」win环境下的Flume日志采集初级实验
           
           
            
            
             3.0k阅读
            
            
             ·
            
            
             2点赞
            
           
          
          
           
            windows下二开YApi踩坑
           
           
            
            
             92阅读
            
            
             ·
            
            
             1点赞
            
           
          
         
        
       
       
      
      
      
      
       
        友情链接：
       
       
        
         
          异界商店系统
        残王独宠：农女医妃有空间
        国运：开局种下一棵向日葵
        天地星辰天珠
        希罗王子小说云天空
        深度聚类算法难点

推荐文章

直爽的围巾 · 讲解selenium 获取href find_element_by_xpath开发者社区

2 月前

犯傻的水桶 · 前端页面json数组的遍历（获取属性名和属性值）_jsonarray遍历取值-CSDN博客

2 年前

直爽的小蝌蚪 · go - Alpine docker image __isnan: symbol not found - Stack Overflow

3 年前

冷静的签字笔 · [python] 基于NetworkX实现网络图的绘制_networkx相关矩阵网络 ...

3 年前

今天看啥 · Py中国 · codingpro · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

Code - 代码工具平台

© 2024 ~ 沪ICP备11025650号