前言

-------------------------2021年12月8日修正------------------------

想搞某些api的二维码登录时,需要Key,然后从服务器获取的数据特别长,180多位的字符,但是我需要的字符串在这其中的一段里面,如何通过Python来实现筛选这段字符串就成了关键问题。

方法

方法有很多种,比如用字典,正则表达式,下标范围,xPath等等…

  • 第一种 - 字典
# 严格来说,字典不算字符串,因为这两个是不同的数据类型,但小白容易把这当作字符串
varName={"name":"小明","age":"16"}
# 直接使用['keyName']的方式就完事了,如下
varName['name'] # 此处注意,字典内的键值是区分大小写的
# 如果变量是这样的,那另当别论
varName="{'name':'小明','age':'16'}"
varName='{"name":"小明","age":"16"}'
# 导入json模块
import json
json.loads(varName)
# 然后再使用上面的方法
  • 第二种 - 正则表达式

有关Python正则表达式的教程可看此文章Python正则表达式指南 或者官方文档 re — Regular expression operations — Python 3.10.0 documentation

a="我是你爸爸的弟弟的儿子的哥哥啊!你怎么能不认识我呢?我在你小时候还给你发了个50块钱的红包呢!Why?"
# 比如我们需要从上面的话里面筛选我们想要的内容,比如红包金额
# 由于此处语句极为简单,所以可以直接使用如下代码
import re
re.findall(r"(\d+)",a,re.S)
# 那如果是如下呢?
a="+86 12345678901"
b="123123198810102333"
c="I love you~"
d="我们明天就要截止了,日期是2012年11月21日14点00分"
# 变量a, 筛选手机号
re.findall(r".86\ (\d+)",a,re.S)
# 变量b, 筛选出生年月日
re.findall(r"\d{6}(\d{8})\d+",b,re.S)
# 变量c, 筛选出单词
re.findall(r"([a-zA-Z]+)",c,re.S)
# 变量d, 筛选年月日时分
re.findall(r"(\d+)\w(\d+)\w(\d+)\w(\d+)\w(\d+)",d,re.S)
  • 第三种 - 下标范围
a="key=abcdef1234567890&userName=admin&password=1234567"
# 筛出userName
a[30:35]
>>> 'admin'

暂时介绍这么多,有疑问请评论