字符串函数_日志服务(SLS)-阿里云帮助中心

本文介绍字符串函数的基本语法和示例。

日志服务支持如下字符串函数。

函数名称	语法	说明	支持SQL	支持SPL
chr函数	chr( x )	将ASCII码转换为字符。	√	√
codepoint函数	codepoint( x )	将字符转换为ASCII码。	√	√
concat函数	concat( x , y ...)	将多个字符串拼接成一个字符串。	√	√
from_utf8函数	from_utf8( x )	将二进制字符串解码为UTF-8编码格式，并使用默认字符U+FFFD替换无效的UTF-8字符。	√	√
from_utf8函数	from_utf8( x , replace_string )	将二进制字符串解码为UTF-8编码格式，并使用自定义字符串替换无效的UTF-8字符。	√	√
length函数	length( x )	计算字符串的长度。	√	√
levenshtein_distance函数	levenshtein_distance( x , y )	计算 x 和 y 之间的最小编辑距离。	√	×
lower函数	lower( x )	将字符串转换为小写形式。	√	√
lpad函数	lpad( x , length , lpad_string )	在字符串的开头填充指定字符，直到指定长度后返回结果字符串。	√	√
ltrim函数	ltrim( x )	删除字符串开头的空格。	√	√
normalize函数	normalize( x )	使用NFC格式将字符串格式化。	√	×
position函数	position( sub_string in x )	返回目标子串在字符串中的位置。	√	×
replace函数	replace( x , sub_string )	删除字符串中匹配的字符。	√	√
replace函数	replace( x , sub_string , replace_string )	将字符串中所匹配的字符替换为其他指定字符。	√	√
reverse函数	reverse( x )	返回反向顺序的字符串。	√	√
rpad函数	rpad( x , length , rpad_string )	在字符串的尾部填充指定字符，直到指定长度后返回结果字符串。	√	√
rtrim函数	rtrim( x )	删除字符串中结尾的空格。	√	√
split函数	split( x , delimeter )	使用指定的分隔符拆分字符串，并返回子串集合。	√	×
split函数	split( x , delimeter , limit )	通过指定的分隔符拆分字符串并使用 limit 限制字符串拆分的个数，然后返回拆分后的子串集合。	√	×
split_part函数	split_part( x , delimeter , part )	使用指定的分隔符拆分字符串，并返回指定位置的内容。	√	√
split_to_map函数	split_to_map( x , delimiter01 , delimiter02 )	使用指定的第一个分隔符拆分字符串，然后再使用指定的第二个分隔符进行第二次拆分。	√	×
strpos函数	strpos( x , sub_string )	返回目标子串在字符串中的位置。与position( sub_string in x )函数等价。	√	√
substr函数	substr( x , start )	返回字符串中指定位置的子串。	√	√
substr函数	substr( x , start , length )	返回字符串中指定位置的子串，并指定子串长度。	√	√
to_utf8函数	to_utf8( x )	将字符串转换为UTF-8编码格式。	√	√
trim函数	trim( x )	删除字符串中开头和结尾的空格。	√	√
upper函数	upper( x )	将字符串转化为大写形式。	√	√

chr(x)

参数	说明
x	ASCII码。

```
region:cn-shanghai
```

* | SELECT
  substr(region, 1, 1) = chr(99)

codepoint(x)

参数	说明
x	参数值为varchar类型。

```
upstream_status:200
```

* | SELECT
  codepoint(cast (substr(region, 1, 1) AS char(1))) = 99

concat(x, y...)

参数	说明
x	参数值为varchar类型。
y	参数值为varchar类型。

region:cn-shanghai
time:14/Jul/2021:02:19:40

```
* | SELECT
  concat(region, '-', time)
```

```
from_utf8(x)
```
```
from_utf8(x,replace_string)
```

参数	说明
x	参数值为binary类型。
replace_string	用于替换的字符串。只能为单个字符或空格。

- ```
* | SELECT
  from_utf8(from_base64('0x80'))
```
- ```
* | SELECT
  from_utf8(from_base64('0x80'), '0')
```

length(x)

参数	说明
x	参数值为varchar类型。

http_user_agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2

```
* | SELECT
  length(http_user_agent)
```

levenshtein_distance(x, y)

参数	说明
x	参数值为varchar类型。
y	参数值为varchar类型。

```
instance_id:i-01
owner_id:owner-01
```

* | SELECT
  levenshtein_distance(owner_id, instance_id)

lower(x)

参数	说明
x	参数值为varchar类型。

```
request_method:GET
```
```
* | SELECT
  lower(request_method)
```

lpad(x, length, lpad_string)

参数	说明
x	参数值为varchar类型。
length	整数，用于指定结果字符串的长度。当字符串的长度小于 length 时，在字符串的开头填充指定的字符。当字符串的长度大于 length 时，只返回字符串中的 length 个字符。
lpad_string	新填充的字符。

```
instance_id:i-01
```
```
* | SELECT
  lpad(instance_id, 10, '0')
```

ltrim(x)

参数	说明
x	参数值为varchar类型。

```
region: cn-shanghai
```
```
* | SELECT
  ltrim(region)
```

normalize(x)

参数	说明
x	参数值为varchar类型。

```
* | SELECT
  normalize('schön')
```

position(sub_string in x)

参数	说明
sub_string	目标子串。
x	参数值为varchar类型。

```
region:cn-shanghai
```
```
* | SELECT
  position('cn' in region)
```

```
replace(x, sub_string)
```
```
replace(x, sub_string, replace_string)
```

参数	说明
x	参数值为varchar类型。
sub_string	目标子串。
replace_string	用于替换的子串。

- ```
region:cn-shanghai
```
- ```
* | select
  replace(region, 'cn', '中国')
```
- ```
region:cn-shanghai
```
- ```
* | select
  replace(region, 'cn-')
```

reverse(x)

参数	说明
x	参数值为varchar类型。

```
request_method:GET
```
```
* | SELECT
  reverse(request_method)
```

rpad(x, length, rpad_string)

参数	说明
x	参数值为varchar类型。
length	整数，用于指定结果字符串的长度。当字符串的长度小于 length 时，在字符串的尾部填充指定的字符。当字符串的长度大于 length 时，只返回字符串中的 length 个字符。
rpad_string	新填充的字符。

```
instance_id:i-01
```
```
* | SELECT
  rpad(instance_id, 10, '0')
```

rtrim(x)

参数	说明
x	参数值为varchar类型。

```
instance_id:i-01 
```
```
* | SELECT
  rtrim(instance_id)
```

```
split(x, delimeter)
```
```
split(x,delimeter,limit)
```

参数	说明
x	参数值为varchar类型。
delimeter	分隔符。
limit	限制字符串拆分的个数，大于0的整数。

- ```
request_uri:/request/path-1/file-9
```
- ```
* | SELECT
  split(request_uri, '/')
```
- ```
request_uri:/request/path-1/file-9
```
- ```
* | SELECT
  split(request_uri, '/', 3)
```

split_part(x, delimeter, part)

参数	说明
x	参数值为varchar类型。
delimeter	分隔符。
part	大于0的整数。

request_uri: /request/path-2/file-6?name=value&age=18
request_uri: /request/path-2/file-0?name=value&age=18
request_uri: /request/path-3/file-2?name=value&age=18

* | SELECT
  count(*) AS PV,
  split_part(request_uri, '?', 1) AS Path
GROUP BY
ORDER BY
  pv DESC

split_to_map(x, delimiter01, delimiter02)

参数	说明
x	参数值为varchar类型。
delimeter01	分隔符。
delimeter02	分隔符。

time:upstream_response_time:"80", request_time:"40"

* | SELECT
  split_to_map(time, ',', ':')

strpos(x, sub_string)

参数	说明
x	参数值为varchar类型。
sub_string	目标子串。

```
* | SELECT
  strpos(server_protocol, 'H')
```

```
substr(x, start)
```
```
substr(x,start,length)
```

参数	说明
x	参数值为varchar类型。
start	开始提取子串的位置，从1开始。
length	子串的长度。

```
server_protocol:HTTP/2.0
```

* | SELECT
  substr(server_protocol, 1, 4) AS protocol,
  count(*) AS count
GROUP BY
  server_protocol

to_utf8(x)

参数	说明
x	参数值为varchar类型。

```
* | SELECT
  to_utf8('log')
```

trim(x)

参数	说明
x	参数值为varchar类型。

```
instance_id: i-01 
```
```
* | SELECT
  trim(instance_id)
```

upper(x)

参数	说明
x	参数值为varchar类型。

```
region:cn-shanghai
```
```
* | SELECT
  upper(region)
```

字符串函数

chr函数

语法

参数说明

返回值类型

示例

codepoint函数

语法

参数说明

返回值类型

示例

concat函数

语法

参数说明

返回值类型

示例

from_utf8函数

语法

参数说明

返回值类型

示例

length函数

语法

参数说明

返回值类型

示例

levenshtein_distance函数

语法

参数说明

返回值类型

示例

lower函数

语法

参数说明

返回值类型

示例

lpad函数

语法

参数说明

返回值类型

示例

ltrim函数

语法

参数说明

返回值类型

示例

normalize函数

语法

参数说明

返回值类型

示例

position函数

语法

参数说明

返回值类型

示例

replace函数

语法

参数说明

返回值类型

示例

reverse函数

语法

参数说明

返回值类型

示例

rpad函数

语法

参数说明

返回值类型

示例

rtrim函数

语法

参数说明

返回值类型

示例

split函数

语法

参数说明

返回值类型