通过控制台创建完整正则模式的Logtail配置采集日志_日志服务-阿里云帮助中心

相关文章推荐

痴情的牛肉面 · Python正则表达式中中括号[]的用法详解 ...· 4 周前 ·

魁梧的单车 · 附加组件 - Weblate 5.3.1 文档· 3 周前 ·

飘逸的冰淇淋 · 设置日志云端结构化解析_设置云端结构化解析日 ...· 2 周前 ·

玩篮球的跑步鞋 · jquery选择器和属性 - ...· 2 年前 ·

讲道义的硬盘 · 用户自定义变量 | PingCAP 文档中心· 2 年前 ·

快乐的板凳 · android - androidx ...· 2 年前 ·

会开车的滑板 · XMLHttpRequest ...· 2 年前 ·

如果您需要对日志内容做更多个性化的字段提取设置，可选择完整正则模式。本文介绍如何通过日志服务控制台创建完整正则模式的Logtail配置采集日志。

前提条件

已创建Project和Logstore。更多信息，请参见创建Project 和创建Logstore 。
用于安装Logtail的服务器具备访问远端服务器80端口和443端口的能力。
目标服务器持续产生日志。

参数	描述
配置名称	Logtail配置名称，在其所属Project内必须唯一。创建Logtail配置成功后，无法修改其名称。您也可以单击导入其他配置，导入已创建的Logtail配置。
日志路径	根据日志在服务器上的位置，设置日志目录和文件名称。如果是Linux系统中的日志路径，必须以正斜线（/）开头，例如 /apsara/nuwa/.../app.Log 。如果是Windows系统中的日志路径，必须以盘符开头，例如 C:\Program Files\Intel\...\.Log 。目录名和文件名支持完整名称和通配符模式，文件名规则请参见 Wildcard matching 。日志文件查找模式为多层目录匹配，即指定目录（包含所有层级的目录）下所有符合条件的文件都会被查找到。例如： /apsara/nuwa//.log 表示 /apsara/nuwa 目录（包含该目录的递归子目录）中后缀名为 .log 的文件。 /var/logs/app_//.log 表示 /var/logs 目录下所有符合 app_* 格式的目录（包含该目录的递归子目录）中后缀名为 .log 的文件。 /var/log/nginx/*/access 表示 /var/log/nginx 目录（包含该目录的递归子目录）中以 access 开头的文件。
设置采集黑名单	打开设置采集黑名单开关后，可进行黑名单配置，即可在采集时忽略指定的目录或文件。支持完整匹配和通配符模式匹配目录和文件名。例如：选择按目录路径，配置路径为 /home/admin/dir1 ，则表示在采集时忽略 /home/admin/dir1 目录下的所有内容。选择按目录路径，配置路径为 /home/admin/dir* ，则表示在采集时忽略 /home/admin/ 目录下所有以dir开头的子目录下的内容。选择按目录路径，配置路径为 /home/admin//dir ，则表示在采集时忽略 /home/admin/ 目录下二级目录名为dir的子目录下的所有内容。例如 /home/admin/a/dir 目录下的内容被忽略， /home/admin/a/b/dir 目录下的内容被采集。选择按文件路径，配置路径为 /home/admin/private.log ，则表示在采集时忽略 /home/admin/ 目录下所有以private开头，以.log结尾的文件。选择按文件路径，配置路径为 /home/admin/private/_inner.log ，则表示在采集时忽略 /home/admin/ 目录下以private开头的目录内，以_inner.log结尾的文件。例如 /home/admin/private/app_inner.log 文件被忽略， /home/admin/private/app.log 文件被采集。
是否为Docker文件	如果是Docker容器中的文件，您可打开是否为Docker文件开关，配置内部路径与容器Tag。Logtail会自动监测容器的创建和销毁，并根据Tag进行容器过滤，采集指定容器的日志。具体操作，请参见通过DaemonSet-控制台方式采集容器文本日志。
模式	采集模式，默认为完整正则模式，可修改为其它模式。
单行模式	如果待采集的日志是单行日志，请打开单行模式开关，日志服务将逐行采集日志。如果待采集的日志是多行日志（例如Java程序日志），请关闭单行模式开关，使用多行正则模式采集。
日志样例	请务必使用实际场景的日志，便于日志服务自动提取其中的正则表达式。日志样例请参见单行日志采集案例、多行日志采集案例。
行首正则表达式	如果您要采集多行日志，在关闭单行模式开关后，还需配置行首正则表达式。日志服务支持自动生成和手动输入行首正则表达式。自动生成行首正则表达式填写日志样例后，单击自动生成，生成行首正则表达式。手动输入行首正则表达式填写日志样例后，单击手动输入正则表达式，手动配置。配置完成后，单击验证即可验证您输入的正则表达式是否正确。更多信息，请参见如何调试正则表达式。
提取字段	打开提取字段开关后，可通过正则表达式将日志内容提取为键值对（Key:Value）。
正则	打开提取字段开关后，需要配置。自动生成正则表达式在日志样例文本框中，选中需要提取的日志内容，单击生成正则，自动生成正则表达式。手动输入正则表达式单击手动输入正则表达式，手动配置正则表达式。配置完成后，单击验证即可验证您输入的正则表达式是否可以解析、提取日志样例。更多信息，请参见如何调试正则表达式。
日志抽取内容	打开提取字段开关后，需要配置。通过正则表达式将日志内容提取为Value后，您需要为每个Value设置对应的Key。 Key只能包括字母、数字或下划线（_），且只能以字母或下划线（_）开头。最大长度为128字节。
使用系统时间	打开提取字段开关后，需要配置。具体说明如下：打开使用系统时间开关，则日志时间为采集日志时，Logtail所在主机或容器的系统时间。关闭使用系统时间开关，则日志时间为原始日志中自带的时间，即您需要在日志抽取内容中将时间内容对应的 Key 设置为 time 。您还需根据时间内容设置对应的时间转换格式。例如原始日志中的时间为 10/Sep/2022:12:36:49 ，对应的时间转换格式为 %d/%b/%Y:%H:%M:%S 。更多信息，请参见时间格式。
丢弃解析失败日志	是否丢弃解析失败的日志，具体说明如下：打开丢弃解析失败日志开关，解析失败的日志不上传到日志服务。关闭丢弃解析失败日志开关，日志解析失败时，原始日志将作为 __raw_log__ 字段的值上传到日志服务。
最大监控目录深度	设置日志目录被监控的最大深度。取值范围：0~1000，0代表只监控本层目录。

参数	描述
启用插件处理	当您的业务日志太复杂或不固定，固定解析模式（Nginx模式、完整正则模式、JSON模式等）无法满足日志解析需求时，您可以打开启用插件处理开关，添加Logtail插件解析日志。日志服务会根据您选择的采集模式生成默认的插件配置，您可以在默认配置后面添加其他插件配置，即您可以添加多个processors配置。更多信息，请参见概述。
上传原始日志	打开上传原始日志开关后，原始日志将作为 __raw__ 字段的值与解析过的日志一起上传到日志服务。
Topic生成方式	设置Topic生成方式。更多信息，请参见日志主题。空-不生成Topic ：默认选项，表示设置Topic为空字符串，在查询日志时不需要输入Topic即可查询。机器组Topic属性：设置为机器组Topic属性，用于明确区分不同服务器产生的日志数据。文件路径正则：设置为文件路径正则，则需要设置自定义正则，用正则表达式从路径里提取一部分内容作为Topic。用于区分不同用户或实例产生的日志数据。
日志文件编码	设置日志文件编码格式，取值为utf8、gbk。
时区属性	采集日志时，日志时间的时区属性。机器时区：默认为Logtail所在主机或容器的时区。自定义时区：手动选择时区。
超时属性	如果一个日志文件在指定时间内没有任何更新，则认为监控已超时。永不超时：持续监控所有日志文件，永不超时。 30分钟超时：如果日志文件在30分钟内没有更新，则认为监控超时，Logtail不再监控该文件。选择 30分钟超时时，还需设置最大超时目录深度，范围为1~3。
过滤器配置	只采集符合过滤条件的日志，过滤条件包括 key 和 Regex 字段，分别为目标字段的名称和用于过滤的正则表达式。各个过滤条件之间为与关系。
首次采集大小	通过首次采集大小，可以确认首次采集的新文件的内容位置。首次采集大小默认为1024 KB。首次采集时，如果文件小于1024 KB，则从文件内容起始位置开始采集。首次采集时，如果文件大于1024 KB，则从距离文件末尾1024 KB的位置开始采集。您可以通过此处修改首次采集大小，取值范围为0~10485760，单位为KB。
扩展配置	Logtail的扩展配置。更多信息，请参见 advanced参数说明。例如您要通过当前Logtail配置去采集其他Logtail配置已匹配的文件，并指定聚合发送周期，可添加如下配置。 `{ "force_multiconfig": true, "batch_send_interval": 3 }`