Logstash 参考指南（Date过滤器插件）

偏头痛杨

2019-06-28

关注关注

Date过滤器插件

插件版本：v3.1.9
发布于：2017-11-07
更改日志

其他版本，请参阅版本化的插件文档。

获取帮助

有关插件的问题，请在讨论论坛中打开一个主题，对于bug或特性请求，在Github中打开一个issue，关于Elastic支持的插件列表，请考虑Elastic支持矩阵。

描述

date过滤器用于解析字段中的日期，然后使用该日期或时间戳作为事件的logstash时间戳。

例如，syslog事件通常有这样的时间戳：

"Apr 17 09:32:01"

你应该使用MMM dd HH:mm:ss的日期格式来解析这个。

日期过滤器对于事件的排序和对旧数据的回填特别重要，如果在你的事件中没有得到正确的日期，那么以后搜索它们可能会出现顺序不对。

如果没有这个过滤器，logstash将根据第一次看到事件（在输入时）的时间（如果时间戳还没有在事件中设置）选择一个时间戳，例如，对于文件输入，时间戳被设置为每次读取的时间。

Date过滤器配置选项

这个插件支持以下配置选项以及后面描述的通用选项。

设置	输入类型	要求
`locale`	string	No
`match`	array	No
`tag_on_failure`	array	No
`target`	string	No
`timezone`	string	No

还可以查看所有过滤器插件支持的选项列表的通用选项。

locale

值类型为string
此设置没有默认值
使用IETF-BCP47或POSIX语言标记指定要用于日期解析的语言环境，简单的例子有en，en-US代表BCP47，en_US代表POSIX。
对于解析月份名称（带有MMM的模式）和工作日名称（带有EEE的模式），通常需要设置语言环境。
如果没有指定，将使用平台默认值，但对于非英语平台默认值，还将使用英语解析器作为回退机制。

match

值类型为array
默认值为[]
首先是字段名，然后是格式模式的数组，[ field, formats... ]

如果你的时间字段有多种可能的格式，你可以这样做：

match => [ "logdate", "MMM dd yyyy HH:mm:ss",
       "MMM  d yyyy HH:mm:ss", "ISO8601" ]

以上内容将匹配syslog（rfc3164）或iso8601时间戳。
有一些特殊的例外，下面的格式文字可以帮助你节省时间并确保数据解析的正确性。
- iso8601 - 可以解析任何有效的ISO8601时间戳，像：2011-04-19T03:44:01.103Z
- UNIX - 解析float或int值表示自纪元以来的unix时间（如1326149001秒），132和1326149001一样。
- UNIX_MS - 解析int值表示自纪元以来的unix时间（如1366125117000毫秒）
- TAI64N - 会解析tai64n时间值
例如，如果你有一个字段logdate，其值类似于Aug 13 2010 00:03:44，那么你将使用这个配置：
```
filter {
  date {
    match => [ "logdate", "MMM dd yyyy HH:mm:ss" ]
  }
}
```
如果字段嵌套在结构中，可以使用嵌套语法[foo][bar]匹配其值，有关更多信息，请参阅字段参考资料
关于语法的更多细节
用于解析日期和时间文本的语法使用字母表示时间值的类型（月份、分钟等），重复使用字母表示该值的形式（两位数的月份、完整的月份名称等）。
下面是用来解析日期和时间的方法：
y 年
- yyyy => 全年数字，例如：2015。
- yy => 两位数的年，例如：15代表2015年。
M 一年中的月份
- M => 最小位数的月份，例如：1为1月，12为12月。
- MM => 两位数的月份，如果需要将用零填充，例如：01为1月，12为12月。
- MMM => 缩写月文本，例如：Jan为1月，注意：使用的语言取决于你的语言环境，查看locale设置如何更改语言。
- MMMM => 全月的文本，例如：January，注意：使用的语言取决于你的语言环境。
d 一月中的天
- d => 最小位数的天，例如：1为一个月的第一天。
- dd => 两位数的天，如果需要将用零填充，例如：01为一个月的第一天。
H 一天中的小时（24小时时钟）
- H => 最小位数的小时，例如：0为午夜。
- HH => 两位数的小时，如果需要，零填充，例如：00为午夜。
m 一小时中的分钟（每小时60分钟）
- m => 最小位数的分钟，例如：0。
- mm => 两位数的分钟，如果需要，零填充，例如：00。
s 一分钟中的秒（每分钟60秒）
- s => 最小位数的秒，例如：0。
- ss => 两位数的秒，如果需要，零填充，例如：00。
S 每秒最大精度的分数为毫秒(SSS)，超过这个，追加零
- S => 十分之一秒，例如：0表示亚秒值012。
- SS => 百分之一秒，例如：01为亚秒值01。
- SSS => 千分之一秒，例如：012为亚秒值012。
Z 时区偏移或标识
- Z => 时区偏移结构为HHmm（Zulu/UTC的小时和分钟偏移），例如：-0700。
- ZZ => 时区偏移结构为HH:mm（在小时和分钟偏移量之间的冒号），例如：-07:00。
- ZZZ => 时区的标识，例如：America/Los_Angeles，注意：有效的id列在Joda.org可用时区页面上。
z 时区名称，无法解析时区名称（z）。
w 一年中的周
- w => 最小位数的周，例如：1。
- ww => 两位数的周，如果需要，零填充，例如：01。
D 一年中的天
e 一周中的星期（数字）
E 一周中的星期（文本）
- E, EE, EEE => 一周中缩短的星期，例如：Mon，Tue，Wed，Thu，Fri，Sat，Sun，注意：它的实际语言取决于你的语言环境。
- EEEE => 一周的星期全称，例如：Monday，Tuesday，...，注意：它的实际语言取决于你的语言环境。
对于非格式化语法，需要在值周围放置单引号字符，例如，如果你正在解析ISO8601时间，"2015-01-01T01:12:23"那个“T”不是有效的事件格式，并且你你可能想说"字面上的一个T"，你的格式应该是这样："yyyy-MM-dd’T'HH:mm:ss"。
其他不太常见的日期单元，如era（G）、century（C）、am/pm（a）和#更多，可以在joda-time文档中了解。

tag_on_failure

值类型为array
默认值为["_dateparsefailure"]
当没有成功匹配时，将值附加到tags字段

target

值类型为string
默认值为"@timestamp"
将匹配的时间戳存储到给定的目标字段中，如果没有提供，默认更新事件的@timestamp字段。

timezone

值类型为string
此设置没有默认值
指定用于日期解析的时区规范ID，有效的id列在Joda.org可用时区页面上，这在无法从值中提取时区时非常有用，而且不是平台默认值。如果没有指定，将使用平台默认值，Canonical ID很好，因为它为你处理了夏令时，例如，America/Los_Angeles或Europe/Paris是有效的id。该字段可以是动态的，并使用%{field}语法包含事件的一部分。

通用选项

所有过滤器插件都支持以下配置选项：

设置	输入类型	要求
`add_field`	hash	No
`add_tag`	array	No
`enable_metric`	boolean	No
`id`	string	No
`periodic_flush`	boolean	No
`remove_field`	array	No
`remove_tag`	array	No

add_field

值类型为hash
默认值为{}
如果此过滤器成功，则向此事件添加任意字段，字段名可以是动态的，并使用%{field}包含事件的一部分。

例如：

filter {
  date {
    add_field => { "foo_%{somefield}" => "Hello world, from %{host}" }
  }
}

# You can also add multiple fields at once:
filter {
  date {
    add_field => {
      "foo_%{somefield}" => "Hello world, from %{host}"
      "new_field" => "new_static_value"
    }
  }
}

如果事件具有字段“somefield”==“hello”，那么在成功时，这个过滤器将添加字段foo_hello（如果存在的话），上面的值和%{host}块将被事件中的值替换，第二个示例还将添加硬编码字段。

add_tag

值类型为array
默认值为[]
如果此过滤器成功，则向事件添加任意tags，tags可以是动态的，并使用%{field}语法包含事件的一部分。

例如：

filter {
  date {
    add_tag => [ "foo_%{somefield}" ]
  }
}

# You can also add multiple tags at once:
filter {
  date {
    add_tag => [ "foo_%{somefield}", "taggedy_tag"]
  }
}

如果事件有字段“somefield”==“hello”，这个过滤器在成功时，会添加一个标签foo_hello（第二个例子当然会添加一个taggedy_tag标签）。

enable_metric

值类型为boolean
默认值为true
默认情况下，我们会记录所有可以记录的指标，但你可以为特定的插件禁用指标集合。

id

值类型为string
此设置没有默认值
在插件配置中添加唯一的id，如果没有指定ID，则Logstash将生成一个，强烈建议在配置中设置此ID，当你有两个或多个相同类型的插件时，这一点特别有用。例如，如果你有两个电子邮件输出，在本例中添加一个命名ID将有助于在使用监控API时监控Logstash。
```
filter {
  date {
    id => "ABC"
  }
}
```

periodic_flush

值类型为boolean
默认值为false
定期调用过滤器flush方法，可选的。

remove_field

值类型为array
默认值为[]

如果此过滤器成功，则从此事件中删除任意字段，例如：

filter {
  date {
    remove_field => [ "foo_%{somefield}" ]
  }
}

# You can also remove multiple fields at once:
filter {
  date {
    remove_field => [ "foo_%{somefield}", "my_extraneous_field" ]
  }
}

如果事件中有字段“somefield”==“hello”，那么在成功时，如果存在名为foo_hello的字段，这个过滤器将删除该字段，第二个示例将删除一个额外的非动态字段。

remove_tag

值类型为array
默认值为[]
如果此过滤器成功，则从事件中删除任意tags，tags可以是动态的，并使用%{field}语法包含事件的一部分。

例如：

filter {
  date {
    remove_tag => [ "foo_%{somefield}" ]
  }
}

# You can also remove multiple tags at once:
filter {
  date {
    remove_tag => [ "foo_%{somefield}", "sad_unwanted_tag"]
  }
}

如果事件有字段“somefield”==“hello”，这个过滤器在成功时，会删除标签foo_hello如果它存在，第二个示例还将删除一个sad、unwanted的标记。

logstash date 时间戳

偏头痛杨

0 关注 0 粉丝 0 动态

关注关注

logstash 读取MySQL数据到elasticsearch 相差8小时解决办法

logstash和elasticsearch是按照UTC时间的，kibana却是按照正常你所在的时区显示的，是因为kibana中可以配置时区信息。Logstash期望时间戳以UTC术语表示。此插件将以ISO8601格式的相对UTC时间自动将您的SQL时间戳

李玉志 2020-05-11

Filebeat简介

Filebeat附带预构建的模块，这些模块包含收集、解析、充实和可视化各种日志文件格式数据所需的配置，每个Filebeat模块由一个或多个文件集组成，这些文件集包含摄取节点管道、Elasticsearch模板、Filebeat勘探者配置和Kibana仪表盘

goodstudy 2020-08-19

logstash_output_kafka:Mysql同步Kafka深入详解

实际业务场景中，会遇到基础数据存在Mysql中，实时写入数据量比较大的情景。迁移至kafka是一种比较好的业务选型方案。如果需要同步历史全量数据+实时更新数据，建议使用logstash。实际上，核心logstash的同步原理的掌握，有助于大家理解类似的各种

weikaixxxxxx 2020-08-01

ES坑之logstash配置文件

　　parameters => { "sql_last_value" => "UpdateTime" }. 　　statement => "SELECT * FROM t WHERE t

liulin0 2020-07-26

Elasticsearch 的安装和使用（1）

说起ELK相信大家都不陌生，他可不是一个软件，是三个软件 logstash，elasticsearch，Kibana 组成的可以打造大规模日志实时处理的系统。Logstash是一个日志收集、过滤、转发的中间件，主要负责将各条业务线的各类日志统一收集、过滤后

AFei00 2020-07-26

Logstash Oracle同步设置

# 是否清除sql_last_value的记录，需要增量同步时此字段必须为false；# 同步频率，默认每分钟同步一次；where updated_at>:sql_last_value and updated_at<sysdate order

娜娜 2020-07-20

filebeat配置文件

#input设置，支持Docker,Container,HTTP JSON,Log,Kafka,MQTT,NetFlow,Redis,TCP,DCP,Syslog,Stdin. #output设置，可以output到kafka,logstash,elast

偏头痛杨 2020-07-18

logstash配置文件

# How many events to retrieve from inputs before sending to filters+workers. #启用持久队列后，在强制检查点之前的最大书面事件数，默认1024. # If using queue.

winxcoder 2020-07-18

logstash

　　logstash是一个日志转化系统，用户通过定义一个input，filter，和一个output配置来完成日志的收集和存储工作。　　array match =>[ "/var/log/messages", "/var

superviser000 2020-06-28

linux安装logstash7.6.1及搭建简单ELK--logstash收集nginx日志

进入解压后的logstash的bin目录，执行启动命令：./bin/logstash -e ‘input { stdin{} } output{ stdout { codec => rubydebug }}‘。[2020-06-25T11:17:36

liulin0 2020-06-25

ELK组件

　　Filebeat 是用于转发和集中日志数据的轻量级传输程序。Filebeat 可以监听指定的日志文件或位置，从中收集日志事件并将其转发到 Elasticsearch 或 Logstash 进行索引。Filebeat 为每个找到的日志启动 Harvest

liulin0 2020-06-16

超强干货！通过filebeat、logstash、rsyslog 几种方式采集 nginx 日志

由于nginx功能强大，性能突出，越来越多的web应用采用nginx作为http和反向代理的web服务器。而nginx的访问日志不管是做用户行为分析还是安全分析都是非常重要的数据源之一。如何有效便捷的采集nginx的日志进行有效的分析成为大家关注的问题。本

wangfengqingyang 2020-06-11

NSSM-将服务变为window service

nssm install logstash，弹出如下界面。Startup directory : 填写启动文件目录。Dependencies : 填写此服务启动需要依赖哪个服务

cullinans 2020-06-09

logstash的output插件

和之前 inputs/stdin 插件一样，outputs/stdout 插件也是最基础和简单的输出插件。同样在这里简单介绍一下，作为输出插件的一个共性了解。Logstash 为输出做了多线程的准备。codec 的作用在之前已经讲过。可能除了 codecs

winxcoder 2020-06-08

ElasticSearch stack 6.5.4下载地址

ElasticSearch：windows：https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.5.4.ziphttps://artifacts.elastic.co/d

citic 2020-06-06

浅尝 Elastic Stack (五) Logstash + Beats + Kafka

在 Elasticsearch、Kibana、Beats 安装中讲到推荐架构：。本文基于 Logstash + Beats 读取 Spring Boot 日志将其改为上述架构

goodstudy 2020-06-05

ELK-概念

ELK是Elasticsearch、Logstash、Kibana三大开源框架首字母大写简称。市面上也被成为Elastic Stack。其中Elasticsearch是一个基于Lucene、分布式、通过Restful方式进行交互的近实时搜索平台框架。像类似

superviser000 2020-05-30

logstash 命令行配置选项

Logstash有以下标记，你可以使用--help标志来显示此信息。指定此Logstash实例的名称，如果没有赋值，它将默认为当前主机名。从特定的文件或目录加载Logstash配置，如果给定一个目录，则该目录中的所有文件将以字典顺序连接，然后作为一个配置文

yuzhongdelei0 2020-05-15

基于阿里云Elasticsearch的日志采集分析展示

因业务需求，需要将阿里云入口nginx访问日志进行收集统计，最原始的办法当然是将各个nginx服务器每个都统计一遍然后进行累加，这样做很麻烦不可取，鉴于我们之前已经购买过阿里云Elasticsearch服务，就想着把nginx日志采集到阿里云elastic

wzhwangzhuohui 2020-05-12

现场填坑系列：使用bulk操作提高性能，解决mongoshake 向ES同步延迟。

接到现场报告，MongoDB向ES同步数据延迟越来越大，有的已经超过10个小时，造成客户新加入的用户无法被搜索出来。由于在系统中ES类似于数仓，很多统计和第三方接系统都需要从ES获取数据，所以也影响了一些其他依赖ES数据的功能和业务。日志通过logstas

goodstudy 2020-05-11

安科网

Logstash 参考指南（Date过滤器插件）

偏头痛杨

Date过滤器插件

获取帮助

描述

Date过滤器配置选项

通用选项

偏头痛杨

相关推荐

logstash 读取MySQL数据到elasticsearch 相差8小时解决办法

Filebeat简介

logstash_output_kafka:Mysql同步Kafka深入详解

ES坑之logstash配置文件

Elasticsearch 的安装和使用（1）

Logstash Oracle同步设置

filebeat配置文件

logstash配置文件

logstash

linux安装logstash7.6.1及搭建简单ELK--logstash收集nginx日志

ELK组件

超强干货！通过filebeat、logstash、rsyslog 几种方式采集 nginx 日志

NSSM-将服务变为window service

logstash的output插件

ElasticSearch stack 6.5.4下载地址

浅尝 Elastic Stack (五) Logstash + Beats + Kafka

ELK-概念

logstash 命令行配置选项

基于阿里云Elasticsearch的日志采集分析展示

现场填坑系列：使用bulk操作提高性能，解决mongoshake 向ES同步延迟。

偏头痛杨