Kibana 搜索模块涵盖的一项搜索功能是可以在搜索中使用通配符。 但是通配符是要运行的极其昂贵的查询,尤其是前置通配符。 因此,你可能要考虑禁用前导通配符,以避免有人使用它们。在我之前的文章 “
Elasticsearch:正确使用 regexp 搜索
” 中,我已经详述了避免使用前置通配符查询。具体来说就是如下类型的查询:
GET my_example/_search
"query": {
"regexp": {
"content": ".*work"
这样的查询在 Elasticsarch 中非常昂贵,一方面是 regexp 搜索本来就慢,代价很高,加之前置通配符查询,这样可能使得你的 Elasticsearch 非常繁忙 (如果你的数据量很大的情况下)。对于很多用户来说,可能希望避免这里的查询。我们可以在 Kibana 中来禁止这类的查询。请记住,尽管 Kibana 是两种查询语言:KQL 和 Lucene,所以你需要同时禁用两者。
禁止 KQL 前置通配符查询
我们首先打开 Kibana:
我们向下滚动屏幕:
针对 KQL 的搜索,我们点击上面的开关来禁止这项功能。一旦禁止后,我们来做一个实验。我们在 Kibana 中创建如下的一个 my_index:
PUT my_index/_doc/1
"category": "sports"
我们接着为 my_index 创建 index pattern,并在 Discover 中进行搜索:
在上面,我们看到了 my_index 的唯一文档。我们尝试如下的几个搜索:
显然 wildcard 的搜索是成功的。我们接着使用前置 willdcard 来进行搜索:
我们看到错误的信息,表明我的设置是起作用的。
今天,我们很高兴地宣布 Elastic 8.17 正式发布!紧随一个月前发布的 Elastic 8.16 之后,我们将 Elastic 8.17 的重点放在快速跟踪关键功能上,这些功能将带来存储节省和搜索性能优势。继续阅读以了解详情!
Elasticsearch 无疑是是目前世界上最为流行的大数据搜索引擎。根据 DB - Engines 的统计,Elasticsearch 雄踞排行榜第一名,并且市场还在不断地扩大:能够成为一名 Elastic 认证工程师也是很多开发者的梦想。这个代表了 Elastic 的最高认证,在业界也得到了很高的认知度。得到认证的工程师,必须除了具有丰富的 Elastic Stack 知识,而且必须有丰富的操作及有效的解决问题的能力。拥有这个认证证书,也代表了个人及公司的荣誉。针对个人的好处是,你可以..
你们好,我是Elastic的刘晓国。如果大家想开始学习Elastic的话,那么这里将是你理想的学习园地。在我的博客几乎涵盖了你想学习的许多方面。在这里,我来讲述一下作为一个菜鸟该如何阅读我的这些博客文章。我们可以按照如下的步骤来学习:1)Elasticsearch简介:对Elasticsearch做了一个简单的介绍2)Elasticsearch中的一些重要概念:cluster, n..........................................................
在这篇文章中,我将会把我写的有些内容录制成视频,供大家参考。希望对大家有所帮助。优酷的视频频道地址在这里。Elastic 简介及Elastic Stack 安装:优酷,腾讯 Elastic Stack docker 部署:优酷,腾讯 Elasticsearch中的一些重要概念(Cluster/Shards/Replica/Document/Type/Index):优酷,腾讯 开始使用El...............
Elasticsearch是一个非常强大的搜索引擎。它目前被广泛地使用于各个IT公司。Elasticsearch是由Elastic公司创建并开源维护的。它的开源代码位于https://github.com/elastic/elasticsearch。同时,Elastic公司也拥有Logstash及Kibana开源项目。这个三个开源项目组合在一起,就形成了 ELK软件栈。他们三个共同形成了一个强大的...
Elastic 最新发布的 logsdb 索引模式是专为日志管理优化的功能,旨在提升日志数据的存储效率、查询性能以及整体可用性。这个模式专注于满足现代日志处理需求,提供更高效的日志分析体验,同时保持 Elasticsearch 的灵活性和强大能力。
及有兴趣在 Kibana 中为 Vega 可视化添加交互式过滤器吗?了解如何利用 “kibanaAddFilter” 函数轻松创建动态且响应迅速的 Sankey 可视化。在这篇博客中,我们将了解如何启用 Vega Sankey 可视化来创建 Kibana 过滤器。Vega 是数据可视化领域的杰出工具,可让你创建详细的交互式数据可视化显示。使用简单的 JSON 语法,Vega 允许你定义可视化的外观和行为。
在 Elastic Cloud Serverless 中,我们根据索引负载自动为数据流配置最佳分片数量,从而使用户无需摆弄分片。传统上,用户会更改数据流的分片配置,以处理各种工作负载并充分利用可用资源。在中,我们引入了数据流的自动分片,使其能够根据索引负载自动管理和扩展。这篇文章探讨了自动分片的机制、其好处以及它对处理可变工作负载的用户的影响。自动分片的理念是积极增加分片数量并非常谨慎地减少分片数量,这样分片的增加不会因为工作负载在短时间内减少而过早地减少分片数量。
日志记录领域即将发生改变。在这篇文章中,我们将概述从单纯的日志记录到包含日志、跟踪和 APM 的完全集成解决方案的推荐流程。企业软件开发和运营已成为一个有趣的领域。我们拥有一些非常强大的工具,但作为一个行业,我们未能采用许多可以让我们的生活更轻松的工具。目前未充分利用的一种工具是应用程序性能监控 (application performance monitoring- APM) 和跟踪,尽管 OpenTelemetry 已经使采用它成为可能。
Microsoft Semantic Kernel 是一款轻量级开源开发工具包,可让你轻松构建 AI 代理并将最新的 AI 模型集成到你的 C#、Python 或 Java 代码库中。随着 Semantic Kernel Elasticsearch Vector Store Connector 的发布,使用 Semantic Kernel 构建 AI 代理的开发人员现在可以将 Elasticsearch 插入为可扩展的企业级向量存储,同时继续使用 Semantic Kernel 抽象。
在之前的文章 “Elasticsearch 开放推理 API 新增阿里云 AI 搜索支持”,它详细描述了如何使用 Elastic inference API 来针对阿里的密集向量模型,稀疏向量模型, 重新排名及 completion 进行展示。在那篇文章里,它使用了很多的英文的例子。我觉得阿里的模型更适合中文字来进行展示。我们知道 Elastic 的开箱即用的稀疏向量模型 ELSER 只适合英文。目前它不支持中文。恰好阿里的稀疏向量模型填补了这个空白。稀疏向量可以开箱即用。对于很多不是很精通人工智能的开
了解如何使用 OpenTelemetry 自动检测 Python 应用程序。使用 Docker 文件中的标准命令,可以快速检测应用程序,而无需在多个位置编写代码,从而实现快速更改、扩展和更轻松的管理。更多阅读,请参阅 “DevOps 和 SRE 团队正在改变软件开发过程。虽然 DevOps 工程师专注于高效的软件应用程序和服务交付,但 SRE 团队是确保可靠性、可扩展性和性能的关键。
与所有组织一样,Elastic 处理的信息和数据量不断增加,这使得我们的团队更难保持信息最新,员工也更难从相关资源中找到答案。作为一家领先的搜索 AI 公司,我们的客户至上方法始于客户零点 —— 我们自己。当我们的员工需要一种更好的方法来找到完成工作所需的信息时,我们知道我们可以使用自己的技术来实现这一愿景。快进到今天,我们推出了内部生成 AI 助手 ElasticGPT,它可以帮助员工快速找到相关信息并提高员工生产力。
BBQ 是一种新技术,它带来了令人难以置信的效率和出色的性能。在这篇博客中,我们研究了如何通过硬件加速的 SIMD 指令在 BBQ 中优化向量距离比较。你可以在 BBQ 博客中阅读有关索引和搜索性能以及准确度和召回率的更多信息。BBQ现已作为技术预览版在 Elasticsearch 8.16 和 Serverless 中发布!除了 BBQ 等新技术外,我们还在不断改进向量数据库的低级性能。FMAFFM和SIMD。
大家好!在之前的一篇博客中,我们概述了常见的索引生命周期管理 (index lifecycle management -ILM) 问题及其解决方案。此后,我们已将这些常见场景添加到我们的 Elasticsearch 文档中,并附带示例演示视频。在这里,我们将扩展 ILM 历史索引(ILM history index),以演示如何在故障排除期间使用它,并在需要干预时设置主动警报。
大家好!我们的 Elasticsearch 团队正在我们的索引生命周期管理 (ILM) 功能。当我第一次加入 Elastic Support 时,我通过我们的教程快速上手。在帮助多个用户设置 ILM 后,我注意到升级主要来自少数配置问题。在以下部分中,我想介绍常见的工单、诊断流程和常见错误恢复。显示的所有命令都可以通过 Kibana 的运行。
使配置数据生命周期变得不再那么复杂。在这篇博文中,我将介绍一些变化、如何使用它们以及一些最佳实践。数据生命周期可以包含很多阶段,因此我们将涉及:将集群划分为层(hot、warm、cold),确保新数据到达正确的位置。在索引生命周期管理 (index lifecycle management - ILM) 中使用这些层在层之间迁移数据。使用 Elastic 可搜索快照(Elastic searchable snapshots)增加冷层内的数据密度。将所有内容与数据如何流经层的真实示例结合起来。
基于全新无状态(stateless)架构的 Elasticsearch Serverless 现已正式发布。它采用完全托管方式,因此你可以快速启动项目而无需操作或升级,并且可以使用最新的向量搜索和生成式 AI 功能。我们很高兴地宣布 Elasticsearch Serverless 现已全面上市。我们,可以根据你的数据、使用情况和性能需求自动扩展。它具有 Elasticsearch 的强大功能和灵活性,且无需运营开销。自今年春季发布。
AI 与地理空间数据的集成代表了信息检索和决策支持系统的重大进步。传统搜索引擎经常难以处理基于位置的查询,但通过将大型语言模型 (large language models- LLMs) 的功能与专门的地理空间数据库相结合,我们可以创建更智能、更具有上下文感知能力的应用程序。为开发人员提供了选择权,他们可以从领先的 AI 提供商中选择任何行业领先的基础模型 (FM),并提供简化、统一的 API,以便开发人员可以在企业中构建和扩展生成式 AI 应用程序。Elastic 可以以。