9、ES高频面试题
2023-12-28 16:58:11
1、什么是倒排索引
倒排索引是搜索引擎的核心,它是一种像数据结构一样的散列图,可将用户从单词导向文档或网页。主要目标是快速从数百万文件中查找数据
倒排索引主要体现在文档的保存和查询流程中
-
保存文档时,会先根据文档进行分词,然后使用分好的词条作为key进行排序,然后将文档的标识作为value进行存储
-
查询文档时,也会先对查询关键字进行分词,然后根据分好的词条直接定位相关文档,再做结果的合并
2、ES中的查询关键字有哪些
在ES中用于声明查询条件的关键字主要有:
-
match_all:查询所有
-
match、multi_match:全文检索
-
term:精准词条查询
-
range:范围查询
-
bool、must、must_not、should、filter:复合查询
还有一些跟地理位置、相关性算分相关的
3、ES中字符串类型有几个
ES有两个字符串类型,分别是:keyword 和 Text,他们两个的区别主要是在分词方面
- keyword类型的字符串是不会分词的,直接根据字符串内容建立倒排索引
- Text类型的字符串在保存到ES时会先分词,然后根据分词后的内容建立倒排索引
4、ES中query和filter的区别
query和filter都可以实现ES中的查询,区别是
- query查询操作不仅仅会进行查询,还会计算分值,用于确定相关度
- filter查询操作仅判断是否满足查询条件,不会计算任何分值,也不会关心返回的排序问题,同时,filter查询的结果可以被缓存,提高性能。
5、如何保证ES和MySQL的数据一致性
保证MySQL和ES数据一致性的方式有很多,下面列举几个:
- 同步双写:程序在向MySQL写入数据之后,立即将数据写入ES中。这种方法可以确保数据的实时同步,但可能会增加系统的复杂性和延迟。
- 异步消息:程序在在向MySQL写入数据之后,向MQ中投递消息,ES相关程序监听MQ,获取数据,写入ES
- canel监听:使用canel监听MySQL的binlog,当发现写入操作后,立即读取内容,写入ES
- logstatsh:使用logstatsh将MySQL中的数据实时传输给ES
文章来源:https://blog.csdn.net/qq_17462303/article/details/135270116
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!