编程问答

前端开发问题 Java开发问题 C/C++开发问题 Python开发问题 C#/.NET开发问题 php开发问题 移动开发问题 数据库问题

KeywordAnalyzer 和 LowerCaseFilter/LowerCaseTokenizer

2023-06-29Java开发问题

2

本文介绍了KeywordAnalyzer 和 LowerCaseFilter/LowerCaseTokenizer的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着跟版网的小编来一起学习吧！

问题描述

我想构建自己的分析器，同时使用过滤器/标记器.

I want to build my own analyzer that uses both filters/tokenizers.

我的意思是，相同的字段是 Keyword(整个流作为单个标记)和小写

I mean, the same field is Keyword (entire stream as a single token) and lowercase

如果 KeywordAnalyzer仅使用，字段的值不区分大小写.如果我使用 LowerCaseTokenizer 或LowerCaseFilter 我要结合它们与其他执行相同操作的分析器 KeywordAnalyzer(不使用字母、空格、删除停用词等分隔)

If KeywordAnalyzer use only, the value of field keeps the case-insensitive. If I use LowerCaseTokenizer or LowerCaseFilter I have to combine them with other analyzers that do the same thing KeywordAnalyzer (separated by no letter, by spaces, remove stop-words, etc.)

问题是:有没有办法使用过滤器或分析器 Lucene 或标记器将该字段设为关键字(将整个流作为单个标记)和小写?

The question is: Is there any way to make that field as Keyword (entire stream as a single token) and that lowercase using filters or analyzers Lucene or tokenizers?

(谷歌翻译，错误见谅)

(google translated, sorry about errors)

推荐答案

这应该可行:

public final class YourAnalyzer extends ReusableAnalyzerBase { 

  @Override
  protected TokenStreamComponents createComponents(final String fieldName, final Reader reader) {
    final TokenStream source = new KeywordTokenizer(reader);
    return new TokenStreamComponents(source, new LowercaseFilter(Version.LUCENE_36, source));
  }
}

这篇关于KeywordAnalyzer 和 LowerCaseFilter/LowerCaseTokenizer的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持跟版网！

The End

相关推荐

如何使用 JAVA 向 COM PORT 发送数据?

如何使用 JAVA 向 COM PORT 发送数据?

How to send data to COM PORT using JAVA?(如何使用 JAVA 向 COM PORT 发送数据?)...

2024-08-25 Java开发问题

21

如何使报表页面方向更改为“rtl"?

如何使报表页面方向更改为“rtl"?

How to make a report page direction to change to quot;rtlquot;?(如何使报表页面方向更改为“rtl?)...

2024-08-25 Java开发问题

19

在 Eclipse 项目中使用西里尔文 .properties 文件

在 Eclipse 项目中使用西里尔文 .properties 文件

Use cyrillic .properties file in eclipse project(在 Eclipse 项目中使用西里尔文 .properties 文件)...

2024-08-25 Java开发问题

18

有没有办法在 Java 中检测 RTL 语言?

有没有办法在 Java 中检测 RTL 语言?

Is there any way to detect an RTL language in Java?(有没有办法在 Java 中检测 RTL 语言?)...

2024-08-25 Java开发问题

11

如何在 Java 中从 DB 加载资源包消息?

如何在 Java 中从 DB 加载资源包消息?

How to load resource bundle messages from DB in Java?(如何在 Java 中从 DB 加载资源包消息?)...

2024-08-25 Java开发问题

13

如何更改 Java 中的默认语言环境设置以使其保持一致?

如何更改 Java 中的默认语言环境设置以使其保持一致?

How do I change the default locale settings in Java to make them consistent?(如何更改 Java 中的默认语言环境设置以使其保持一致?)...

2024-08-25 Java开发问题

13

热门文章

1如何解决不必要的存根异常 2此处检测到错位的参数匹配器.您不能在 Mockito 中的验证或存根之外使用参数匹配器 3Android 致命信号 7 (SIGBUS) 4无法使用 SMTP 发送电子邮件(获取 javax.mail.MessagingException:无法将套接字转换为 5javax.mail.AuthenticationFailedException:连接失败，没有指定密码? 6使用 bouncycastle 签名和验证签名的正确方法 7使用 Mockito 从模拟中抛出已检查的异常 8即使在添加 @PrepareForTest 之后，Mockito 也会要求为该类添加 @PrepareForTest

热门精品源码

最新VIP资源

1多功能实用站长工具箱html功能模板 2多风格简历在线生成程序网页模板 3论文相似度查询系统源码 4响应式旅游景点宣传推广页面模板 5在线起名宣传推广网站源码 6酷黑微信小程序网站开发宣传页模板 7房产销售交易中介网站模板 8小学作业自动生成程序