mmseg4j-solr

mmseg4j for lucene or solr analyzer

  • 所有者: chenlb/mmseg4j-solr
  • 平台:
  • 许可证: Apache License 2.0
  • 分类:
  • 主题:
  • 喜欢:
    0
      比较:

Github星跟踪图

mmseg4j-solr

mmseg4j for lucene or solr

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
	<analyzer>
		<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
	</analyzer>
</fieldtype>
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
	<analyzer>
		<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
	</analyzer>
</fieldtype>
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
	<analyzer>
		<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" />
	</analyzer>
</fieldtype>

tokenizer 的参数:

  • dicPath 参数 - 设置自定义的扩展词库,支持相对路径(相对于 solr_home).
  • mode 参数 - 分词模式。

版本

  • 2.0.0 - 要求 lucene/solr >= 4.3.0。在 lucene/solr [4.3.0, 4.7.1] 测试过兼容可用。
  • 2.1.0 - 要求 lucene/solr 4.8.x
  • 2.2.0 - 要求 lucene/solr [4.9, 4.10.x]
  • 2.3.0 - 要求 lucene/solr [5.0, ]
  • 2.4.0 - 要求 lucene/solr [6.0.0, ], 测试到 6.3.0 通过。

maven

<dependency>
    <groupId>com.chenlb.mmseg4j</groupId>
    <artifactId>mmseg4j-solr</artifactId>
    <version>2.4.0</version>
</dependency>

download

mmseg4j-solr

wiki

wiki

主要指标

概览
名称与所有者chenlb/mmseg4j-solr
主编程语言Java
编程语言Java (语言数: 1)
平台
许可证Apache License 2.0
所有者活动
创建于2014-03-31 14:33:06
推送于2024-02-09 21:43:44
最后一次提交2017-01-01 23:39:58
发布数6
最新版本名称2.4.0 (发布于 2017-01-01 23:39:58)
第一版名称mmseg4j-solr-2.0.0 (发布于 2014-04-12 20:34:49)
用户参与
星数398
关注者数65
派生数140
提交数41
已启用问题?
问题数34
打开的问题数16
拉请求数0
打开的拉请求数3
关闭的拉请求数5
项目设置
已启用Wiki?
已存档?
是复刻?
已锁定?
是镜像?
是私有?