Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言直接http调用,同时提供了最新版本的lucene,solr和elasticsearch的分词接口! Jcseg 2.2.0更新内容如下:
关于同义词: 同义词具体格式参考码云项目下的vendors/lexicons/lex-synonyms.lex 词根,同义词1[/可选拼音],同义词2[/可选拼音],...同义词n[/可选拼音] 例如: 研究,研讨,研发,研磨/yan mo 2,同义词要求: 01),第一个词条为词根,这个词条必须是CJK_WORD词库中已有的词条 该版本已经在自己的NLP平台中稳定运行3个月+,稳定性已经经过压测,NLP需求的重点升级! 最新版本下载地址: 1,大码云:http://git.oschina.net/lionsoul/jcseg/tree/v2.2.0-release 2,github:https://github.com/lionsoul2014/jcseg/releases/tag/v2.2.0-release 3,maven仓库 |