Show simple item record

dc.contributor.author义天鹏
dc.contributor.author陈启安
dc.date.accessioned2014-07-03T02:30:25Z
dc.date.available2014-07-03T02:30:25Z
dc.date.issued2012-11
dc.identifier.citation计算机工程,2012(22):279-282zh_CN
dc.identifier.urihttps://dspace.xmu.edu.cn/handle/2288/80441
dc.description航空科学基金资助项目(20085568013)zh_CN
dc.description.abstract针对Lucene自带的中文分析器分词性能不理想并且难以选择第三方分析器的问题,研究多种基于Lucene的中文分析器,对语句分词、分词速度、建立索引的空间与时间、检索结果以及检索速度等方面进行比较。分析结果表明,在Lucene框架下,基于词典分词的Paoding分析器总体性能最优,Lucene自带的一元分析器分词速度最快,imdict与ICTCLAS4J分析器在算法效率上存在一定改进空间。zh_CN
dc.language.isozhzh_CN
dc.publisher计算机工程zh_CN
dc.subjectLucene框架zh_CN
dc.subject搜索引擎zh_CN
dc.subject中文分词zh_CN
dc.subject分析器zh_CN
dc.subject分词速度zh_CN
dc.subject索引zh_CN
dc.subject检索zh_CN
dc.title基于Lucene的中文分析器分词性能比较研究zh_CN
dc.typeArticlezh_CN


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record