基于模板匹配需求识别的方法研究与应用
Research and Application of Demand Recognition Method Based on Template Matching
Abstract
传统的搜索引擎的搜索方式是基于倒排索引的全文检索,也就是根据搜索语句查询索引库中的检索方式,并没有很好地利用搜索语句所表达的含义,这样就不能准确识别出用户的具体需求,势必会给用户带来更大的搜索成本。垂直搜索的引入解决了传统搜索引擎的这一不足,而实现垂直搜索首先就是要识别用户搜索语句的含义,这也是自然语言处理所要解决的问题。 本文设计了基于模板匹配的需求识别算法,并在这个需求识别算法的基础上针对股票垂直类目词典挖掘的具体应用进行了设计与验证,提出了相关的数据结构和算法。为了设计需求识别算法和股票垂直类目词典挖掘方案,本文研究了相关词典查找技术,并介绍了本文中使用的机器学习分类技术和海量数据处理... The way of traditional search engine to search the full text retrieval is based on the inverted index. That is based on string matching retrieval methods, and not a good use of the search statement on behalf of the meaning of users’ queries. This does not recognize the user's specific needs, and bounds to give users greater search costs. Introduction of vertical search to solve this shortcoming of...