NLPIR大数据搜索与挖掘共享开发平台 v1.8
下载安装

软件介绍

NLPIR大数据搜索与挖掘共享开发平台是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。

NLPIR大数据搜索与挖掘共享开发平台主要功能:
搜索基本功能包括:
1,多字段关联搜索:非结构化与结构化字段的关联搜索,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;
2 ,指定字段排序:可以按照任意指定字段的排序;
3 ,有效搜索:支持有效匹配以及模糊匹配,默认为模糊匹配,忽略字母大小写,采用双引号进行有效匹配;
搜索特色功能包括:
1 ,内嵌正负面情感等极性分析,可以搜索任意对象的正负面结果;
2 ,语义联想搜索:如搜索“马铃薯”可以同时返回“土豆”的内容,搜索“北京市”可以返回“北京”或者“首都”的内容;语义联系词表用户可以自行根据专业知识定制;
3 ,搜索结果去重:按照指定字段对搜索结果进行去重;
4 ,邻近搜索功能:可以要求两个关键词必须在一定的词场范围内。
5 ,内嵌了智能分词系统。
6 ,数据库实时同步:数据库增删改10秒内即可同步到搜索引擎中。
搜索维护功能包括:
1 ,支持增量索引:系统可以在搜索服务不停的前提下,继续索引新的数据,索引完成后,可以搜索新的数据;
2 ,自动备份与恢复机制,在建立索引和自动优化之前,在当前索引文件被破坏无法搜索的前提下,系统将自动恢复上次搜索正常的备份文件;
3 ,自动缓存机制:系统自动保存较近常用的搜索条件与结果,再次搜索时将直接推送搜索结果内容,可以将搜索响应速度提升30%以上;缓存会随着新的索引数据自动更新,不存在缓存延迟问题;
4 ,自动优化机制:在系统索引碎片较多时,系统会自动优化归并;
5 ,屏蔽指定文档、指定关键词的搜索服务,也可以恢复屏蔽信息;
6, 实现的是多线程搜索服务;
7, 兼容当前所有厂商的数据库系统,其中SQL Server,Oracle, MySQL,DB2等。系统支持多表关联搜索;支持Windows/Linux/FreeBSD等操作系统,支持C/C++/C#/Java二次开发。

相关推荐

查看更多>

软件资讯

查看更多>

相关专题

查看更多>