种豆资源网

当前位置:首页 > 百科 > 百科综合 / 正文

全文检索产品

(2020-04-22 21:00:13) 百科综合

全文检索产品

企业搜寻在安全方面的要求远远高于网际网路搜寻。企业内部的各种信息内容带有明显的安全级别属性和部门归属属性。几乎每个企业都严格规定了什幺样的信息可以给什幺样的人阅读,某种信息归属哪个部门发布与存储。

基本介绍

  • 中文名:全文检索产品
  • 特点1:多作业系统、多平台、多资料库
  • 特点2:支持多数据源採集
  • 特点3:智慧型化的检索服务

“企业级安全”的搜寻引擎

严格的信息安全分级体系,保证信息可管理性
起点企业搜寻平台针对企业内部信息系统中,不同的用户使用许可权不同的这一特点,提供针对用户、对资源进行许可权分级管理和控制能力,确保企业内部信息系统的安全。各种资源在接入系统时会要求设定安全级别,便于对用户访问行为进行控制。
可靠的安全保障手段,实现系统的授权访问管理
起点企业搜寻平台广泛採用了用户帐号许可权控制、IP位址授权和过滤技术,保证对系统的接入安全。通过信息智慧型分析和过滤机制,设定敏感词表和禁查词表,对检索结果中的敏感信息提供安全管理。实现完善的日誌记录机制,保证信息的访问和阅读有据可查,便于及时处理各种信息内容安全隐患。
良好的安全扩展体系,可方便的与内部系统对接
起点企业搜寻平台在数据採集和获取过程中,通过安全的扩展体系,支持以授权方式访问内部信息系统、内部文档目录,保证安全的基础上,实现信息的共享服务。支持对内部某些信息系统的许可权统一管理,实现系统间的许可权映射。

多作业系统、多平台、多资料库支持

本产品支持的作业系统、套用伺服器、资料库如下:
作业系统
Windows
Linux
Unix
套用伺服器
Tomcat
Weblogic
Websphere
Resin
Apache
IIS
资料库
Mysql
Sql Server
Oracle
DB2
其它……
其它必备环境
JDK1.5 以上版本

支持多数据源採集

通过指定档案伺服器、数据文档目录等方式,灵活管理数据来源,根据不同目录或来源划分为后续安全管理提供自动级别信息。根据内容来源,判断是否需要进行文档格式化分析,将资料库直接读取的结构化信息和半结构化网页信息通过分析模组和元数据描述进行统一。
除了基于非结构化数据进行採集外,还可对PDF、WORD、HTML、TXT、各种图片等四十多种档案格式自动採集。同时根据用户需要本系统也支持採集其它各类数据源,例如:XML档案、其它数据池等。

智慧型化的检索服务

起点产品在全文检索过程中採用相关智慧型技术以达到迅速、準确、全面定位目标信息。例如採用相关度分析技术,使相关度较高的结果排在结果列表的前面,相关度较低的结果排在后面,并禁止无用和错误的信息;构造强大的语义规则库,使系统能够正确地判断与检索词相关的同义词、近似词、上位词、下位词,帮助用户判断结果的相关度,并进行进一步的查询;支持完善的信息分类体系,对检索结果自动分类或者信息聚类;提供智慧型化的概念扩展查询等。通过这些技术,能够满足大多数智慧型化搜寻需求。

强大的信息海量数据实时索引和管理功能

起点产品不仅提供了快速检索功能(在千万级数据下,全文检索能在1秒钟之内完成),同时也有着高效的海量数据处理能力。每小时能处理百万的资料库数据,或是几十万篇的文档。包括中文的分词和建立数据索引。我们的产品在多个大型项目中经过了实际的检验,成功实施过多个超过5千万数据规模的项目。

中文语言处理技术

中文语言处理是搜寻引擎必须具备的技术之一,套用中文语言处理技术才能使搜寻结果更加符合用户习惯,更加接近用户的期望结果,起点产品集成了中文分词技术,并有着40万词库的支持,用户也可以根据自己的需要和行业特色来添加和维护词库。中文分词技术的準确率和召回率都达到96%以上。

健壮可靠的系统,按需扩展

针对大型套用系统和海量数据的环境,提供多机分散式或双机互备的服务体系结构,通过把企业内部各种内容分布到不同伺服器,可实现用户的套用层实现透明访问,支持松耦合自动切换的双机备份策略,提高系统的运行可靠性。分散式架构允许通过增加硬体的方式增加系统处理能力。8. 支持多种语言开发接口,与其他系统无缝集成 起点产品以标準的WebService和标準XML方式提供多种语言开发接口,支持的语言包括.NET,JAVA,PHP等。可与各类WEB套用进行无缝集成。同时提供完善的二次开发API手册帮助及套用示例。

操作简易、维护方便

起点产品提供完整的后台界面,所有配置和操作都可以通过IE访问产品后台进行,操作简易,维护方便,同时也不影响伺服器的安全性。

标 签

搜索
随机推荐

Powered By 种豆资源网||