站内检索

套用範围

本系统主要针对基于Internet的局部站点和基于Intranet的区域网路内部的网页资源进行快速有效的全文检索。

据统计一般的大型企业、政府、高等院校的网站内部的页面总量在1万页左右。例如：根据我们的网页蒐集系统对清华大学站内全部页面进行蒐集所获取的信息，静态页面数量在12000页左右，动态页面数量在6000页左右；我们的页面收集系统也对南京大学站内的全部静态页面进行了蒐集，结果统计页面总量在5000页左右。
这种网页数量的站点信息一方面要求检索系统更新周期短（每周更新一次），一方面还需要做到检索速度快。如果利用Google这样的搜寻引擎进行检索站内信息的话，难以保证数据的更新要求；而如果自己开发基于资料库技术的检索系统的话，又难以保证检索的高效率。正是在这种需求背景之下，本产品应运而生。
据统计，已开发国家一般的大中型网站均配有站内全文检索系统，这样可以保证客户能够在最短的时间内获取所需要的信息。反观国内，几乎90%的大中型网站都没有相应的站内全文检索系统。所以，站内全文检索，是大势所趋，越早上站内全文检索系统，网站越有吸引力。

系统的功能

本部分将为用户介绍该系统所具备的功能，其中黑体字部分是本系统独具特色的功能。

1）信息蒐集能力超强

本系统突破了传统搜寻引擎的禁区，能够处理所有的动态页面信息。传统的搜寻引擎为了防止掉入CGI陷阱中，一般都不敢处理动态页面。所谓的CGI陷阱指的是由于网路伺服器动态计算产生的页面具有很大的不确定性，造成页面蒐集程式循环访问同一个URL。通过我们的分析发现，目前绝大部分网站都採用各种脚本製作动态页面，因此如果不能对动态页面进行处理，那幺这种检索系统是不完备的。本系统採用了独有的技术完全克服了这方面的困难，从而具有更强的信息蒐集能力。

2）检索速度快

一般的非专业的检索系统都是採用资料库系统完成的，这种系统的回响时间一般都在10秒左右（对于大数据量）。而本系统的回响时间一般都在0.02秒左右，网路传输时间一般在1秒左右，因此总体回响时间在1-2秒内。这种速度显然是非常快的。

3）支持複合检索

通常情况下用户的检索是複合条件的，例如检索"新闻中心+主任"，用户想了解新闻中心的主任的一些信息。本系统支持"+、-"操作符，完全可以满足用户的检索需求。在这一点上，我们的系统同通用的搜寻引擎系统是一致的。

4）支持分类检索

目前上规模的网站一般都会将网站的信息划分为若干个频道，例如：中国教育信息网主要分为教育产品、招考中心、教育图书、科普长廊、教育动态、科研天地、学生社区、家长时段、职业培训、海外视窗、信息化成就展等几个主要的频道。这样就给站内全文检索系统提出了新的要求，应该不仅能够在整个网站内部进行检索，而且还能够将检索的範围限制在某个频道内部。基于这种需求，Xunao(V2.0)提供了分频道检索的功能。

5）支持按照更新时间範围检索

对于报社类网站、新闻类站点，时间显得尤为重要，针对这种需求，Xunao Search (V2.0)提供了按照时间範围进行检索的功能，用户可以选择搜寻的起止时间进行全文检索，这样更加体现了新闻的时效性。

站内检索

站内检索

基本介绍

套用範围

系统的功能

1）信息蒐集能力超强

2）检索速度快

3）支持複合检索

4）支持分类检索

5）支持按照更新时间範围检索

6）支持多种排序方式

7）支持模糊检索

8）结果相关度高

9）动态生成文摘

10）支持网页快照功能

11）信息蒐集、索引建立时间短

12）方便有效的管理功能