用Ultra Search自建超级搜索
|
日期:2007年7月2日 作者: 查看:[大字体
中字体 小字体]
|
Oracle9i数据库的Ultra Search组件能为你的网站提供搜索引擎功能,而且,即使没有软件开发经验的电脑爱好者也可以用不到一天的时间建成自己的搜索引擎。下面就把我制作搜索引擎的全过程展示给大家,下文中所有图片都来自我的搜索引擎实例。 Ultra Search概述 Ultra Search是Oracle公司数据库服务器9i版本的功能组件,是数据库产品的附加功能,它有与其它搜索引擎类似的技术构架,又有自己独到的功能特性。 Ultra Search提供对于四种数据源的基于Web的搜索应用。 1、Web源。 图1为Ultra Search搜索Web站点的情形。
图 1 搜索Web站点(基础搜索) 2、文件源。 文件源是指Ultra Search数据库计算机可以访问的文档集,文件类型为包括Word文件在内的150多种常见格式的文件,也包括图形图象文件和视频剪辑。文档集位于本地或远程主机中,这些文档通过文件协议进行索引,可以根据需要创建任意多不同类型的文件源。HTML和纯文本是始终要处理的默认文档类型。图2为Ultra Search对文件服务器搜索的结果,如图所示,已经找到一个类型为"file"的PowerPoint文件。文件源通过file://协议索引,Ultra Search使用Oracle Text过滤器从文档吸取文本和元数据,并自动识别文档类型。如:Microsoft Office Suite 95/97/2000、Spreadsheet documents(如Microsoft Excel、Lotus 1-2-3)、Word 文件(如Microsoft Word 和 Corel Word Perfect)、Acrobat PDF文件、图形表现文件(如Microsoft PowerPoint、Lotus Freehand)等。 图 2 搜索文件服务器(高级搜索) 3、电子邮件源 电子邮件源代表发送到特定邮件地址的所有邮件,可以将Ultra Search配置为从IMAP服务器搜索电子邮件,这个功能对于搜索发送到邮件列表的邮件特别有用。 4、表源 表源是其内容来源于数据库表的数据源,可创建任意多个新表源,表可来源于多个数据库链接,可以是Oracle数据库或通过ODBC连接的非Oracle数据库,可以实现针对表中列的高级搜索。 Ultra Search是一个全面基于Oracle Text的应用程序,它为Oracle Text用户提供界面友好的Web形式的搜索能力而不需要任何深层的SQL编程,而大量深层技术已被嵌入到转化和调整Web页面查询到底层的基于SQL的Oracle Text查询的过程中。Ultra Search使用对Oracle Text用户来说同样有效的公共接口建立,但增加了相当可观的专门技术在聚集信息的索引、转换查询上,因此有更高质量的查询性能和可扩展的最优化操作。因为Oracle Text与Oracle数据库高度集成,所以实现了Ultra Search自由与动态数据交互。 Ultra Search的组成 Ultra Search由3个组件组成: 1、服务器组件 服务器组件是Oracle9i数据库服务器中的一个组件,它包括:Ultra Search资料库(Ultra Search数据字典、PL/SQL包、Crawler Java类、Ultra Search产品库)、Oracle Text和远程Crawler。 2、Crawler "Crawler"英文本意是爬行动物,而在搜索引擎中它象蜘蛛一样爬行在Internet这张网上,爬行过程就是收集信息并建立索引的过程。 3、中间层组件 中间层组件是Oracle9i数据库服务器的一部分并随着客户端的安装被安装在相同的目录下(可单独定制安装),它包括:管理工具、Java查询应用程序接口、Java电子邮件应用程序接口和JSP查询应用程序。管理工具是JSP页面的Web应用程序,你可以使用它配置和规划数据库实例、数据源、Crawler,管理用户和查询组。Java应用程序接口使用JDBC连接池实现可伸缩性,Java电子邮件应用程序接口用于访问和显示已归档的电子邮件。用户可基于这些接口开发自己的查询应用程序。Ultra Search已经提供一个功能很强的查询应用程序,见图1基础搜索和图2高级搜索,它们基于JSP页面并能工作于任何符合JSP1.0规范的Web服务器引擎。 本文只介绍Ultra Search对Web源和文件源的搜索实现过程。 系统环境为: ● 操作系统:Windows 2000 Advance Server,IIS5.0; ● 数据库:Oracle9.0.1企业版; ● 运行方式:数据库服务器、客户端管理工具和Oracle HTTP Server都运行在同一台主机上。 Oracle9i数据库企业版可从Oracle网站(www.oracle.com免费下载,它已经包含了建设Ultra Search搜索引擎所需要的全部软件组件,另外还需大内存计算机来运行数据库。
上一篇:Web应用开发工具 —— WebDB介绍
下一篇:Oracle2006年7月更新修复多个安全漏洞
|
| 用Ultra Search自建超级搜索 相关文章: |
|
|
|
| 用Ultra Search自建超级搜索 相关软件: |
|
|
|