编者按:提起搜索,人们会马上想到google、百度这样的搜索引擎巨头,然而这主要指个人搜索领域,在企业搜索领域,google、百度等却难敌Autonomy等专注企业搜索的厂商。
【IT168 专稿】我们知道,在大众化的搜索工具方面,我们可以通过填入关键词、布尔值等方式,去搜索网络上的内容。但这个过程中,不能查找我们本机的数据信息。为了解决这个问题,我们可以使用类似Google desktop桌面搜索工具,但这样的工具又不能搜索企业网络内的数据信息。
以上就是个人搜索范畴,而实际工作中,我们还需要企业级搜索,那就是在专有的企业网络中,准确、安全地搜索企业数据,特别是各种非结构化数据信息。
针对企业搜索,IDC给出了这样的解释,"企业级搜索是一种组织的需求,属于搜索引擎的高级应用。企业用户对信息的需求不仅仅限于简单的查询结果,而是结合搜索、数据库查询、语义和句法分析、分类和聚类、相关性分析等技术,整合现有的信息资源,提炼出具有商业价值或社会价值的数据支持。"
准确搜索的前提:理解非结构化数据
要整合企业网络内部的信息资源,首先要面对的就是:占企业所有数据中80%的各种各样非结构化数据信息,例如电话交谈记录、语音留言、电子邮件、Word 文档、纸质文档、图像、网页、视频以及数以百计其他形式的内容。(结构化数据指:与数据库相关的数据,例如Oracle、Lotus Notes、ODBC 兼容类型数据)
对于这些非结构化的数据信息,我们缺乏能够理解并有效利用这些内容的技术,这一内容丰富而又充满战略意义的资源常常无法发挥其作用。在这种情况下,我们通常会通过人力手工的方式,去分类、归档,而这种方式必然是低效的。
要解决这些问题,就需要一种这样的信息处理平台:不但能够处理所有类型的信息,而且能与现行成熟的结构化数据库处理方式相统一。目前,英国的Autonomy公司就采用了这种技术平台,并为企业搜索用户提供了一种独特的解决方案。通过独特的技术组合,Autonomy 让计算机能够自动并且实时地从语境上理解所有数字内容的含义,从而取代了以往处理、分析信息时耗时耗力的手动操作。