企业搜索：Google、Baidu不是我的对手-网络通信专区

企业搜索：Google、Baidu不是我的对手

作者：草上飞编辑：唐川 2008-12-15 13:05 来源：IT168�

　　搜索方法：模式识别计算技术

　　当前，有包括关键词、布尔值、参数在内的各种传统搜索方法。而Autonomy采用了建立在模式识别计算技术（非线性自适应数字讯号处理）以及语境语言分析基础上的创新语义识别搜索功能。这种搜索方式避免了关键词搜索方式容易产生的不准确信息，在信息量巨大的搜索中显得更加有效。同时，这种搜索方式不依赖语言、语种或语意，它完全把语言和文字当成一种数学符号来处理，这样可以很快把系统移植到不同的语言中去。

　　模式识别计算技术主要基于两个基本理论：贝叶斯概率论和香农信息论。

　　如果一枚硬币被连续抛100次，每次都是正面朝上，那么，抛第101次时，正面朝上的概率是多少？传统统计学观点的推论是：50%。而贝叶斯概率论则认为：100次连续正面朝上，证明该硬币不均衡或两面均为正面，所以抛第101次时正面朝上的概率会大大高于50%。可见，贝叶斯的理论更加接近人的大脑思维逻辑。

　　香农信息论则认为，出现频率越小的信息单元，代表的信息量越大。这也可以解释这样的现象：在一个嘈杂的房子中，我们尽管不能完全听清楚对方所有的话，但我们还是能听懂对方说话的意思。也就是说，每个信息载体会包含大量重复的冗余信息，在对这些信息的处理过程中，冗余信息的权重要低得多，甚至可以忽略。而在关键词搜索中，则相反，一个单词出现的频率越高，则该词的重要程度越高。

　　正是基于这两个基本理论，Autonomy在海量信息处理中取得了巨大成功。

第1页：准确搜索的前提：理解非结构化数据第2页：搜索方法：模式识别计算技术第3页：企业搜索的关键：安全性

Autonomy携新老用户在广州分享知识管理心得
赵建凯 · 2008-09-10
Autonomy 获KMWorld 杂志“2008年度潮流领导者”
赵建凯 · 2008-09-02
企业级搜索技术领导厂商Autonomy近期签约多个新客户
崔新升 · 2008-05-14
IBM升级企业搜索产品
李博（泡泡） · 2008-01-03
分析：企业搜索缘何抢眼球？
晓熊 · 2006-07-17
细数企业搜索三种技术流派
张丽婷 · 2006-07-17
企业搜索——激活被遗忘的企业财富
张丽婷 · 2006-07-17
解密企业搜索缘何抢眼球
张丽婷 · 2006-07-17
IBM联手google研究企业搜索技术
张丽婷 · 2006-07-17
微软:企业搜索是我们地盘不与Google分利
张丽婷 · 2006-07-14

下一篇文章网络通信评论

统一通信如何赢得校园应用的青睐2008-12-16

关注我们