领先而富于创新性的搜索技术
对于一个有发展潜力的垂直搜索而言,技术不是功能较多的,但没有技术是万万不能的。垂直搜索引擎对技术的含金量要求实际上非常高。垂直搜索技术如果仅停留在模板级,则对信息源的覆盖能力有限,扩展规模则不可避免引起后期维护成本高的棘手问题。因此,谋求在垂直搜索领域能够成功的创业者必须考虑在信息源数量、数据容量、检索容量、技术系统稳定性等方面都达到网页库搜索引擎级别的要求。
垂直搜索一旦信息源不足,搜索范围狭窄,就会失去"垂直"的价值特性。垂直搜索的爬虫设计则需要增强定向采集能力,对和垂直搜索范围有关的,特别是与搜索产品各项属性直接相关的网页进行信息抓取,对不相关网页自动滤除。同时对于信息源的抓取优先策略设定,有两个重要的考核指标:稳定性和体验性。所谓稳定性,在大规模处理抓取信息的过程中,不能让信息源网站感到压力,而垂直搜索在显现查询结果的过程中,能够保持正常用户接受的速度和顺畅感。所谓体验性,垂直搜索的显示页面,是针对某类型产品的标准化格式,此种标准化格式基于对抓取内容的结构化数据处理产生。被结构化的搜索内容,依据此类型产品的特别属性进行设置。例如,www.shopping.com对产品购物的属性设定与搜索方式紧密结合。采用价格由低到高排列MP3产品时,标准化的产品属性包括产品图片、品牌名称、型号、存储容量、价格、可购买到的店铺数量以及星级评定,而摒除了产品颜色、产品重量、产品产地等非核心属性。而怎样的产品属性排列对用户使用垂直搜索的体验效果非常好的,需要垂直搜索不断创新性的设计搜索结果页面模式和用户的网站体验流程。达到稳定与创新的平衡,是对垂直搜索引擎建立独特优势的考验,更是获得成功的必要条件。