奇虎搜索基本语法包括“与”“或”和“非”,这三种搜索语法分别用“ ”(空格)、“or”和“-”表示。
当搜索结果是由两个或两个以上查询词一起构成,需要使用“与”操作,查询词之间用“空格”分隔。搜索“A B”,意思就是说,搜索的帖子中,既要有A,又要同时有B。如果多个查询词间关系紧密,连接在一起的搜索效果会更好。例如:搜索“MP3下载”比“MP3 下载”效果好。
如果搜索结果至少要包含多个查询词中的任意一个,需要使用“或”操作。“或”操作使用“or”。搜索“A or B”,意思就是说,搜索的帖子中,要么有A,要么有B,要么同时有A和B。
如果搜索结果要求不包含某些特定信息,需要使用“非”操作。奇虎搜索用减号“-”表示“非”操作。例如:搜索“A –B”,表示搜索包含A但没有B的全部帖子。
如果输入的查询词很长,奇虎搜索会对查询词做分析处理,因此给出的搜索结果可能是把查询词拆分之后得到的。如果您对这种搜索结果不满意,可以尝试让奇虎搜索不拆分查询词。使用英文双引号将查询词括起来,就可以实现精确匹配效果。此时搜索结果的相关性通常较好。
默认情况下奇虎搜索对文章的全部正文内容做查询处理。可以使用“title:”语句限定只针对标题进行搜索。例如:搜索“title:刘德华”,搜索引擎会返回所有标题中包含“刘德华”的帖子。通常情况下标题能够较准确的描述帖子内容,所以使用“title:”进行搜索的结果可能更精确。
“site:”“forum:”“author:”都可以用来指定奇虎搜索返回不同来源的搜索结果。“site:”用于指定搜索结果来自同一域名下。例如:搜索site:tianya.cn,奇虎搜索返回域名“www.tianya.cn”下论坛的全部帖子。
“forum:”用于指定搜索结果来自同一论坛名称下。例如:搜索forum:家电论坛,奇虎搜索返回论坛名称为“家电论坛”的全部帖子。
“author:”用于指定搜索结果来自同一作者名称下。例如:搜索author:ABC,奇虎搜索返回作者名称为“ABC”的全部帖子。
对于奇虎搜索尚未收录的论坛,通过论坛提交可以实现快速收录。在提交页面填写论坛的链接地址、以及用来接收成功收录通知的E-Mail信箱即可。
奇虎搜索欢迎高质量的论坛,有可能不会收录出现如下情况的论坛:
1、论坛帖子需要登录才能查看;
2、论坛所在主机不稳定,经常出现当机,无法访问;
3、存在发贴机发布的大量信息;
4、论坛缺乏管理,充斥大量广告帖;
5、镜像论坛。
经过我们检查,部分虚拟主机服务器禁止奇虎搜索爬虫程序的抓取,这是导致部分论坛长期无法被收录的主要原因,如果您遇到类似情况,请联系您的虚拟主机服务商,我们的爬虫程序IP段是 220.181.33.*,解除封锁后,很快您的论坛就可以被收录。
奇虎搜索提供搜索结果的RSS输出。在RSS中,搜索结果按时间排序。通过RSS阅读器订阅,任何人都可以方便地跟踪搜索结果的最新变化。在搜索结果页右侧的“订阅搜索结果”模块中,提供几种主流RSS阅读工具的自动订阅服务。选择不同的阅读器名称,搜索结果将被订阅到指定的阅读器中。如果您使用的RSS阅读器不在其中,可以通过选择菜单中的“RSS”选项,获得当前搜索结果的RSS地址,拷贝地址后在RSS阅读器中直接输入进行订阅。
RSS是一种文本格式。RSS (也被称为feed)通常只包含简单的信息列表。一般而言,每一段信息都会包含标题,内容节选,还有一个URL链接(通常是信息原始页面的链接),其他的信息,例如:日期,创建者的名字等等。 用户借助RSS阅读工具(例如:国内的抓虾、鲜果,国外的Bloglines等),管理收集到的RSS。在不打开原网站内容的情况下使用RSS阅读器直接阅读来自不同网站的更新内容,实现集中管理,集中阅读。