搜索高手炼成三部曲——搜索引擎的原理、技巧
分类:产品运营 热度:

  摘 要:《普通高中信息技术课程标准》中信息采集与加工模块是信息处理的起点。其中,通过计算机和网络进行信息的搜索是信息采集的重要途径。为了帮助人们在浩瀚的因特网中快捷、有效地搜索到所需信息,计算机技术专员研发了搜索引擎及相关技术,主要是针对Web页面的文本检索工具,能够迅速、准确地检索到用户需要的信息。在此,将重点研究全文搜索引擎的基本工作原理、提炼关键词的技巧及搜索引擎的灵活运用。

  现今时代,网络已经深入我们日常生活的每个角落,因特网已成为当今社会人们获取信息和相互交流的主要渠道。其中,通过计算机和网络进行信息的搜索是信息采集的重要途径。随着信息的不断增长,共享在网络上的信息量迅速膨胀,大容量的信息资源影响着网络信息的有序性,造成了人们及时查找信息或组织信息的困扰。为此,计算机技术专员研究与开发了搜索引擎,解决了人们的这一困扰。作为使用因特网的用户,知道搜索引擎的基本工作原理,掌握提炼关键词的技巧,加上平时的积累、灵活的应用,必定能更加快捷、有效地在浩瀚的因特网中搜索到所需信息。

  搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

  现在的搜索引擎大多采用自动信息搜集功能。每隔一段时间搜索引擎主动派出蜘蛛程序,对一定范围内的互联网网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理,为搜索做好准备。

  当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量计算出各网页的相关度及排名等级,然后根据关联度高低,(按顺序将这些网页链接返回给用户。

  分析搜索引擎的工作原理,搜索结果主要根据关键词的匹配程度、出现的位置、频次等给出。对于具体搜索问题,提炼关键词成了第一步,也是最关键的一步。

  以百度搜索引擎为例。百度会严格按照提交的关键词去搜索,因此,关键词表述准确是获得良好搜索结果的必要前提。一类常见的表述不准确的情况是,脑袋里想着一回事,搜索框里输入的是另一回事。例如,要查找2013年国内十大新闻,查询词可以是2013年国内十大新闻;但如果把查询词换成2013年国内十大事件,搜索结果就无法满足需求。

  在提炼关键词时,我们尽量不要用自然语言(所谓自然语言,就是我们平时说话的语言和口气),而要从自然语言中提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知道问题的解决办法,我会怎样对此作出回答。也就是说,猜测信息的表达方式,然后根据这种表达方式,取其中的特征关键词,从而达到搜索目的。

  例如,有学生参加2014年江苏数学竞赛的复赛,只知道大概时间在7月份。如何搜索到比赛的具体情况?首先要确定的是,不要用自然语言。比如,数学复赛的具体情况,谁能告诉我呀.这是典型的自然语言,但网上和这样的话完全匹配的网页,几乎就是不存在的。因此,这样的搜索常常得不到想要的结果。我们来看这个问题中的核心词汇。对象:高中生。问题:2014江苏数学复赛。关键词中,至少应该出现数学复赛2014江苏,这是问题现象描述。一般情况下,只要对问题作出适当的描述,在网上基本上就可以找到解决对策。例:数学复赛 江苏 2014.

  知道全文搜索引擎的基本工作原理和掌握提炼关键词的技巧以后,搜索者可以解决绝大多数的搜索问题。想成为真正的高手,还需要积累点滴,灵活运用。

  如果你发现搜索结果中,有某一类网页是你不希望看见的,而且,这些网页都包含特定的关键词,那么用减号语法,就可以去除所有这些含有特定关键词的网页。

  例如,搜索水浒传,希望是关于小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:水浒传 -电视剧。注意,前一个关键词和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。

  把搜索范围限定在特定站点中。有时候,你如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式是在查询内容的后面加上site:站点域名.

  例如,你知道新浪博客上有不少学习的文章,就可以这样查询:快速排序意,site:后面跟的站点域名,不要带另外,site:和站点名之间,不要带空格。

  百度搜索,使用者用得最多的是网页搜索。打开百度网站全部产品链接,有搜索服务、新上线、导航服务、社区服务、游戏娱乐、移动服务、站长与开发者服务、软件工具、其他服务等分类。仔细浏览各个服务分类,几乎囊括了因特网上信息搜索的方方

  以百度识图为例。有些图片资源并没有配备图片的文字说明,使用者无法了解图片的完整信息。假如现在有一张动物或植物的图片,使用者并不识得,想要了解动物的名称、习性等信息,就可以尝试百度识图。百度识图的图片通过两种方式来使用,有图片文件的通过本地上传,将图片上传到百度;或者粘贴图片网址到百度识图搜索框中搜索。

  百度寻人也是一项特色服务。百度寻人是百度推出的公益互动开放平台。借助百度业界领先的搜索技术、庞大的用户规模、海量的数据优势,建立全国范围内失踪人员的开放数据库,并利用中国科学院计算技术研究所无偿提供的人脸识别技术迅速匹配失踪人员的照片,帮助家长和热心网友第一时间获取信息。

  百度搜索是常用的搜索站点,在解决一个搜索问题时,关键词提炼准确了,搜索的结果还是不令人满意,这时可以换个搜索引擎试试。

  笔者的女儿前阵子从幼儿园老师那里领回来一个亲子活动任务,做一个灯笼状的裙子。用什么材料呢?用布匹的话就得请专业裁缝师了,考虑可以使用废旧报纸做材料。提炼的搜索关键词是纸裙灯笼.使用百度搜索,可以找到相关信息,有实际指导如何做的网页较少。尝试使用搜狗更快地找到了所需信息。

  对于专业性强、严肃性高的信息,使用专业网站更能达到搜索需求。专业网站中收录的信息资源专业性强,主题明确,检索的相关性高。资源入库前进行了严格的定向筛选,质量比较高,具有较高的权威性。

  例如,想要搜索义务教育法相关的内容,找到专业网站:法律信息网,在该网站搜索框中输入关键词:义务教育法。搜索结果中不仅有义务教育法的全文,还有各地政府实施义务教育法的办法和情况信息。

  专业网站的使用是个日积月累的过程,在日常的搜索过程中要注意搜集和甄别,找到不同分类的专业网站并收藏,使用时就能快速搜索到有价值的信息。

  知道搜索引擎的基本工作原理、掌握提炼关键词的技巧、积累点滴和灵活运用,这三个部分在开始学习、应用中有前后顺序关系。学习、应用到一定阶段,用户有了实践体验后,可以根据需要深入学习搜索引擎的基本工作原理、提炼关键词的技巧等部分,

  再实践、再学习,多思考、多总结,在学习、实践的交替进行中不断进步,最终炼成搜索的高手。

  安文广,魏晓光。搜索引擎及其关键技术分析[J].电子制作,2013(17)。

上一篇:搜索引擎 下一篇:搜索引擎之技术架构
猜你喜欢
各种观点
热门排行
精彩图文