搜索引擎的发展史 1990年以前,没有任何人能搜索互联网。
所有搜索引擎的祖先,是1990年由Montreal(加拿大的蒙特利尔)的McGill University学生 Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie( Archie FAQ )。
虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此AlanEmtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。
Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
由于Archie深受欢迎,受其启发,Nevada(美国的内华达州) System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ )搜索工具Veronica(Veronica FAQ )。
Jughead是后来另一个Gopher搜索工具。
Robot(机器人)一词对编程者有特殊的意义。
Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。
由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider( Spider FAQ )程序。
世界上第一个Spider程序,是MIT Matthew Gray 的Worldwide Web Wanderer,用于追踪互联网发展规模。
刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月 Martijn Koster 创建了 ALIWEB (Martijn Koster Annouces the Availability of Aliweb ),它相当于Archie的HTTP版本。
ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。
其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。
到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryans World Wide Web Worm )、NASA的Repository-Based Software Engineering (RBSE) spider。
JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。
而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。
到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。
(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎 Dogpile 。
目前Excite隶属于Ask Jeeves公司。
) 1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy (Tradewave Galaxy)上线。
除了网站搜索,它还支持Gopher和Telnet搜索。
(1)萌芽和雏形时期(1990—1993):搜索引擎的起源可以追溯到1990年加拿大蒙特利尔大学学生A1an Emtage开发的Archie。
当时Web还没有正式应用,Archie用于检索分散在FTP服务器上的文件,它的工作原理与搜索引擎很接近,就是依靠脚本程序自动搜索网上的文件,然后对相关信息进行索引,供用户以特定方式查询。
(2)初建与扩容时期(1994—1996)。
1994年4月,Web Crawler公司的WebCrawler搜索引擎在网上正式发布;6月,Lycos公司建立的Lycos搜索引擎开始服务;年底,Yahoo!公司创办并正式建立了Yahoo!站点。
1995年,Excite公司和Digital公司先后发布了Excite和A1taVista搜索引擎。
到了1996年,已经有10多家较大的搜索引擎投入运行,竞争的焦点是谁家的数据库更大,谁家的索引更新最快。
这一时期的搜索引擎收集的网页数量基本都超过了1000万个,并向着5000万个发展,对Internet的扩张产生了极大的促进作用。
(3)注重质量建设时期(1997—1999)。
从1997年开始,搜索引擎从追求容量转向迫求质量,力争做出最好的索引。
以HotBot、Google等为代表的一批搜索引擎,不再追求搜索引擎数据库的大而全,而是追求收录网页和查询的质量。
Hobot、google等被业界人士称为搜索引擎的规范楷模,并逐渐确立了自己在搜索引擎市场的优势地位。
(4)多向发展时期(2000一)。
进入21世纪之后,国外搜索引擎进入到多向发展时期。
搜索引擎的数量已经达到3500个左右,其中既有大型综合性搜索引擎,也有特定领域的专业搜索引擎。
资料来源:王怀诗主编. 信息检索与利用教程. 兰州大学出版社, 2007.
1990年:第一个互联网上的搜索引擎Archie出现,用于搜索FTP服务器上的文件。
1993年:6月,第一个Web搜索引擎World Wide Web Wandere出现,它只用来收集网址。
10月,第二个Web搜索引擎ALIWEB出现。
开始索引标题标签等信息。
1994年:1月,早起最重要的搜索引擎之一Infoseek创立。
(网络创始人李彦宏就是其核心工程师之一)4月,雅虎Yahoo!创立。
同月,第一个全文搜索引擎(索引文件全部内容)WebCrawler推出。
6月,Lycos创立。
迅速成为最受欢迎的搜索引擎之一。
1995年:4月,雅虎Yahoo!正式成立。
12月,Infoseek成为网景浏览器的默认搜索引擎。
同月,Alta Vista创立,迅速成为搜索引擎发展中最受欢迎的,堪称当时的谷歌Glloge。
1996年:4月,雅虎Yahoo!上市。
1997年:4月,Ask Jeeves上线,唯一一个至今仍真实存在并有一定市场份额的早起搜索引擎。
1998年:9月,谷歌Google正式成立。
1999年:6月,曾经流行一时的搜索引擎Infoseek消失。
2000年:1月18日:网络成立。
7月,雅虎Yahoo!使用谷歌Google搜索数据。
2001年:10月,网络作为搜索引擎正式上线。
2002年:3月,谷歌Google Adwords 推出PPC形式,也就是按点击付费。
2003年:7月,雅虎Yahoo!将除了谷歌Google之外的几乎所有主流搜索技术收归旗下。
2004年:8月,谷歌Google上市。
2005年:8月,网络上市。
2006年:9月,MSN网络品牌全部改为Live、并做了大量推广,Google仍然占最大地位。
2007年:3月,谷歌Google开始提供类似网站联盟的按转化付费的广告形式。
2009年:6月,微软Live Search 改名为必应(Bing)7月29,雅虎Yahoo!被自己亲手培养的Google谷歌彻底打败在搜索引擎战场。
2010年:8月,Yahoo!雅虎开始使用必应Bing搜索数据。
2011年:2月,Google谷歌推出Panda更新,旨在减少搜索结果中低质量页面。
对seo优化业绩影响深远。
2010年8月,NetMarketShare 统计数据,全球搜索引擎市场份额中谷歌Google占据�.73,占世界绝对领先地位,网络由于中国搜索用户数量庞大,搜索量排在第三位。
但是国外使用网络者很少。