如何确定网页和查询的相关性

[我们已经谈过了如何自动下载网页、如何建立索引、如何衡量网页的质量(Page Rank)。我们今天谈谈如何确定一个网页和某个查询的相关性。了解了这四个方面,一个有一定编程基础的读者应该可以写一个简单的搜索引擎了,比如为您所在的学校或院系建立一个小的搜索引擎。]

我们还是看上回的例子,查找关于“原子能的应用”的网页。我们第一步是在索引中找到包含这三个词的网页(详见关于布尔运算的系列)。现在任何一个搜索引擎都包含几十万甚至是上百万个多少有点关系的网页。那么哪个应该排在前...

名人网页的相关度评价

 昝红英1,2 苏玉梅1 孙斌1 俞士汶1
1 北京大学计算语言学研究所 北京 100871
2 郑州大学信息工程学院 河南郑州 450052
zanhy@pku.edu.cn
摘 要 本文介绍了北京大学天网知名度系统的设计与开发工作,重点论述了其中网页
相关度评价的因素,算法和相应的检索结果.系统在北京大学天网搜索引擎的基础上,运用
中文信息提取的新技术,结合网页信息的特点,针对名人网页的检索提出了一种新的网页相
关度评价算法,改善了检索结果的排序合理性,提高了名...

生活就是做一个网页,接着又做一个网页

为了研究研究Blog,网站的Blog又开始试运行了,这回要保证她的存活期,希望是我作古之后的事情。 http://www.16u.cn/ ...

分页:[«]1[»]

Powered By Pigloo and Z-Blog

Copyright Eyenovo.com 道行天下. Some Rights Reserved.