当前位置: 资料下载中心> 成品毕业设计> java >java134 基于网络爬虫的搜索引擎设计与实现正文

java134 基于网络爬虫的搜索引擎设计与实现

上传者:yoyo 下载量:0人 上传时间:2018-02-28 17:25 温馨提示:添加客服QQ530083379或QQ670023853(备注校外加油站以及购买的项目名字)成品程序另外加收100元可享受调试运行一次(包含指导配置环境,远程调试运行在你本机电脑跑起来) 优惠价:¥200

摘要

本文从搜索引擎的应用出发,探讨了网络蜘蛛在搜索引擎中的作用和地住,提出了网络蜘蛛的功能和设计要求。在对网络蜘蛛系统结构和工作原理所作分析的基础上,研究了页面爬取、解析等策略和算法,并使用Java实现了一个网络蜘蛛的程序,对其运行结果做了分析。

关键字:爬虫、搜索引擎

目录

摘要... 2

Abstract 3

一、项目背景... 5

1.1搜索引擎现状分析... 5

1.2课题开发背景... 6

1.3网络爬虫的工作原理... 8

二、系统开发工具和平台... 9

2.1关于java语言... 9

2.2 Jbuilder介绍... 10

2.3 servlet的原理... 12

三、系统总体设计... 14

3.1系统总体结构... 14

3.2系统类图... 14

四、系统详细设计... 17

4.1搜索引擎界面设计... 17

4.2 servlet的实现... 19

4.3网页的解析实现... 20

4.3.1网页的分析... 20

4.3.2网页的处理队列... 21

4.3.3 搜索字符串的匹配... 22

4.3.4网页分析类的实现... 22

4.4网络爬虫的实现... 25

五、系统测试... 33

六、结论... 35

致谢... 35

参考文献... 36



上一篇:     java133 基于粗糙集的数据结构课程设计评估系统
下一篇:    java135 基于遗传算法的自动排课系统(工硕)