本书介绍了如何开发网络爬虫.内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理,如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息,以及针对抓取到的文本进行有效信息的提取.
链接:https://pan.quark.cn/s/26d4bfab5b8f