网络数据采集技术:Java网络爬虫实战在线阅读
会员

网络数据采集技术:Java网络爬虫实战

钱洋等
开会员,本书免费读 >

计算机网络编程语言与程序设计6.1万字

更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结

立即阅读
加书架
下载
听书

书籍简介

本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

钱洋等
主页

同类热门书

最新上架

  • 会员
    《SQL语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了在开发中使用SQL语言必须掌握的技术。全书分为3篇共18章,内容包括SQL语言基础、SQL查询基础、复杂查询、数据排序、SQL函数的使用、分组统计、子查询、多表查询、添加数据、修改和删除数据、视图、存储过程、触发器、游标、索引、事务、管理数据库与数据表、数据库安全。所有知识都结合具体实例进行介绍,涉及的程序代
    明日科技编著计算机12.4万字
  • 会员
    本书详细讲解JavaEE中Spring、SpringMVC和MyBatis三大框架(以下简称SSM)的基本知识和应用。本书在对知识点进行描述时采用了大量案例,以便读者理解SSM的核心技术。本书共15章,第1~5章主要讲解MyBatis的相关知识,包括初识MyBatis框架、MyBatis的核心配置、动态SQL、MyBatis的关联映射和缓存机制,以及MyBatis的注解开发;第6~9章主要讲解
    黑马程序员编著计算机15.8万字
  • 会员
    《C++从入门到精通(第6版)》从初学者角度出发,以通俗易懂的语言和丰富多彩的实例,详细讲解了C++程序开发需要掌握的知识。本书分为4篇共19章:第1篇是基础知识,包括绪论,数据类型,运算符与表达式,条件判断语句,循环语句,函数,数组、指针和引用,以及构造数据类型;第2篇是面向对象,包括面向对象编程,类和对象,以及继承与派生;第3篇是高级应用,包括模板、标准模板库、RTTI与异常处理、程序调试、文
    明日科技编著计算机14.7万字
  • 会员
    《Python从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python进行程序开发应该掌握的各方面技术。全书共分27章,包括初识Python、Python语言基础、运算符与表达式、流程控制语句、列表和元组、字典和集合、字符串、Python中使用正则表达式、函数、面向对象程序设计、模块、文件及目录操作、操作数据库、使用进程和线程、网络编程、异常处理及程
    明日科技编著计算机25.7万字
  • 会员
    本书是网页特效设计任务驱动式教材。本书将网页特效分为9类,分别是基本网页特效、日期时间类网页特效、文字类网页特效、图片类网页特效、表单控件类网页特效、导航菜单类网页特效、选项卡类网页特效、内容展开与折叠类网页特效和页面类网页特效,同时相应地将全书分为9个教学单元,每个教学单元分析和设计一种类型的网页特效,将JavaScript和jQuery的相关知识合理地安排到各个教学单元中。
    陈承欢编著计算机7.4万字
  • 会员
    本书以Python的实际应用为主线,以理论基础为核心,引导读者渐进式学习Python的编程基础和实际应用。本书共17章,可分为4部分。第一部分Python编程环境搭建和Python的基础知识(第1~6章)、第二部分数学运算(第7~9章)、第三部分绘制图像(第10~12章)、第四部分办公自动化(第13~17章)。本书示例代码丰富,实用性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。
    邢世通编著计算机15.9万字
  • 会员
    本书以Python的实际应用为主线,以理论基础为核心,引导读者渐进式学习Python的在生活和工作中的实际应用。本书共13章,可分为4部分。第一部分Python的办公自动化篇(第1~5章)、第二部分网络应用篇(第6~10章)、第三部分GUI编程篇(第11~12章)、第四部分其他应用篇(第13章)。本书示例代码丰富,实用性和系统性较强,并配有视频讲解,助力读者透彻理解书中的重点、难点。精心设计的案例
    邢世通编著计算机11.6万字
  • 会员
    本书以MySQL为平台,从数据库管理和开发的角度出发,介绍开发数据库应用系统所需的基础知识和技术。本书将一个贯穿全书的数据库应用系统开发实例“学生信息管理系统”融入各项目,将每个项目分解成若干任务,使读者逐步学会创建、管理、开发数据库,并掌握使用SQL进行程序设计的编程思想和技术。本书内容由浅入深,由实践到理论,再从理论到实践,通过任务驱动的方式将理论与实践密切结合,体现了高职高专和应用型本科教育
    杨云 温凤娇 余建浙 张志强编著计算机12.6万字
  • 会员
    《Go语言从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了Go语言的基础、进阶提高和高级应用知识。全书分为4篇,共19章,包括初识Go语言、Go语言基础、Go语言基本数据类型与运算符、流程控制、复合数据类型、函数、指针、结构体、接口、错误处理、并发编程、包管理、标准库、编译与测试工具、反射、MySQL数据库编程、文件处理、网络编程和Go语言在爬虫中的应用等内容。所有知
    明日科技编著计算机9.9万字

同类书籍最近更新

  • 会员
    本书循序渐进地介绍了PHP8开发动态网站的主要知识和技能,提供了大量的PHP应用实例供读者实践。每一章节都清晰讲解了代码的作用及其编写思路,使读者能快速掌握PHP的应用开发技能。全书共24章,内容包括PHP8的基本概念、PHP服务器环境配置、PHP的基本语法、PHP的语言结构、字符串和正则表达式、数组、时间和日期、面向对象编程、错误处理和异常处理、PHP与Web页面交互、文件与目录操作、图形图
    张工厂程序设计13.1万字
  • 会员
    IfyouareadeveloperorDevOpsengineerinterestedinbuildingasystemthatprovidesamazinginsightsandbusinessmetricsoutofdatasources,ofvariousformatsandtypes,usingtheopensourcet
    Saurabh Chhajed程序设计3.2万字
  • 会员
    ThisbookiswrittenfortheASP.NETdeveloperwhowantstodeliverprofessional-standardsoftware,quicklyandefficiently.It'sfilledwithhands-onrecipes,practicaladvice,andguidancetohelpd
    Engin Polat Stephane Belkheraz程序设计6.7万字
  • 会员
    本书以参加数控铣考证、竞赛的读者为主要对象,以UG12.0为载体,详细讲解每个实例的建模、数控编程过程及数控加工工艺。本书内容分五篇:UG12.0编程入门篇、中级工考证篇、高级工考证篇、技师考证篇、数控竞赛篇。本书把UG12.0的一些基本命令穿插到实例中讲解,有利于读者理解。本书提供模型素材,读者可登录以下网址免费获取:http://www.hxedu.com.cn(华信教育资源网)。全书结构清晰
    詹建新主编程序设计14万字
  • 会员
    本书详尽介绍了规模化敏捷框架的方方面面,既可以作为学习和了解SAFe4.0的参考教材,也可以作为企业实施SAFe4.0框架的指导手册,是一本不可多得的经典著作。全书脉络清晰,以SAFe4.0全景图为线索展开论述,首先对SAFe4.0的3层结构和4层结构进行了简介;第1章和第2章是基础部分,介绍了实施SAFe4.0的基本要素,从精益–敏捷领导者应具备的特质入手,提出了SAFe的价值观、原则
    (美)迪恩·莱芬韦尔等程序设计27.7万字
  • 会员
    IfyouareaPythondeveloperwhoperformsdatavisualizationandwantstodevelopexistingknowledgeaboutPythontobuildanalyticalresultsandproducesomeamazingvisualdisplay,thenthisbooki
    Kirthi Raman程序设计6.3万字