Hadoop与大数据挖掘(第2版)在线阅读
会员

Hadoop与大数据挖掘(第2版)

王哲 张良均等
开会员,本书免费读 >

计算机网络数据库14.7万字

更新时间:2022-08-10 10:02:27 最新章节:11.7 小结

立即阅读
加书架
下载
听书

书籍简介

这是一本讲解如何基于Hadoop技术栈进行大数据挖掘和分析的著作。它能带领你零基础快速掌握Hadoop技术栈,以及基于它的大数据挖掘与分析的流程和方法。全书核心内容分为两部分。1.Hadoop技术栈:详细讲解了Hadoop、Hive、HBase、Spark、Flume、Kafka等大数据技术的基础、原理、应用,通过这部分内容读者能对Hadoop技术栈有从宏观到微观的了解。2.Hadoop大数据挖掘:通过3个综合案例,逐步展示了基于Hadoop的大数据挖掘的完整流程和方法。几位作者在大数据项目研发、教育、咨询等领域有10余年的丰富经验,对教育界和企业界供需两端的了解非常深入,全书的结构和内容围绕这两端的需求尽心设计,能让Hadoop大数据挖掘与分析的教育和学习事半功倍。本书第1版出版后,获得了教育界和企业界的良好反馈,其中数十家高等院校采用本书作为教材或参考书。第2版在第1版的基础上,在技术适应性、案例实用性等方面做了大量更新,与时俱进,更有竞争力!为了便于学习和教学,本书配套数据文件、实现代码、课后习题、教学PPT。
品牌:机械工业出版社
上架时间:2022-07-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

王哲 张良均等
主页

最新上架

  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字
  • 会员
    本书是《数据库原理——GaussDB技术及应用》一书配套的辅助教材。全书共分3部分:第一部分为实验指导,共有13个综合实验,每一个实验都是根据教学目标而设计,详细讲述了每一个实验的实验目的、实验任务及实验步骤,从而培养学生掌握关系数据库管理软件技术与应用的技能;第二部分为习题集,是根据主教材各章节内容编写的习题及习题答案,内容广泛,有填空、选择、简答、设计及实验题等多种形式,利求通过对这些习题的训
    李雁翎编著计算机6.9万字
  • 会员
    本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预
    翟世臣 张良均主编计算机13.6万字
  • 会员
    达梦数据库是一款非常优秀的国产数据库。本书从实用角度,通过对达梦数据库的体系结构、运行机制的讲解,以及与其他数据库相似功能的对比,帮助读者掌握达梦数据库的基本操作。本书第1章讲解达梦数据库的安装部署;第2章讲述达梦数据库的体系结构,并与Oracle的体系结构进行对比;第3章讲解数据库中最重要的两部分redo和undo;第4章介绍用户管理,重点讲述用户创建和权限;第5章讲解表和索引,并对普通表和堆表
    付强编著计算机10.7万字
  • 会员
    本书旨在向广大有志于投身芯片设计行业的人士及正在从事芯片设计的工程师普及芯片设计知识和工作方法,使其更加了解芯片行业的分工与动向。本书共分9个章节,从多角度透视芯片设计,特别是数字芯片设计的流程、工具、设计方法、仿真方法等环节。凭借作者多年业内经验,针对IC新人关心的诸多问题,为其提供了提升个人能力,选择职业方向的具体指导。本书第1章是对IC设计行业的整体概述,并解答了IC新人普遍关心的若干问题。
    白栎旸编著计算机29.9万字
  • 会员
    本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例
    戴刚 张良均主编计算机10.4万字
  • 会员
    本书瞄准当前高校MySQL数据库教学与实验的需求,在MySQL8.0的基础上编写而成。全书分为两篇。第一篇为MySQL数据库基础,内容包含:数据库基础、MySQL语言、数据定义、数据操纵、数据查询、视图和索引、MySQL编程技术、MySQL安全管理、备份和恢复、事务管理、PHP和MySQL教学管理系统开发。第二篇为MySQL实验,所编排的各个实验与第一篇中的各章(除第10、11章外)内容相对应,
    赵明渊 唐明伟主编计算机12万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字
  • 全书以学生成绩管理数据库案例为主线,从建立空数据库开始,逐步讲解数据库中的表、查询、窗体、报表、宏、模块、VBA程序设计与数据库编程等Access2016的主要功能;以图书馆借还书管理数据库项目实训为辅线,结合每章知识设计项目实训内容,帮助读者巩固和加深对所学知识的理解和掌握;以商品销售管理数据库实战演练为扩展训练,帮助读者提高应用数据库技术分析和处理数据的操作技能。本书符合最新版《全国计算机等
    谢萍 周蓉 苏林萍编著计算机13.8万字

同类书籍最近更新

  • 会员
    本书覆盖了当前大数据处理领域的热门技术,包括Hadoop、Spark、Storm、Dremel、Drill等,详细分析了各种技术的应用场景和优缺点;同时阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势。本书采用幽默的表述风格,使读者容易理解、轻松掌握;重点从各种技术的起源、设计思想、架构等方面阐述,以帮助读者从根源上悟出大数据处理之道。
    何金池编著数据库12.3万字
  • 会员
    近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的基本概念、系统架构、编程模型、相关的研究工作,并以一个典型的Spark应用为
    许利杰等数据库11.9万字
  • 会员
    本书从数据库的基础知识入手,全面系统地介绍了Oracle数据库11g的所有特性,并配以翔实的示例,严谨的论述,深入探讨了这些特性的细节内容,同时具有很强的可操作性和实用性。全书内容共37章,分为7大部分:第一部分为Oracle数据库11g基础;第二部分为Oracle数据库11g管理;第三部分为Oracle数据库11g的备份与恢复;第四部分为Oracle数据库11g集群技术与高可用性;第五部分为商业
    谷长勇 王彬 单永红 陈杰等编著数据库46.2万字
  • 会员
    《数据修复技术与典型实例实战详解(第2版)》主要讲述了计算机系统的数据修复、故障硬盘的数据修复、误操作丢失文件的数据修复、病毒破坏造成数据丢失的修复、数据文件损坏后的修复、密码遗失相关的数据修复、移动存储介质的数据修复、硬盘扇区损坏的数据修复、硬盘固件损坏的数据修复和数据备份和彻底删除技术。本书所有实例均经过精心筛选,力争让读者在较短的时间内学到更多有实用价值的知识。本书适合计算机维修人员学习,也
    叶润华编著数据库10.6万字
  • 会员
    郭鑫数据库29.9万字