Hadoop HDFS深度剖析与实践在线阅读
会员

Hadoop HDFS深度剖析与实践

祝江华编著
开会员,本书免费读 >

计算机网络数据库13.8万字

更新时间:2023-08-28 20:29:18 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书以HadoopHDFS为载体,介绍了构建一款分布式系统(尤其是存储方向)所需的核心技术,所有内容均基于当前较新的3.3.x/3.4.x版本,分别从理论和实践两个维度逐一阐述。本书主要包括两篇:核心原理篇介绍了HDFS的诞生历史、元数据及Block管理、节点间通信机制、读写数据流程和高可用实现原理等;拓展与实践篇从实际出发,充分考虑了用户在应用过程中会遇到的痛点,详细介绍了集群拓展方法、数据分层存储、集群维护与多租户实施等实践经验。本书各章节都配有必要的流程图和原理分析图,便于读者阅读理解,并精选了非常有用的实际案例及拓展知识。阅读本书后,相信会给读者带来“1+1>2”的效果。本书非常适合大数据从业者、云计算领域研发及运维人员、高校研究生和热衷于分布式的技术极客阅读学习。
品牌:机械工业出版社
上架时间:2023-05-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

祝江华编著
主页

同类热门书

最新上架

  • 会员
    时序数据库是一种新型技术,主要用于工业互联网软件建设中。近年来,伴随着物联网技术在智能制造、交通、能源、智慧城市等领域的发展,时序数据库也发展迅速,成为搭建应用的必备数据库之一。《深入理解InfluxDB》从InfluxDB的安装开始,一步步详细介绍InfluxDB的功能及原理,带领读者深入理解以InfluxDB为代表的时序数据库。
    郑强 张伟 刘爽计算机7.6万字
  • 会员
    《数据分析师手记:数据分析72个核心问题精解》从底层认知、思维方法、工具技术、项目落地及展望出发,使用问答的形式对数据分析中的72个核心知识点进行讲解,构建了数据分析的知识框架,带领读者认识数据分析背后的奥妙。读者可以用本书作为学习地图,针对具体的方法、技术进行延伸学习。
    刘林 李朝成 饼干哥哥计算机16.8万字
  • 会员
    《企业级大数据项目实战:用户搜索行为分析系统从0到1》基于真实业务场景,以项目导向为主线,从0到1全面介绍企业级大数据用户搜索行为分析系统的搭建过程。全书共6章,第1章讲解项目需求与架构设计,详细阐述项目数据流与系统架构;第2章介绍大数据项目开发环境配置,手把手带领读者配置操作系统、Hadoop集群与相关工具,为后续项目实施打下基础;第3~5章逐步实现项目需求,第3章讲解用户行为数据采集模块的开发
    张伟洋计算机9万字
  • 会员
    本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书
    闭应洲 许桂秋 刘军主编计算机14万字
  • 会员
    本书围绕数据挖掘竞赛,讲解了各种类型数据挖掘竞赛的解题思路、方法和技巧,并辅以对应的实战案例。全书共11章。第1章介绍数据挖掘竞赛的背景、意义和现状。从第2章开始,介绍了各种不同类型的数据挖掘竞赛包括结构化数据、自然语言处理、计算机视觉(图像)、计算机视觉(视频)、强化学习。每种类型的数据挖掘竞赛包含理论篇和实战篇:理论篇介绍通用的解题流程和关键技术;实战篇选取比较有代表性的赛题,对赛题的优秀方案
    许可乐编著计算机6.7万字
  • 会员
    《MySQL从入门到精通(第3版)》从初学者角度出发,通过通俗易懂的语言和丰富多彩的实例,详细介绍了MySQL开发需要掌握的各方面技术。全书共分为4篇22章,包括数据库基础,初识MySQL,使用MySQL图形化管理工具,数据库操作,存储引擎及数据类型,数据表操作,MySQL基础,表数据的增、删、改操作,数据查询,常用函数,索引,视图,数据完整性约束,存储过程与存储函数,触发器,事务,事件,备份与恢
    明日科技编著计算机14万字
  • 会员
    这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。
    陈鹤 杨国栋计算机14万字
  • 会员
    这是一套数据指标体系全流程构建(从规划、框架设计、数据采集加工到应用)方法论与实践指南。它不仅深入浅出地分享了通用的数据指标体系构建策略,还通过多个行业实例展示了具体操作方法。书中从数据采集入手,借助BI工具Superset实践构建过程。本着“一切技术都是为业务服务的”这一宗旨,本书除了包含数据指标体系构建相关内容外,还结合统计学原理及Excel、Python等工具,深入剖析数据指标波动对业务的影
    李渝方计算机12.7万字
  • 会员
    本书共3篇:第1篇主要介绍分布式数据库基础理论,包括经典的CAP理论、一致性算法相关的理论、并发控制相关的理论等;第2篇具体介绍Greenplum数据库,从分布式事务、分布式计算和分布式存储3个方面,深入代码层级,讲述分布式理论在工业上的实现;第3篇是总结和展望,介绍云原生数据库和新技术带给Greenplum和数据库管理系统的机遇和挑战。本书打破以理论介绍和架构介绍为主的思路,深入分析工业化的实现
    王凤刚计算机7.1万字

同类书籍最近更新

  • 会员
    本书从大数据处理涉及的基础数学理论入手,围绕大数据研究涉及的基础数学知识,从线性代数、微积分、概率与统计、距离度量、优化问题及图论六大方面展开介绍,以夯实读者在大数据领域的理论基础。本书不仅介绍了基本的数学概念,而且通过具体例子介绍了其在大数据领域的实际应用,以提高本书的易读性。本书每章都附有相应的习题,以便读者能够进一步理解相应的知识点。
    邱硕等主编数据库8.2万字
  • 会员
    OceanBase作为当今最先进的分布式关系型数据库之一,在开源之后受到了业界的广泛关注。为了帮助数据库内核研发人员、科研工作者、数据库技术爱好者理解OceanBase内核,本书从OceanBase开源版的源代码出发,介绍其实现机制和技术细节。本书的主要内容包括:OceanBase概述、OceanBase的架构、OBServer、存储引擎、SQL引擎、事务引擎、高可用、多租户、安全管理等。本书尽可
    彭煜玮 杨传辉 杨志丰编著数据库16.9万字
  • 会员
    本书从当下数据中心的主要系统应用场景出发,介绍如何使用适合云计算和大数据的灾备方式来实现数据保护。
    魏磊 张聪 邬小亮等编著数据库11万字
  • 会员
    本书分为数据思维和案例解析两个部分,对“怎么想”和“怎么做”两大分析痛点问题进行剖析和解答。基于知先行后的考虑,前3章首先对“怎么想”的问题进行解答,通过明确分析问题、开启分析思路、打开分析视角,依次回答数据思维3个核心问题:解决什么问题?分析哪些内容?分析到何种程度?结合11个思维练习的案例,引导读者对业务需求进行思考,明确研究内容和分析方法。
    陈哲数据库10.8万字
  • 会员
    本书以Hadoop及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解了VMware中CentOS7操作系统的安装;第2章讲解了大数据开发之前对操作系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm
    张伟洋数据库14.6万字
  • 会员
    本书介绍了数据网格——一种来自现代分布式架构的去中心化社会技术范式,它提供了一种大规模采购、共享、访问和管理分析型数据的新方法。本书分为五部分。第1部分介绍DataMesh的四个原则,以及它们所组成的高级模型。第二部分比较DataMesh与以前的数据架构的区别。第三部分介绍DataMesh组件的高层次架构,帮助你设计DataMesh架构以及评估与DataMesh匹配的现成技术。第四部分介绍Data
    (澳)扎马克·德加尼数据库18.1万字