【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648电子书下载地址
- 文件名
- [epub 下载] 【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 epub格式电子书
- [azw3 下载] 【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 azw3格式电子书
- [pdf 下载] 【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 pdf格式电子书
- [txt 下载] 【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 txt格式电子书
- [mobi 下载] 【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 mobi格式电子书
- [word 下载] 【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 word格式电子书
- [kindle 下载] 【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648 kindle格式电子书
寄语:
团购可联系在线客服询优惠价 可开发票 正版保证
内容简介:
暂无相关简介,正在全力查找中!
书籍目录:
前言ix
部分 分布式计算入门
章 数据产品时代2
1.1 什么是数据产品2
1.2 使用Hadoop构建大规模数据产品4
1.2.1 利用大型数据集4
1.2.2 数据产品中的Hadoop5
1.3 数据科学流水线和Hadoop生态系统6
1.4 小结8
第2章 大数据操作系统9
2.1 基本概念10
2.2 Hadoop架构11
2.2.1 Hadoop集群12
2.2.2 HDFS14
2.2.3 YARN15
2.3 使用分布式文件系统16
2.3.1 基本的文件系统操作16
2.3.2 HDFS文件权限18
2.3.3 其他HDFS接口19
2.4 使用分布式计算20
2.4.1 MapReduce:函数式编程模型20
2.4.2 MapReduce:集群上的实现22
2.4.3 不止一个MapReduce:作业链27
2.5 向YARN提交MapReduce作业28
2.6 小结30
第3章 Python框架和HadoopStreaming31
3.1 HadoopStreaming32
3.1.1 使用Streaming在CSV数据上运行计算34
3.1.2 执行Streaming作业38
3.2 Python的MapReduce框架39
3.2.1 短语计数42
3.2.2 其他框架45
3.3 MapReduce进阶46
3.3.1 biner46
3.3.2 partitioner47
3.3.3 作业链47
3.4 小结50
第4章 Spark内存计算52
4.1 Spark基础53
4.1.1 Spark栈54
4.1.2 RDD55
4.1.3 使用RDD编程56
4.2 基于PySpark的交互性Spark59
4.3 编写Spark应用程序61
4.4 小结67
第5章 分布式分析和模式69
5.1 键计算70
5.1.1 复合键71
5.1.2 键空间模式74
5.1.3 pair与stripe78
5.2 设计模式80
5.2.1 概要81
5.2.2 索引85
5.2.3 过滤90
5.3 迈向第后一英里分析95
5.3.1 模型拟合96
5.3.2 模型验证97
5.4 小结98
第二部分 大数据科学的工作流和工具
第6章 数据挖掘和数据仓102
6.1 Hive结构化数据查询103
6.1.1 Hive命令行接口(CLI)103
6.1.2 Hive查询语言104
6.1.3 Hive数据分析108
6.2 HBase113
6.2.1 NoSQL与列式数据库114
6.2.2 HBase实时分析116
6.3 小结122
第7章 数据采集123
7.1 使用Sqoop导入关系数据124
7.1.1 从MySQL导入HDFS124
7.1.2 从MySQL导入Hive126
7.1.3 从MySQL导入HBase128
7.2 使用Flume获取流式数据130
7.2.1 Flume数据流130
7.2.2 使用Flume获取产品印象数据133
7.3 小结136
第8章 使用API进行分析137
8.1 Pig137
8.1.1 PigLatin138
8.1.2 数据类型142
8.1.3 关系运算符142
8.1.4 用户定义函数143
8.1.5 Pig小结144
8.2 SparkAPI144
8.2.1 SparkSQL146
8.2.2 DataFrame148
8.3 小结153
第9章 机器学习154
9.1 使用Spark进行可扩展的机器学习154
9.1.1 协同过滤156
9.1.2 分类161
9.1.3 聚类163
9.2 小结166
0章 总结:分布式数据科学实战167
10.1 数据产品生命周期168
10.1.1 数据湖泊169
10.1.2 数据采集171
10.1.3 计算数据存储172
10.2 机器学习生命周期173
10.3 小结175
附录A 创建Hadoop伪分布式开发环境176
附录B 安装Hadoop生态系统产品184
术语表193
关于作者211
关于封面211
作者介绍:
暂无相关内容,正在全力查找中
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
暂无其它内容!
网站评分
书籍多样性:5分
书籍信息完全性:7分
网站更新速度:5分
使用便利性:6分
书籍清晰度:5分
书籍格式兼容性:6分
是否包含广告:7分
加载速度:9分
安全性:5分
稳定性:5分
搜索功能:9分
下载便捷性:9分
下载点评
- 图文清晰(135+)
- 无盗版(558+)
- 差评(505+)
- 四星好评(188+)
- 赞(142+)
- 下载快(418+)
- 目录完整(368+)
- 字体合适(463+)
- 无广告(177+)
- 实惠(571+)
- 速度快(100+)
下载评价
- 网友 陈***秋: ( 2024-12-24 16:32:10 )
不错,图文清晰,无错版,可以入手。
- 网友 苍***如: ( 2025-01-18 17:28:28 )
什么格式都有的呀。
- 网友 谢***灵: ( 2024-12-25 20:45:30 )
推荐,啥格式都有
- 网友 国***芳: ( 2025-01-12 12:03:38 )
五星好评
- 网友 步***青: ( 2025-01-05 05:27:52 )
。。。。。好
- 网友 孙***夏: ( 2025-01-18 12:36:42 )
中评,比上不足比下有余
- 网友 宫***玉: ( 2025-01-11 08:52:15 )
我说完了。
- 网友 孔***旋: ( 2025-01-17 21:51:22 )
很好。顶一个希望越来越好,一直支持。
- 网友 居***南: ( 2025-01-14 13:51:36 )
请问,能在线转换格式吗?
- 网友 温***欣: ( 2025-01-06 06:45:02 )
可以可以可以
- 网友 訾***雰: ( 2025-01-13 11:55:53 )
下载速度很快,我选择的是epub格式
- 网友 常***翠: ( 2025-01-15 08:32:13 )
哈哈哈哈哈哈
喜欢"【正版全新】 Hadoop数据分析 (美)Benjamin Bengfort,(美)Jenny Kim著 人民邮电出版社 9787115479648"的人也看了
市场营销理论与实务 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
桥牌自然叫牌法 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
9787503636233 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
管理学 广东省普通高等学校专插本招生考试命题研究组 编者,广东省普通高等学校专插本招生考试命题研究中心 编者 光明日报出版社,【正版可开发票】 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
正版 数据库原理及应用Access版第版四版 吴靖 第三版 高等院校计算机系列规划 北京高等教育精品 9787111617921 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 宝石幻境/少年原野科幻探险系列 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 生物芯片发展及寡核苷酸基因芯片应用研究 高志勇 科学出版社 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 绿血 宋迅著年轻人的态度之书 献给每一个漂浮在城市里的你我他 中国当代小说集短篇小说故事文学 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- Access 2021完全自学教程 职场人士不可不读的Access经典之作 新功能+重点+实战+技法+妙招 凤凰高新教育出品 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 建设工程造价管理基础知识/2021二级造价工程师职业资格考试培训 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 酒店企业会计真账实操全图解 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 西点军校送给男孩的最好礼物 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 能闻出孩子味儿的乌龟/笑猫日记 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 全新正版图书 中华人民共和国行业标准建筑消中华人民共和国住房和城乡建设部中国建筑工业出版社1511223744人天图书专营店 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 【预售】【翰德图书】PARTS谈判思维:百大企业指定名师教你拆解谈判结构 港台原版图书籍台版正版繁体中文 林宜璟 行销企划 商周出版 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:7分
人物塑造:6分
主题深度:3分
文字风格:4分
语言运用:5分
文笔流畅:9分
思想传递:3分
知识深度:3分
知识广度:3分
实用性:4分
章节划分:6分
结构布局:6分
新颖与独特:6分
情感共鸣:8分
引人入胜:7分
现实相关:3分
沉浸感:5分
事实准确性:9分
文化贡献:5分