Hadoop构建数据仓库实践最新章节全文无弹窗在线阅读-QQ阅读女频青春网

QQ阅读女频现言网

女频现言网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库，将传统数据仓库建模与SQL开发的简单性与大数据技术相结合，快速、高效地建立可扩展的数据仓库及其应用系统。本书内容包括数据仓库、Hadoop及其生态圈的相关概念，使用Sqoop从关系数据库全量或增量抽取数据，使用HIVE进行数据转换和装载处理，使用Oozie调度作业周期性执行，使用Impala进行快速联机数据分析，使用Hue将数据可视化，以及数据仓库中的渐变维（SCD）、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员，也适合高等院校和培训机构相关专业的师生教学参考。

品牌：清华大学

上架时间：2017-07-01 00:00:00

出版社：清华大学出版社

本书数字版权由清华大学提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

王雪迎

同类热门书

最新上架

会员
Power BI商业数据分析完全自学教程
本书共5篇，分为14章介绍了PowerBI的基本操作、数据导入、数据整理、数据建模、数据可视化分析、数据发布等相关技能。第1篇为基础入门篇（第1-3章），主要针对初学者，从零开始，系统且全面地讲解了PowerBI的入门知识点、基本操作及数据的输入和连接操作。第2篇为数据处理篇（第4-6章），介绍了PowerBI数据的整理操作、表格中行/列数据的管理，以及PowerBI数据的高级处理、M函数的使
凤凰高新教育编著计算机0字
会员
商业分析思维与实践：用数据分析解决商业问题
本书本书基于业务问题，就如何搭建分析框架，厘清分析思路，按照标准分析步骤对数据进行怡当的预处理，选择合适的分析方法和分析模型，使用恰当的分析工具对数据进行分析，以及对分析结果进行可视化和符合业务要求的解读等内容展开讲解，帮助业务专家做出合适的业务判断，制定准确的业务策略。
傅一行计算机13万字
会员
OLAP引擎底层原理与设计实践
本书分为6篇，共14章。从OLAP核心概念出发，以Presto为例，从整体执行流程到不同SQL的执行原理，力图把OLAP查询的核心流程以一种系统化的方式来给读者讲清楚。第一篇背景知识（第1章和第2章）介绍OLAP的基础知识和Presto相关的背景知识，并给出了后续贯穿全书的SQL代码；第二篇核心原理（第3章和第4章）非常详细地串讲了SQL执行流程，介绍了执行计划的生成和优化；第三篇经典SQL（第5
高英举许一腾计算机19.7万字
会员
数据要素五论：信息、权属、价值、安全、交易
本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发，汇聚不同学科背景的既有文献，整合现有观点，对数据要素的多维特性进行探讨，以丰富人们对数据要素的认知，凝聚共识，澄清数字时代的发展与治理迷思，为未来的相关创新提供起点。
张平文邱泽奇编著计算机14.5万字
会员
网络科学与网络大数据结构挖掘
《网络科学与网络大数据结构挖掘》作为网络科学的工具性图书共分两大模块：第一模块是基础理论，包括网络基本概念、网络拓扑性质、复杂网络社团挖掘等内容，旨在让读者熟悉一些基本的建模方法和分析技巧。第二模块为应用模块，包括复杂网络在几个代表性领域中的应用研究分析及案例剖析等。全书没有过多地数学和物理推导，而是更为关注网络科学的思维习惯和研究方式，兼具理论性、资料性和实践性。可用于各学科领域的教学及研究人员
刘伟计算机0字
会员
Python数据分析、挖掘与可视化从入门到精通
本书分为4篇，第1篇是基础入门篇，主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础；第2篇是数据分析篇，主要介绍常用的数据分析方法；第3篇是数据挖掘篇，主要介绍常用的数据挖掘方法；第4篇是实战应用篇，介绍两个完整的数据分析与挖掘案例。
熊熙张雪莲编著计算机10.9万字
会员
Python数据分析
本书系统介绍了使用Python进行数据分析需要掌握的各项知识，涵盖了Python基础知识、网络爬虫技术、正则表达式、BeautifulSoup和JSON、词语切分、自然语言处理、使用NumPy与Pandas处理数据、数据可视化技术、MySQL、机器学习、朴素贝叶斯模型、支持向量机、随机森林、深度学习以及量化投资。本书通过结合数据分析技术的理论知识与Python的实战应用，帮助读者更好地运用Pyth
王俊主编计算机12.3万字
会员
大数据导论
本书围绕新工科背景下大数据人才培养需求编写，既涵盖了大数据的基础知识，又介绍了大数据分析的相关工具与案例。全书共9章，介绍了大数据采集与预处理、大数据存储与管理、大数据处理与分析、大数据可视化处理流程；重点分析了科大讯飞大数据平台在政务、交通、金融和用户画像等实际场景中的应用，还介绍了大数据实验环境的详细搭建步骤，方便读者快速理解和体验大数据应用技术；最后介绍了大数据治理中法律政策、行业标准建设的
于俊伟母亚双闫秋玲编著计算机14.5万字
会员
码上行动：利用Python与ChatGPT高效搞定Excel数据分析
本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析，以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。
袁昕编著计算机8.5万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 aikan.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015