
会员
Spark SQL入门与实践指南
更新时间:2019-12-06 16:38:46 最新章节:9.9 本章小结
书籍简介
SparkSQL是Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。全书分为4篇,共9章,第一篇讲解了SparkSQL发展历史和开发环境搭建。第二篇讲解了SparkSQL实例,使得读者掌握SparkSQL的入门操作,了解SparkRDD、DataFrame和DataSet,并熟悉DataFrame各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用SparkSQL挖掘数据,一步一步带领读者学习SparkSQL强大的数据挖掘功能。第四篇讲解了SparkSQL优化的知识。本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。
品牌:清华大学
上架时间:2018-04-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
纪涵
最新上架
- 会员人本智造(以人为本的智能制造)体现了工业特别是制造业未来发展的重要趋势,是未来工业(工业5.0)的核心使能技术,是新一代智能制造的重要技术方向。本书深入阐述面向工业5.0的人本智造最新研究成果,包括人的数字孪生、人机协同作业、人机团队合作等,以及相关典型案例,展现了当前国内外人本智造领域的技术进展和应用前景。本书是《人本智造:面向新工业革命的制造模式》一书的姊妹篇,可为从事机械制造业科学研究、企业工业9.6万字
同类书籍最近更新
- 会员数据挖掘是一门面向应用的新兴学科分支,涉及人工智能、机器学习、模式识别、统计学、数据库、可视化等多个学科领域,其主要目的是从大量原始数据中提取人们感兴趣的、隐含的、尚未被发现的信息和知识,目前已广泛应用于科学、工程、商业、医学等领域。本书适合从事天文学研究、数据挖掘及知识发现和人工智能等领域的技术人员阅读,也可以作为高等院校天文学、计算机科学与技术等学科的高年级本科生及研究生的学习参考书。自动化11.4万字
- 会员本实训教材以模块构建实训教学体系,以任务驱动教学内容,并结合职业技能的资格实训,从提高学生的职业技能出发,介绍可编程序控制器及应用技术。本实训教材包括PLC基础、基本逻辑指令应用、中级维修电工PLC考证实训等11个模块,每个模块包含了若干个任务,每个任务从训练的目的的要求出发,设定训练内容链法的知识点,理论结合实践,并给出相应的参考答案。本书还专列一个课程设计模块供教学内容参考使用。自动化7.4万字
- 会员《组态控制技术实训教程(MCGS)》从实际应用出发,通过20个典型实训项目系统地介绍了组态软件MCGS的设计方法及其监控应用技术。全书分为三篇,基础应用篇包括组态软件概述、组态软件MCGS设计基础和初级应用实训;高级应用篇包括组态软件MCGS的高级设计技术和高级应用实训;监控应用篇采用组态软件MCGS实现多个监控设备(包括三菱PLC、西门子PLC、远程I/O模块和PCI数据采集卡)与PC数据通信及自动化12.5万字
- 会员四向穿梭式自动化密集仓储系统是一种新型的仓储系统,它具有存储空间利用率高、货架布局灵活、作业效率高等特点。本书系统地介绍了四向穿梭式自动化密集仓储系统的设计和控制,并从逻辑层面、控制层面和信息管理层面对轨道定向、设备编配、任务分配、货位分配、路径规划和故障处理等内容进行了阐述,以帮助读者大限度地挖掘仓储系统的潜力,提升仓储系统的作业能力。本书内容全面,结构合理,图文并茂,实例典型,系统性强,并针对自动化7.5万字
- 会员本书涉及DAS、NAS、SAN和iSCSI等网络存储的方式、特点、适用与选择,网络存储设备的连接、配置、监控与故障排除,RAID的类型、特点、适用和设置。数据备份/还原模式与选择,网络文件的存储与权限设置,网络备份软件及使用,网络用户数据的自动同步与冲突解决,以及网络数据备份的自动化。自动化17.6万字