ISBN/价格: | 978-7-115-61456-8:CNY79.80 |
---|---|
作品语种: | chi swe |
出版国别: | CN 110000 |
题名责任者项: | Apache Spark大数据分析/.(瑞典) 罗伯特·伊利杰森著/.Robert Ilijason/.袁国忠译 |
出版发行项: | 北京:,人民邮电出版社:,2023.06 |
载体形态项: | 236页:;+图:;+23cm |
提要文摘: | AzureDatabricks是一款基于云的大数据分析和机器学习平台, 用于实现基于ApacheSpark的数据处理, 为快速增长的海量数据的处理和决策需求分析提供了良好的支撑。本书首先介绍了大规模数据分析相关的概念, 然后介绍了受管的Spark及其与Databricks的关系, 以及Databricks的版本差异和使用方法 (涵盖工作区、集群、笔记本、Databricks文件系统、数据导入/导出等内容)。此外, 书中还介绍了使用SQL和Python分别实现数据分析的过程, 数据提取、变换、加载、存储、优化技巧等高阶数据处理方法, 以及外部连接工具、生产环境集成等内容, 最后探讨了运行机器学习算法、合并数据更新以及通过API运行Databricks、Delta流处理等高阶主题。 |
并列题名: | Beginning Apache Spark using Azure Databricks eng |
题名主题: | 数据处理软件 机器学习 |
非控主题词: | Spark |
中图分类: | TP274 |
个人名称等同: | 伊利杰森 著 |
个人名称次要: | 袁国忠 译 |
记录来源: | CN 人天书店 20230630 |