000
01575nam0 2200277 450
001
012021000517
005
20210301090355.5
010
@ a978-7-121-40368-2@ dCNY99.00
100
@ a20210301d2021 em y0chiy50 ea
101
1
@ achi@ ceng
102
@ aCN@ b110000
105
@ aak z 000yy
106
@ ar
200
1
@ a深入大型数据集@ Ashen ru da xing shu ju ji@ e并行与分布化Python代码@ d= Mastering large datasets with python@ eparallelize and distribute your python code@ f(美) John T. Wolohan著@ g张若飞译@ zeng
210
@ a北京@ c电子工业出版社@ d2021.2
215
@ axx, 300页@ c图@ d24cm
314
@ a责任者规范汉译姓: 沃勒翰
330
@ a本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。
500
10
@ aMastering large datasets with python : parallelize and distribute your python code@ mChinese
517
1
@ a并行与分布化Python代码@ Abing xing yu fen bu hua Pythondai ma
606
0
@ a软件工具@ Aruan jian gong ju@ x程序设计
690
@ aTP311.56@ v5
701
1
@ a沃勒翰@ Awo le han@ g(Wolohan, John T.)@ 4著
702
0
@ a张若飞@ Azhang ruo fei@ 4译
801
0
@ aCN@ bCDNYKJZYXY@ c20210301
905
@ aCDNYKJZYXY@ b300637947-9@ dTP311.56@ e232@ f3
深入大型数据集:并行与分布化Python代码= Mastering large datasets with python:parallelize and distribute your python code/(美) John T. Wolohan著/张若飞译.-北京:电子工业出版社,2021.2
xx, 300页:图;24cm
ISBN 978-7-121-40368-2:CNY99.00
本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。
●
正题名:深入大型数据集
索取号:TP311.56/232
 
预约/预借
序号
登录号
条形码
馆藏地/架位号
状态
备注
1
637947
300637947
流通五库四楼/
[索取号:TP311.56/232]
在馆
2
637948
300637948
流通五库四楼/
[索取号:TP311.56/232]
在馆
3
637949
300637949
流通五库四楼/
[索取号:TP311.56/232]
在馆