妙思文献管理集成系统WWW检索

书目信息

表格格式
工作单格式
卡片格式

书名：	深入大型数据集
作者：	沃勒翰著；张若飞译
出版信息：	北京电子工业出版社 2021.2
开本页数：	24cm xx, 300页
丛书名：
单册：
中图分类：	TP311.56
科图分类：
主题词：	软件工具--ruan jian gong ju--程序设计
电子资源：
ISBN：	978-7-121-40368-2

000	01575nam0 2200277 450
001	012021000517
005	20210301090355.5
010		@a978-7-121-40368-2@dCNY99.00
100		@a20210301d2021 em y0chiy50 ea
101	1	@achi@ceng
102		@aCN@b110000
105		@aak z 000yy
106		@ar
200	1	@a深入大型数据集@Ashen ru da xing shu ju ji@e并行与分布化Python代码@d= Mastering large datasets with python@eparallelize and distribute your python code@f(美) John T. Wolohan著@g张若飞译@zeng
210		@a北京@c电子工业出版社@d2021.2
215		@axx, 300页@c图@d24cm
314		@a责任者规范汉译姓: 沃勒翰
330		@a本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。
500	10	@aMastering large datasets with python : parallelize and distribute your python code@mChinese
517	1	@a并行与分布化Python代码@Abing xing yu fen bu hua Pythondai ma
606	0	@a软件工具@Aruan jian gong ju@x程序设计
690		@aTP311.56@v5
701	1	@a沃勒翰@Awo le han@g(Wolohan, John T.)@4著
702	0	@a张若飞@Azhang ruo fei@4译
801	0	@aCN@bCDNYKJZYXY@c20210301
905		@aCDNYKJZYXY@b300637947-9@dTP311.56@e232@f3

深入大型数据集：并行与分布化Python代码= Mastering large datasets with python：parallelize and distribute your python code/(美) John T. Wolohan著/张若飞译.-北京：电子工业出版社，2021.2

xx, 300页：图；24cm

ISBN 978-7-121-40368-2：CNY99.00

本书共分3部分, 主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格, 以及Python中基础的map和reduce函数, 并介绍如何将对象持久化, 通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架, 以及如何使用mrjob库来编写Hadoop作业, 如何实现PageRank算法, 如何使用Spark来实现决策树和随机森林的机器学习模型。第3部分重点介绍云计算和云存储的基础知识, 包括如何通过boto3的Python库将文件上传到AWS S3服务, 以及如何在AWS的EMR集群中运行分布式的Hadoop和Spark作业。

●

序号	登录号	条形码	馆藏地/架位号	状态	备注
1	637947	300637947	海科-1楼/4架5列1层/ [索取号:TP311.56/232]	在馆
2	637948	300637948	海科-1楼/4架5列1层/ [索取号:TP311.56/232]	在馆
3	637949	300637949	海科-1楼/4架5列1层/ [索取号:TP311.56/232]	在馆