000
|
01245nam0 22002531 450
|
001
|
0128155858
|
005
|
20181128155858.0
|
010
|
|
@a978-7-121-31071-3@dCNY79.00
|
100
|
|
@a20170420d2017 em y0chiy0121 ea
|
101
|
0
|
@achi
|
102
|
|
@aCN@b110000
|
105
|
|
@aa z 000yy
|
106
|
|
@ar
|
200
|
1
|
@a网络爬虫全解析@Awang luo pa chong quan jie xi@e技术、原理与实践@f罗刚著
|
210
|
|
@a北京@c电子工业出版社@d2017.03
|
215
|
|
@a429页@c图@d25cm
|
314
|
|
@a罗刚, 猎兔搜索创始人。
|
330
|
|
@a本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理, 如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息, 以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力, 本书介绍了实现分布式网络爬虫的关键技术。另外, 本书介绍了从图像和语音等多媒体格式文件中提取文本信息, 以及如何使用大数据技术存储抓取到的信息。最后, 以实战为例, 介绍了如何抓取微信和微博, 以及在电商、医药、金融等领域的案例应用。其中, 电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。
|
606
|
0
|
@a软件工具@Aruan jian gong ju@x程序设计
|
690
|
|
@aTP311.561@v5
|
692
|
|
@aTP311.56@v5
|
701
|
0
|
@a罗刚@Aluo gang@4著
|
801
|
0
|
@aCN@b人天书店@c20170420
|
905
|
|
@aCKNYKJZYXY@b300587870-2@dTP311.5@e162@f3
|
|
|
|
|
网络爬虫全解析:技术、原理与实践/罗刚著.-北京:电子工业出版社,2017.03 |
429页:图;25cm |
|
|
ISBN 978-7-121-31071-3:CNY79.00 |
本书介绍了如何开发网络爬虫。内容主要包括开发网络爬虫所需要的Java语法基础和网络爬虫的工作原理, 如何使用开源组件HttpClient和爬虫框架Crawler4j抓取网页信息, 以及针对抓取到的文本进行有效信息的提取。为了扩展抓取能力, 本书介绍了实现分布式网络爬虫的关键技术。另外, 本书介绍了从图像和语音等多媒体格式文件中提取文本信息, 以及如何使用大数据技术存储抓取到的信息。最后, 以实战为例, 介绍了如何抓取微信和微博, 以及在电商、医药、金融等领域的案例应用。其中, 电商领域的应用介绍了使用网络爬虫抓取商品信息入库到网上商店的数据库表。 |
● |
正题名:网络爬虫全解析
索取号:TP311.5/162
 
预约/预借
序号
|
登录号
|
条形码
|
馆藏地/架位号
|
状态
|
备注
|
1
|
543117
|
300543117
|
二线书库(不外借)/
[索取号:TP311.5/162]
|
在馆
|
|
2
|
543118
|
300543118
|
流通六库四楼/
[索取号:TP311.5/162]
|
在馆
|
|
3
|
543119
|
300543119
|
流通六库四楼/
[索取号:TP311.5/162]
|
在馆
|
|
4
|
587870
|
300587870
|
流通五库四楼/
[索取号:TP311.5/162]
|
在馆
|
|
5
|
587871
|
300587871
|
流通五库四楼/
[索取号:TP311.5/162]
|
在馆
|
|
6
|
587872
|
300587872
|
流通五库四楼/
[索取号:TP311.5/162]
|
在馆
|
|