题名:
|
互联网数据采集技术与应用 hu lian wang shu ju cai ji ji shu yu ying yong / 周林娥主编 , |
ISBN:
|
978-7-302-61910-9 价格: CNY49.00 |
语种:
|
chi |
载体形态:
|
130页 图 26cm |
出版发行:
|
出版地: 北京 出版社: 清华大学出版社 出版日期: 2022 |
内容提要:
|
本书基于“基础知识” +“代码示例” +“应用案例”的模式编写,共包括 7个项目。项目1主要介绍互联网数据采集的入门知识;项目2通过一个入门级的简单案例,介绍互联网数据采集的基本流程;项目3通过一个进阶的案例,详细介绍在没有给出官方开放API的情况下,如何通过抓包工具获取XHR请求地址;项目4主要介绍HTML文档数据的采集,对HTML进行解析,以及如何提取数据的属性与文本;项目5主要讲解批量获取数据的整理与合并技巧;项目6重点讲解如何通过Python的pymysql库对MySQL进行读写;项目7给出了对半结构化数据进行处理的最佳实践。 |
主题词:
|
互联网络 数据采集 |
中图分类法:
|
TP274 版次: 5 |
主要责任者:
|
周林娥 zhou lin e 主编 |