高等职业教育>计算机
大数据爬虫技术(21世纪技能创新型人才培养系列教材·大数据系列)

大数据爬虫技术(21世纪技能创新型人才培养系列教材·大数据系列)"

作者:黄源李兵川尹光辉
ISBN:978-7-300-31885-1
定价:¥49
字数:288千字
页数:
出版时间:2023-07-31
开本:16
版次:1-1
装帧:
出版社:中国人民大学出版社
简介

本书从网络爬虫技术出发,结合一线教师的教学实际经验与当前学生的实际情况编写而成,侧重于讲述爬虫技术知识,注重专业应用能力和计算思维能力的培养。本书深入浅出地讲解了大数据爬虫技术。全书共6 个项目,包括爬虫基础、Python 爬虫、爬虫与数据存储、Scrapy 框架、爬取动态网页以及爬虫与数据分析。每节列出了学习目标,指明了教与学的知识、技能、素养培养方向,并附带上机实训项目与操作指导,理论与实践相结合,实用性强,方便学生及时巩固技能,提升操作能力。

前言

目录

                                                   项目1 爬虫基础  
教学目标  
1.1 爬虫简介  
1.2 爬虫基础  
1.3 网页的请求和响应  
1.4 Python 的安装与使用  
1.5 项目小结  
1.6 实训  
1.7 习题  
项目2 Python 爬虫  
教学目标  
2.1 urllib 库  
2.2 requests 库  
2.3 正则表达式  
2.4 BeautifulSoup  
2.5 Xpath  
2.6 PyQuery  
2.7 JsonPath  
2.8 基础爬虫框架  
2.9 项目小结  
2.10 实训  
2.11 习题
项目3 爬虫与数据存储  
教学目标  
3.1 文件格式  
3.2 MySQL 数据库  
3.3 Redis 数据库  
3.4 OrientDB 数据库  
3.5 Python 操作MySQL 数据库  
3.6 项目小结  
3.7 实训  
3.8 习题  
项目4 scrapy 框架  
教学目标  
4.1 Scrapy 框架简介  
4.2 Spider  
4.3 Scrapy 的开发与实现  
4.4 项目小结  
4.5 实训  
4.6 习题  
项目5 爬取动态网页  
教学目标  
5.1 应用场景  
5.2 动态网页特征  
5.3 动态网页爬取  
5.4 项目小结  
5.5 实训  
5.6 习题  
项目6 爬虫与数据分析  
教学目标  
6.1 文本分析  
6.2 数据清洗  
6.3 Python 爬虫排序算法  
6.4 项目小结  
6.5 实训  
6.6 习题  

作者简介

黄源,重庆航天职业技术学院大数据技术与应用专业负责人,教授, 主要讲授“大数据导论”“大数据分析”“数据可视化”等专业核心课程;主编的教材有《数据清洗》《大数据分析》《Linux操作系统应用》《计算机网络基础》等,具有丰富的专业课程教学经验和教材编写经验。曾主持重庆市教委重大课题。

编辑推荐

作者寄语

电子资料

www.luweidong.cn

下一个