
本书的设计和编写目标是培养读者的数据思维能力和数据预处理能力,内容具有典型性和实用性,全面介绍基于Python的数据预处理的流程和技术。
全书共8个单元,单元1介绍数据预处理的基础知识,单元2介绍Python数据预处理工具pandas的用法及主要数据结构的用法,单元3?单元7依次介绍数据预处理流程中数据获取、数据合并、数据清洗、数据变换和数据描述等相关知识和技术。
为着重培养读者的动手能力,本书单元2?单元7都配套了任务实践和拓展实训,除单元8,每个单元还配套了课后习题。单元8为综合案例,通过网易云音乐相关数据集展示数据预处理的完整流程,帮助读者全面掌握全书相关知识和技术。
本书适合作为高等教育本、专科院校大数据技术和人工智能技术应用等相关专业的教材,也可作为数据分析培训班和“1+X”数据处理相关职业技能等级证书的教材。
汪静,中山大学计算机软件与理论专业博士,计算机软件副教授,广东省南粤优秀教师,计算机学会会员,大数据分析师(高级),人工智能算法工程师(高级)。从事高等教育教学工作16年,现任广东开放大学(广东理工职业学院)人工智能技术服务专业负责人。主持和参加各级教科研项目10多项,发表高水平论文共20多篇,拥有软件著作权2项,专利3项。研究领域包括数据分析,个性化推荐等。