《Python数据科学入门》是人民邮电出版社出版的一本图书。
基本信息
书名
Python数据科学入门
作者
(俄)德米特里·齐诺维耶夫(Dmitry Zinoviev)
ISBN
978-7-115-47060-7
页数
145
定价
49元
出版社
人民邮电出版社
出版时间
201711
装帧
平装
开本
16开
目录
1内容简介
2图书目录
折叠编辑本段内容简介
《Python数据科学入门》以Python 语言讲解数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python 核心特性,文本数据、数据库、表格形式的数值数据、series 和frame、网络数据的使用,数据的绘制,概率与统计,机器学习。
折叠编辑本段图书目录
第 1 章 什么是数据科学 1
第 1 单元 数据分析步骤 2
第 2 单元 数据获取途径 3
第3 单元 报告的结构 4
轮到你了 5
第 2 章 数据科学的Python 核心 6
第4 单元 理解基本的字符串函数 6
第5 单元 选择合适的数据结构 8
第6 单元 通过列表推导式理解列表 9
第7 单元 使用计数器 10
第8 单元 使用文件 11
第9 单元 上网 12
第 10 单元 使用正则表达式实现模式匹配 13
第 11 单元 globbing 文件名与其他字符串 17
第 12 单元 Pickling 和Unpickling 数据 18
轮到你了 18
第3 章 使用文本数据 20
第 13 单元 处理HTML 文件 20
第 14 单元 处理CSV 文件 24
第 15 单元 读取JSON 文件 25
第 16 单元 处理自然语言中的文本 27
轮到你了 31
第4 章 使用数据库 33
第 17 单元 设置MySQL 数据库 33
第 18 单元 使用MySQL 数据库:命令行 36
第 19 单元 使用MySQL 数据库:pymysql 39
第 20 单元 改善文档存储:MongoDB 41
轮到你了 44
第5 章 使用表格形式的数值数据 45
第 21 单元 创建数组 46
第 22 单元 转置和重排 48
第 23 单元 索引和切片 49
第 24 单元 广播 51
第 25 单元 揭秘通用函数 52
第 26 单元 理解条件函数 54
第 27 单元 数组的聚合与排序 54
第 28 单元 将数组用作集合 56
第 29 单元 数组的保存和读取 57
第30 单元 生成合成正弦波 57
轮到你了 59
第6 章 使用series 和frame 61
第31 单元 pandas 数据结构 62
第32 单元 数据重塑 67
第33 单元 处理缺失数据 72
第34 单元 组合数据 75
第35 单元 数据的排序和描述 78
第36 单元 数据转换 82
第37 单元 掌握pandas 的文件读写功能 87
轮到你了 90
第7 章 使用网络数据 91
第38 单元 概念剖析 91
第39 单元 网络分析序列 94
第40 单元 使用networkx 95
轮到你了 101
第8 章 绘图 103
第41 单元 使用PyPlot 进行基本绘图 104
第42 单元 了解其他绘图类型 106
第43 单元 精通绘图装饰 107
第44 单元 用pandas 绘图 109
轮到你了 111
第9 章 概率与统计 113
第45 单元 回顾概率分布 113
第46 单元 回顾统计度量 115
第47 单元 以Python 的方式完成统计 117
轮到你了 120
第 10 章 机器学习 122
第48 单元 设计预测实验 122
第49 单元 线性回归拟合 124
第50 单元 用k 均值聚类实现数据分组 129
第51 单元 在随机决策森林中生存 131
轮到你了 133
附录1 扩展阅读 135
附录2 单星项目的解决方案 137
参考文献 146