Python 数据科学手册
这个资源库包含了整个 Python 数据科学手册,以(免费!)Jupyter notebooks 的形式存在。
如何使用这本书
- 全书在线阅读地址:https://jakevdp.github.io/PythonDataScienceHandboo... 。
- 使用这个仓库的 notebooks 目录下的 Jupyter notebooks 运行代码。
- 使用 Google Colab 启动这些 notebooks 的可执行版本:
- 使用 binder 启动一个实时 notebooks 服务器。
- 通过 O'Reilly Media 购买印刷版书籍。
关于我们
本书是用 Python 3.5 编写和测试的,不过其他 Python 版本(包括 Python 2.7)几乎在所有情况下都应该可以使用。
本书介绍了用 Python 处理数据所必需的核心库:特别是 IPython、NumPy、Pandas、Matplotlib、Scikit-Learn 以及相关的软件包。假设你熟悉 Python 这门语言,如果你需要快速介绍这门语言本身,请看免费的配套项目 《Python 的旋风之旅》:这是一个针对研究人员和科学家的快节奏的 Python 语言介绍。
参见 Index.ipynb,查看随文提供的 notebooks 索引。
软件
本书中的代码是在 Python 3.5 中测试的,尽管大多数(但不是全部)也能在 Python 2.7 和其他较旧的 Python 版本中正常工作。
我用来运行书中代码的包列在 requirements.txt 中 (请注意,其中一些确切的版本号可能在你的平台上不可用:你可能必须为自己的使用而调整它们)。要使用 conda 安装需求,在命令行中运行以下命令。
$ conda install --file requirements.txt
要用 Python 3.5 和所有需要的软件包版本创建一个名为 PDSH 的独立环境,运行以下命令。
$ conda create -n PDSH python=3.5 --file requirements.txt
您可以在 conda 文档的管理环境部分阅读更多关于使用 conda 环境的内容。
许可证
代码
这个资源库中的代码,包括上面列出的笔记本中的所有代码样本,都是在 MIT 许可 下发布的。更多内容请访问开源计划。
文本
本书文字内容以 CC-BY-NC-ND 许可 发布。阅读更多内容,请访问 Creative Commons。
(The first version translated by vz on 2020.09.20)