Analytics Zoo
基于 Apache Spark/Flink 和 Ray 的分布式 TensorFlow、Keras 和 PyTorch 的统一数据分析和 AI 平台。
什么是 Analytics Zoo?
Analytics Zoo 将 TensorFlow、Keras 和 PyTorch 无缝扩展到分布式大数据中(使用 Spark、Flink 和 Ray)。 将人工智能模型(TensorFlow、PyTorch、OpenVINO 等)应用于分布式大数据的端到端管道。
将 AI 模型(TensorFlow、PyTorch、OpenVINO 等)应用于分布式大数据的端到端管道。
- 用 Spark 代码内联编写 TensorFlow 或 PyTorch,用于分布式训练和推理。
- 在 Spark ML Pipelines 中支持原生深度学习(TensorFlow/Keras/PyTorch/BigDL)。
- 通过 RayOnSpark 直接在大数据集群上运行 Ray 程序。
- 用于(TensorFlow/PyTorch/BigDL/OpenVINO)模型推理的普通 Java/Python API。
用于自动化机器学习任务的高级ML工作流。
内置模型用于推荐,时间序列,计算机视觉和NLP应用。
为什么使用Analytics Zoo?
如果你想使用 Analytics Zoo 来开发你的 AI 解决方案,你可能会希望:
- 你想轻松地将 AI 模型(如 TensorFlow、Keras、PyTorch、BigDL、OpenVINO 等)应用于分布式大数据。
- 您希望以 "零" 代码更改的方式透明地将您的 AI 应用从单台笔记本电脑扩展到大型集群。
- 您希望将您的 AI 管道部署到现有的 YARN 或 K8S 集群上,而无需对集群进行任何修改。
- 你想自动化应用机器学习的过程(如特征工程、超参数调整、模型选择、分布式推理等)。
如何使用Analytics Zoo?
- 查看 入门页面,快速了解如何使用 Analytics Zoo。
- 参考 Python, Scala 和 Docker 指南来安装 Analytics Zoo。
- 访问 文档网站(中国的镜像)了解更多关于 Analytics Zoo 的信息。
- 查看 Powered By & Presentations 页面,了解使用 Analytics Zoo 的实际应用。
- 加入 Google Group (或订阅 Mail List),了解更多关于 Analytics Zoo 的问题和讨论。
(The first version translated by vz on 2020.10.25)