Airbyte简介
数据集成平台,支持从 API、数据库及文件源向数据库、数据仓库和湖的 ELT 管道传输。
我们坚信,唯有开源的数据迁移方案才能覆盖长尾数据源,同时赋能数据工程师定制现有连接器。我们的终极愿景是助您实现任意数据源到任意目标的迁移。Airbyte已提供业内最庞大的连接器目录,涵盖300余种API、数据库、数据仓库及数据湖连接方案。
你可以用任何语言实现 Airbyte 连接器,并采取遵循 Airbyte 规范 的 Docker 镜像的形式。你可以通过以下方式非常快速地创建新的连接器:
- 用于 API 连接器的 low-code Connector Development Kit (CDK) (demo)
- Python CDK (tutorial)
Airbyte 有一个内置的调度器,并使用 Temporal 来协调工作,确保规模的可靠性。Airbyte 利用 dbt 来规范化提取的数据,并可以在SQL和dbt中触发自定义转换。你也可以用 Airflow, Prefect or Dagster 来协调 Airbyte 的同步工作。
探索我们的 demo app。
快速启动
git clone https://github.com/airbytehq/airbyte.git cd airbyte docker-compose up
这里有一个 分步指南,告诉你如何从API中加载数据到文件中,这一切都在你的电脑上。
如果你想和我们的团队安排一次20分钟的通话,帮助你进行设置,请 直接在这里选择一些时间。
特性
- 为可扩展性而建。适应现有的连接器,以满足你的需求,或轻松地建立一个新的连接器。
- 可选的规范化模式。完全可定制,从原始数据开始或从一些规范化数据的建议开始。
- 全面的调度器。以你需要的频率自动复制你的数据。
- 实时监控。我们全面详细地记录所有的错误,以帮助你了解。
- 增量更新。自动复制是基于增量更新,以减少你的数据传输成本。
- 手动全面刷新。有时,你需要重新同步你的所有数据,重新开始。
- 调试自主性。在你认为合适的时候修改和调试管道,无需等待。
贡献
我们喜欢对 Airbyte 的贡献,无论大小。
请参阅我们的 贡献指南,了解如何开始。不确定从哪里开始?我们已经列出了一些可以开始的 好的首发问题。如果你有任何问题,请打开一个PR草案或访问我们的 slack 频道,核心团队可以帮助回答你的问题。
请注意,你能够使用你想要的语言创建连接器,因为Airbyte 连接以 Docker 容器的形式运行。
另外,我们永远不会要求你维护你的连接器。我们的目标是让 Airbyte 团队和社区帮助维护它,让我们称之为众包式维护。
社区支持
关于使用 Airbyte 的一般帮助,请参考 Airbyte官 方文档。对于额外的帮助,你可以使用这些频道之一来提问。
- Slack (用于与社区和 Airbyte 团队进行实时讨论)
- GitHub (错误报告,贡献)
- Twitter (快速获取新闻)
- 每周办公时间 (与 Airbyte 团队进行30分钟的现场非正式视频电话会议)
路线图
查看我们的 路线图,了解我们目前正在进行的工作,以及我们对未来几周、几个月和几年的设想。
许可证
Airbyte 在 MIT 许可下授权。请参阅 LICENSE 文件了解许可信息。