icon of Dagster

Dagster

一款现代化、开源的数据编排器,专为构建、运行和观测具备血缘追踪与可观测性的数据pipeline而设计。

社区:

image for Dagster

产品概览

什么是Dagster?

Dagster是一款为数据工程师量身打造的综合性数据编排平台,助力高效开发、调度和监控数据pipeline与资产。平台强调开发者友好体验,支持本地开发、测试及全流程可观测性。Dagster以数据资产为核心抽象,便于精确血缘追踪、元数据管理与模块化pipeline构建。支持灵活的执行环境,与主流云服务和数据工具无缝集成,并通过Dagster+提供高级企业功能。该平台为团队打造可扩展、易维护且高可靠性的数据工作流,统一管控数据质量、新鲜度与治理。


主要功能

  • 以数据资产为中心的模型

    专注于通过显式的数据资产管理数据pipeline,实现清晰的数据血缘、依赖追踪与元数据管理。

  • 集成可观测性与监控

    提供统一界面用于日志记录、数据质量检查、实时运行状态与详细诊断,确保pipeline的可靠性。

  • 灵活且可扩展的执行方式

    支持任意Python工作流、其他语言的代码执行,并适配多样化部署环境,包括无服务器和容器编排。

  • 丰富的调度与事件驱动触发

    支持基于上下文的pipeline调度与传感器,根据外部事件或数据新鲜度触发运行。

  • 全面的集成能力

    可与主流云服务商(AWS、GCP、Azure)、ETL工具及BI平台连接,助力无缝集成数据生态。

  • Dagster+企业级功能

    为大规模数据运营提供增强的安全性、合规性、运维流程、成本洞察及优先支持。


使用场景

  • ETL与数据pipeline管理 : 构建、测试并编排复杂的数据采集、转换和加载工作流,具备清晰的资产血缘和质量管控。
  • 数据质量与治理 : 通过集成可观测性和元数据,监控数据新鲜度、校验数据集,并确保数据隐私合规。
  • 机器学习模型训练pipeline : 协调特征工程、模型训练与部署的数据工作流,实现可复现性和可追溯性。
  • 商业智能与报表 : 通过编排数据流和监控pipeline健康,确保仪表盘和报表数据的可靠性与实时性。
  • 多环境开发与测试 : 支持本地开发、预发和生产环境的解耦部署及可复用pipeline组件。

常见问题

Dagster网站分析

Dagster流量与排名
157.15K
月访问量
00:01:18
平均访问时长
3743
分类排名
0.44%
用户跳出率
流量趋势:Dec 2025 - Feb 2026
Dagster主要用户地区
  1. 🇺🇸 US: 25.62%

  2. 🇦🇪 AE: 5.9%

  3. 🇻🇳 VN: 5.1%

  4. 🇨🇦 CA: 3.98%

  5. 🇮🇳 IN: 3.71%

  6. Others: 55.69%