
DecisionBox for Databricks
decisionbox.io
连接Databricks,自动验证数据发现
3天前制作者:Selçuk Kızıltuğ
关于 DecisionBox for Databricks
DecisionBox for Databricks 是一款开源工具,能够无缝连接你的 Databricks 工作区,实现数据发现结果的自动验证。它通过自主编写 SQL 查询,对每一条发现与真实数据进行比对,并输出一个经过排序的优化任务列表,无需人工提示。
核心功能
- 自动 SQL 生成:代理根据数据模式自动编写 SQL 查询,无需手动编写。
- 数据验证:每条发现都会与 Databricks 中的实际数据进行交叉验证,确保准确性。
- 排序任务列表:根据验证结果生成优先级排序的待办事项,直接指导下一步行动。
主要特性
- 只读访问:仅通过只读权限连接,保障数据安全。
- Unity Catalog 限定:作用域限定在 Unity Catalog 内,避免影响其他资源。
- 仓库兼容:支持 Serverless、Pro 或 Classic SQL 仓库。
- 开源许可:采用 AGPL v3 协议,完全开源可定制。
适用场景
- 数据质量检查:自动验证数据管道中的异常发现。
- 分析结果复核:确保分析结论与底层数据一致。
- 数据治理:在 Unity Catalog 环境下快速定位数据问题。