关于程序员:第三期Apache-DolphinScheduler-每周-FAQ-集锦

25次阅读

共计 1433 个字符,预计需要花费 4 分钟才能阅读完成。

4 月 15 日 - 4 月 21 日

问:有 openEuler + DolphinScheduler 的镜像吗?
答:没有,DolphinScheduler 公布的官网镜像都是基于 Debian 的。

问:有没有 DolphinScheduler 资源管理的示例?
答:可参考 Apache DolphinScheduler 应用标准与应用技巧分享,或者看看官网文档,https://dolphinscheduler.apache.org/zh-cn/docs/3.1.5/guide/re…

问:创立海豚调度数据源测试连贯连贯不上,然而在服务器下面 telnet 能够通,这是怎么回事呢?
答:请确定你填的用户名明码、可选配置是正确的,例如 MySQL 的 ssl 是否开启等。

问:采纳本地文件 (file:///) 治理,是否有上传文件的大小限度?
答:没有大小限度,然而太大能够会导致上传的时候超时。

问:曾经有用户了, 为什么还要有租户的概念? 租户对应 Linux 用户的意义是什么? 如果设置了 sudo.enable=false, 是不是就相当于不能用多租户了?
答:用户 -> 对应 ds web 操作系统,租户 -> 工作或者资源操作的用户,为了做资源隔离。

问:DolphinScheduler 3.1.5 版本反对 Trino sql 的工作类型配置吗?
答:3.1.5 不反对 Trino,Trino 的反对待发版。

问:工作流实例页面中展现的完结工夫和数据库中的 end_time 差了 13 个小时,工夫不统一是怎么回事?
答:须要 MySQL 与 Sprintboot 的时区保持一致。

问:DolphinScheduler 调度只能应用 python2.7 环境吗?新版 python3,能够间接调用吗?
答:能够用 Python3,但须要改 datax.py 脚本。

问:流都是 SQL,作业流上线后,后端怎么间接调用作业流呢?在 DolphinScheduler 外面好想没有看到调用的,是不是框架外面用 DolphinScheduler 的 API 进行调度的呢?
答:如果是指工作流都是 SQL 工作,触发工作流能够通过页面,或者 API 接口调用。

问:DolphinScheduler 最大可反对提交多少工作?单节点最大并发能够达到多少个?
答:可参考:最新性能测试 | Apache DolphinScheduler 每分钟调度工作并发是 Apache Airflow 2 倍

问:替换 Airflow 为 DolphinScheduler 的劣势和具体计划是什么?
答:DolphinScheduler 外乡开发,操作更合乎国人习惯,且在性能、性能上都有劣势,可参考性能比照文章查看:最新性能测试 | Apache DolphinScheduler 每分钟调度工作并发是 Apache Airflow 2 倍
迁徙案例:从 Airflow 到 Apache DolphinScheduler,有赞大数据开发平台的调度零碎演进
迁徙工具:迁徙工具 Air2phin 发表开源,2 步迁徙 Airflow 至 Dolphinscheduler

问:两个 Python 节点两头如何传递数据?当初只能开 nas 共享写文件,感觉十分不不便。
答:目前只能这样做,3.2.0 将会有更加好的办法 https://github.com/apache/dolphins
cheduler/pull/12552

问:DolphinScheduler 2.x 版本 MySQL 和主机上 task 记录太多 100 万以上,主动清理形式是什么?
答:日志倡议写 corntab 清理。

本文由博客一文多发平台 OpenWrite 公布!

正文完
 0