透過 SQLExecuteQueryOperator 連接 Apache Drill

先決條件

使用 SQLExecuteQueryOperator,在 Drill 查詢引擎中執行 SQL 指令。

若要連接 Drill,您必須設定 Drill 連線,並且可以將其作為 conn_id 傳遞給 SQLExecuteQueryOperator。

警告

之前,DrillOperator 用於執行此類操作。但目前 DrillOperator 已被棄用,並將在供應商的未來版本中移除。請考慮盡快切換到 SQLExecuteQueryOperator。

SQLExecuteQueryOperator

在 Apache Drill 伺服器上執行一個或多個 SQL 查詢。sql 參數可以被模板化,並且可以是外部的 .sql 檔案。

使用運算子

tests/system/apache/drill/example_drill_dag.py[原始碼]

sql_task = SQLExecuteQueryOperator(
    task_id="json_to_parquet_table",
    sql="""
    drop table if exists dfs.tmp.employee;
    create table dfs.tmp.employee as select * from cp.`employee.json`;
    """,
)

參考資料

如需更多資訊,請參閱 Drill 關於查詢資料的文件

這個條目是否有幫助?