Hive CLI 連線¶
Hive CLI 連線類型啟用 Hive CLI 整合。
驗證 Hive CLI 身分¶
有兩種方式可以使用 Airflow 連接到 Hive。
使用 Hive Beeline。亦即,建立包含主機、埠號和綱要的 JDBC 連線字串。您可以選擇性地使用代理使用者連線,並指定登入名稱和密碼。
使用 Hive CLI。亦即,在 extras 欄位中指定 Hive CLI 參數。
一次只能使用一種授權方法。如果您需要管理多個憑證或金鑰,則應設定多個連線。
預設連線 ID¶
所有與 Hive_CLI 相關的 Hook 和運算子預設都使用 hive_cli_default
。
設定連線¶
- 登入 (選填)
指定您的使用者名稱,用於代理使用者或 Beeline CLI。
- 密碼 (選填)
指定您的 Beeline CLI 密碼。
- 主機 (選填)
指定您的 JDBC Hive 主機,用於 Hive Beeline。
- 埠號 (選填)
指定您的 JDBC Hive 埠號,用於 Hive Beeline。
- 綱要 (選填)
指定您想要使用 Beeline 連接的 JDBC Hive 資料庫,或指定一個綱要,用於使用 Hive CLI 執行的 HQL 陳述式。
- 使用 Beeline (選填)
如果使用 Beeline CLI,請指定為
True
。預設值為False
。- 代理使用者 (選填)
指定一個代理使用者,以該使用者的身分執行 HQL 程式碼。
- 主體 (選填)
指定要與 Hive Beeline 一起使用的 JDBC Hive 主體。
- 高可用性 (選填)
如果您想要連線到在高可用性模式下執行的 Hive 安裝,請指定為
True
。並據此指定主機。
在環境變數中指定連線時,您應該使用 URI 語法來指定。
請注意,URI 的所有組成部分都應進行 URL 編碼。
例如
export AIRFLOW_CONN_HIVE_CLI_DEFAULT='hive-cli://beeline-username:beeline-password@jdbc-hive-host:80/hive-database?hive_cli_params=params&use_beeline=True&auth=noSasl&principal=hive%2F_HOST%40EXAMPLE.COM'