apache-airflow-providers-apache-hive
變更日誌
9.0.0¶
注意
此供應商版本僅適用於 Airflow 2.9+,如Apache Airflow 供應商支援政策中所述。
重大變更¶
警告
所有已棄用的類別、參數和功能已從 {provider_name} 供應商套件中移除。以下是導入的重大變更
移除了已棄用的
GSSAPI
以用於auth_mechanism。
請改用KERBEROS
。
從 Apache hive Provider 中移除 棄用 (#44715)
其他¶
將 供應商 中的 最低 Airflow 版本 提升 至 Airflow 2.9.0 (#44956)
更新 多個 供應商 文件 中的 DAG 範例 連結 (#44034)
在 整個 程式碼庫中 將 execution_date 重新命名為 logical_date (#43902)
8.2.1¶
其他¶
為 DbApiHook、 PrestoHook 和 TrinoHook 新增 分號 剝離 支援 (#41916)
說明 如何在 airflow virtualenv 中使用 uv 並使其 運作 (#43604)
將 'uncompress_file' 函式 從 'airflow.utils' 移動 到 Hive 供應商 (#43526)
8.2.0¶
注意
此供應商版本僅適用於 Airflow 2.8+,如Apache Airflow 供應商支援政策中所述。
其他¶
將 供應商 中的 最低 Airflow 版本 提升 至 Airflow 2.8.0 (#41396)
8.1.1¶
其他¶
更快的 'airflow_version' 匯入 (#39552)
簡化 'airflow_version' 匯入 (#39497)
改進 hive hook 中的 高 可用性 欄位 名稱 (#39658)
8.1.0¶
注意
此供應商版本僅適用於 Airflow 2.7+,如Apache Airflow 供應商支援政策中所述。
其他¶
將 供應商 中的 最低 Airflow 版本 提升 至 Airflow 2.7.0 (#39240)
8.0.0¶
重大變更¶
在 hive cli 連線中,將 use_beeline
的預設值變更為 True。Beeline 在此連線類型中將始終預設為啟用。
從 HiveHook 和相依運算子中移除已棄用的參數 authMechanism
。請在您的 extra
中改用 auth_mechanism
。
HiveOperator:移除了方法 get_hook
,改為使用 hook
屬性。
HiveStatsCollectionOperator:移除了已棄用的 col_blacklist
,改為使用 excluded_columns
。
為 hive cli 連線 預設 設定 use_beeline (#38763)
移除 hive 供應商 中已棄用的 程式碼 (#38859)
功能¶
為 hive hook 新增 對 高 可用性 Hive 安裝的 支援 (#38651)
7.0.1¶
其他¶
從 程式碼中 移除 對 Jira Issue 的 參考 (#37807)
將 'aws_conn_id' 類型 統一 為 始終為 'str | None' (#37768)
將 'pandas' 限制 為 '<2.2' (#37748)
7.0.0¶
重大變更¶
移除在連線中將代理使用者指定為 owner
或 login
或 as_param
的能力。現在,在 Proxy User
連線參數中設定使用者,或將 proxy_user
傳遞給 HiveHook 即可完成工作。
`` 簡化 hive 用戶端連線 (#37043)``
其他¶
修正 pyhive hive_pure_sasl 額外 名稱 (#37323)
6.4.2¶
錯誤修正¶
修正 'hive-stats' 中 '__init__' 中 範本 欄位的 指派 (#36905)
其他¶
為 所有 供應商 和 airflow 設定 pandas 最低 相依性 為 1.2.5 (#36698)
6.3.0¶
注意
此供應商版本僅適用於 Airflow 2.6+,如Apache Airflow 供應商支援政策中所述。
其他¶
將 供應商 中的 最低 Airflow 版本 提升 至 Airflow 2.6.0 (#36017)
6.2.0¶
注意
此供應商版本僅適用於 Airflow 2.5+,如Apache Airflow 供應商支援政策中所述。
其他¶
提升 供應商的 最低 airflow 版本 (#34728)
整合 HiveOperator 中的 hook 管理 (#34430)
6.1.6¶
其他¶
重構 供應商中的 regex (#33898)
在 Airflow 供應商中 將 序列 串連 替換為 解封裝 (#33933)
在 hive 供應商中 將 單一 元素 切片 替換為 next() (#33937)
在 供應商中, 使用 具有 多個 上下文的 單一 陳述式 ,而不是 巢狀 陳述式 (#33768)
在 Hive hook 中使用 startswith 一次,並搭配 tuple (#33765)
重構: 簡化 一些 迴圈 (#33736)
E731: 在 Airflow 供應商中 將 lambda 替換為 def 方法 (#33757)
在 Airflow 供應商中 使用 f-string 代替 (#33752)
6.1.5¶
注意
此供應商現在使用 pure-sasl,這是一個純 Python 實作的 SASL,它比先前的 sasl 實作維護得更好,即使對於 sasl 介面來說速度稍慢。它也允許為 Python 3.11 安裝 hive。
其他¶
重新 帶回 對 Python 3.11 的 hive 支援 (#32607)
重構: 簡化 Apache/Alibaba 供應商中的 程式碼 (#33227)
在 適用的情況下, 將 'X for X in Y' 簡化為 'Y' (#33453)
將 OrderedDict 替換為 純 dict (#33508)
簡化 圍繞 enumerate 的 程式碼 (#33476)
在 供應商中 使用 str.splitlines() 來 分割 行 (#33593)
簡化 providers/apache 中關於 len() 的 條件 (#33564)
將 repr() 替換為 適當的 格式化 (#33520)
避免 在 執行階段和 模組 層級中 匯入 pandas 和 numpy (#33483)
整合 pandas 的 匯入和 使用 (#33480)
6.1.3¶
錯誤修正¶
修正 Hive 的 Pandas2 相容性 (#32752)
其他¶
為 DbApiHook.run 方法 新增 更精確的 類型標註 (#31846)
將 Hive 設定 移動 到 Apache Hive 供應商 (#32777)
6.1.1¶
注意
此版本已停止支援 Python 3.7
錯誤修正¶
清理 beeline principal 參數 (#31983)
其他¶
將 unicodecsv 替換為 標準 csv 函式庫 (#31693)
6.1.0¶
注意
此供應商版本僅適用於 Airflow 2.4+,如Apache Airflow 供應商支援政策中所述。
其他¶
提升 供應商中的 最低 Airflow 版本 (#30917)
更新 'S3Hook' 上 'get_key' 方法的 傳回 類型 (#30923)
6.0.0¶
重大變更¶
auth 選項已從 extra 欄位移動到 Hook 中的 auth 參數。如果您在連線中將額外參數定義為 auth,則應將其移動到使用 HiveOperator 或其他 Hive 相關運算子的 DAG。
將 auth 參數 從 extra 移動 到 Hook 參數 (#30212)
5.1.0¶
功能¶
apache.hive
供應商現在提供 hive 巨集,這些巨集以前由 Airflow 提供。apache.hive
5.1.0 版本起,hive 巨集由供應商提供。
將 Hive 巨集 移動 到 供應商 (#28538)
使 pandas 相依性 對於 Amazon 供應商 成為 可選 項目 (#28505)
5.0.0¶
重大變更¶
連線中的 hive_cli_params
已移動到 Hook。如果您在連線中將額外參數定義為 hive_cli_params
extra,則應將其移動到使用 HiveOperator 的 DAG。
將 hive_cli_params 移動 到 hook 參數 (#28101)
功能¶
改進 Hive hook 中 無效 結構描述的 篩選 (#27808)
4.1.0¶
注意
此供應商版本僅適用於 Airflow 2.3+,如Apache Airflow 供應商支援政策中所述。
其他¶
將 所有 供應商的 最低 airflow 版本 移動 到 2.3.0 (#27196)
錯誤修正¶
在 Hive hook 中 篩選 掉 無效的 結構描述 (#27647)
4.0.0¶
重大變更¶
HiveServer2Hook
的get_records
中的hql
參數已重新命名為 sql,以符合get_records
DbApiHook 簽章。如果您將其用作位置參數,則對您而言沒有任何變更,但是如果您將其用作關鍵字參數,則需要重新命名它。hive_conf
參數已重新命名為parameters
,現在它是第二個參數,以符合 DbApiHook 中的get_records
簽章。如果您使用過它,則需要重新命名它。get_records
中的schema
參數是一個可選的 kwargs 額外參數,您可以新增它,以符合 DbApiHook 中get_records
的結構描述。棄用 hql 參數並 同步 DBApiHook 方法 API (#25299)
移除 Smart Sensors (#25507)
3.1.0¶
功能¶
將 所有 SQL 類別 移動 到 common-sql 供應商 (#24836)
錯誤修正¶
修正 'HiveMetastoreHook' 和 'HiveServer2Hook' 中的 連線 額外 參數 'auth_mechanism' (#24713)
3.0.0¶
重大變更¶
注意
此供應商版本僅適用於 Airflow 2.2+,如Apache Airflow 供應商支援政策中所述。
其他¶
雜項: 重構和 清理 Apache 供應商 (#24219)
AIP-47 - 將 hive DAG 遷移到 新 設計 #22439 (#24204)
2.3.0¶
功能¶
在 HiveMetastoreHook 中設定 更大的 限制 get_partitions_by_filter (#21504)
錯誤修正¶
修正 Hive 中的 Python 3.9 支援 (#21893)
修正 'HiveOperator' 的 'template_fields_renderers' 中的 金鑰 錯字 (#21525)
其他¶
支援 Python 3.10
為 hive operator 新增 操作指南 (#21590)
2.2.0¶
功能¶
新增 更多 SQL 範本 欄位 渲染器 (#21237)
為 新的 SQL 詞法分析器 新增 條件式 'template_fields_renderers' 檢查 (#21403)
2.0.2¶
錯誤修正¶
HiveHook 修正 當嘗試 讀取 空 表格時, get_pandas_df() 失敗的 問題 (#17777)
其他¶
最佳化 Airflow 2.2.0 的 連線 匯入
2.0.0¶
重大變更¶
自動套用 apply_default 裝飾器 (#15667)
警告
由於移除了 apply_default 裝飾器,此供應商版本需要 Airflow 2.1.0+。如果您的 Airflow 版本低於 2.1.0,並且您想要安裝此供應商版本,請先將 Airflow 升級到至少 2.1.0 版本。否則,您的 Airflow 套件版本將自動升級,並且您必須手動執行 airflow upgrade db
以完成移轉。
1.0.3¶
錯誤修正¶
修正 doc/docstrings 中的 錯誤和 錯字 (#15180)
修正 文法並 移除 重複的 單字 (#14647)
解決 與 HiveCliHook kill 相關的 問題 (#14542)
1.0.0¶
供應商的初始版本。