apache-airflow-providers-openlineage

更新日誌

2.0.0

注意

此供應商版本僅適用於 Airflow 2.9+,如Apache Airflow 供應商支援政策中所述。

重大變更

警告

所有已棄用的類別、參數和功能都已從 OpenLineage 供應商套件中移除。以下是導入的重大變更

  • 工具

    • openlineage.utils 模組中移除 normalize_sql 函數。

  • 移除 OpenLineage 中的 供應商 棄用 (#44636)

功能

  • 新增 clear_number OpenLineage 的 dagrun 層級 事件 run id 產生 (#44617)

  • 利用 更多 資訊 決定性地 產生 OpenLineage run_id (#43936)

  • feat: 自動 注入 OL 資訊 DataprocSubmitJobOperator 中的 spark 工作 (#44477)

其他

  • 移除 AIRFLOW_V_2_9_PLUS 參考 (#44987)

  • 供應商中 最低 Airflow 版本 提升 Airflow 2.9.0 (#44956)

  • 供應商中 檢查 Airflow 版本的 一致 方式 (#44686)

  • OpenLineage 新增 基本 系統 測試 (#43643)

  • Asset 使用者 面向 元件 移動 task_sdk (#43773)

  • 程式碼庫中 execution_date 重新命名 logical_date (#43902)

1.14.0

功能

  • DbApiHook、 PrestoHook TrinoHook 新增 分號 剝離 支援 (#41916)

  • OL DAG Start 事件 新增 ProcessingEngineRunFacet (#43213)

錯誤修正

  • OpenLineage 資訊中 序列化 asset/dataset 時間表 條件, 適用於 Airflow 2 (#43434)

  • OpenLineage: 實例化 OpenLineageClient 時 接受 整個 組態。 (#43740)

其他

  • 暫時 限制 openlineage <1.24.0 (#43732)

  • python 運算子 移動 Standard 供應商 (#42081)

1.13.0

功能

  • feat(providers/openlineage): common 供應商中 使用 asset (#43111)

其他

  • 忽略 相容性 匯入的 attr-defined (#43301)

  • nit: OL 的 AirflowJobFacet 移除 taskgroup 的 工具提示 (#43152)

  • openlineage 供應商 需要 1.2.1 common.compat (#43039)

1.12.2

其他

  • 變更 匯入 針對 BashOperator 使用 Standard 供應商 (#42252)

  • 捨棄 python3.8 支援 核心 供應商 (#42766)

  • dataset 相關的 python 變數 名稱 重新命名 asset (#41348)

1.12.1

錯誤修正

  • fix: 發出 OpenLineage dag start 事件 (#42448)

  • fix: 錯誤 堆疊 追蹤 格式化中的 錯字 獲得 更清晰的 輸出 (#42017)

1.12.0

功能

  • feat: 傳送 DagRun 時 通知 潛在的 序列化 失敗, 不要 序列化 不必要的 參數, 防護 監聽器 處理 例外 (#41690)

錯誤修正

  • fix: openlineage InfoJsonEncodable 中 列表 轉換 扁平化的 字串 (#41786)

其他

  • chore: 提升 OL 供應商 相依性 版本 (#42059)

  • OpenLineage 供應商中 execution date 移動 dag_run.logical_date (#41889)

  • 統一 DAG 排程 引數, 預設值 變更 None (#41453)

1.11.0

注意

此供應商版本僅適用於 Airflow 2.8+,如Apache Airflow 供應商支援政策中所述。

功能

  • feat: 所有 OpenLineage 事件 新增 debug facet (#41217)

  • feat: AirflowRunFacet 中 DAG 資訊 新增 fileloc (#41311)

  • feat: openlineage client 移除 已棄用的 from_environment() 方法 (#41310)

  • feat: openlineage 監聽器 擷取 hook 層級 血緣 (#41482)

錯誤修正

  • fix: 取得 task 相依性, 而不 task 樹狀結構 序列化 字串 (#41494)

  • fix: OpenLineage on_start 方法 遺失時, 傳回 空的 資料 而不是 None (#41268)

  • fix: dagTree 取代 downstream_task_ids (#41587)

其他

  • 供應商中 最低 Airflow 版本 提升 Airflow 2.8.0 (#41396)

  • chore: 移除 openlineage 棄用 警告 (#41284)

1.10.0

功能

  • COMPLETE/FAIL 事件中 新增 AirflowRun (#40996)

  • openlineage: 擴展 custom_run_facets complete fail 執行 (#40953)

  • openlineage: OpenLineage 供應商 遷移 V2 facet。 (#39530)

  • openlineage: dag runEvents 新增 AirflowRunFacet (#40854)

  • [AIP-62] AIP-60 URI 翻譯 OpenLineage (#40173)

  • 能夠 OpenLineage 事件中 新增 自訂 facet (#38982)

  • openlineage: common.compat 中 新增 方法, 強制 hook 嘗試/捕捉 每個 2.10 hook 血緣 呼叫 (#40812)

  • openlineage: 使用 airflow 提供的 getter conf 取得 (#40790)

  • openlineage: 新增 組態 根據 conf 設定 包含 '完整' task 資訊 (#40589)

  • TaskInstance log_url 新增 OpenLineage facet (#40797)

  • openlineage: airflow run facet 中 task 資訊 新增 可延遲 資訊 (#40682)

錯誤修正

  • 調整 airflow 2.10 修正的 預設 extractor 的 on_failure 偵測 (#41094)

  • openlineage: 使 attrs.define 中 slots 的 所有 OL 用法中 保持一致 (#40992)

  • 'slots' 設定 True 用於 DagRun 中的 facet (#40972)

  • openlineage: 修正 / AirflowRunFacet 中 新增 一些 task 屬性 (#40725)

其他

  • openlineage: dt.now 取代 airflow.utils.timezone.utcnow (#40887)

  • openlineage: 移除 已棄用的 parentRun facet 金鑰 (#40681)

1.9.1

錯誤修正

  • fix openlineage 剖析 具有 MappedOperator 的 dag 樹狀結構 (#40621)

1.9.0

功能

  • local task job: 新增 timeout, on_task_instance_success 監聽器 過早 終止 (#39890)

  • openlineage: sql 剖析器 呼叫 站點周圍 新增 一些 debug 記錄 (#40200)

  • task SLA 排隊的 datetime 資訊 新增 AirflowRunFacet (#40091)

  • 錯誤 堆疊追蹤 新增 OpenLineage task 事件 (#39813)

  • 導入 AirflowJobFacet AirflowStateRunFacet (#39520)

  • 針對 OpenLineage runIds 使用 UUIDv7 (#39889)

  • openlineage: 個別 程序中 執行 擷取 訊息 傳送 (#40078)

  • AirflowRunFacet 中 新增 一些 已移除的 Task 屬性 (#40371)

錯誤修正

  • openlineage, redshift: 針對 Airflow 2.10 以下的 版本, 不要 呼叫 DB 以取得 結構描述 (#40197)

  • fix: 排程器 airflow standalone 上 使用 OL 供應商 崩潰 (#40459)

  • nit: 修正 記錄 層級 (#40461)

  • fix: OL facet 中 正確的 金鑰下 提供 堆疊 追蹤 (#40372)

其他

  • fix: airflow 供應商的 sqa 棄用 (#39293)

  • ruff 中 啟用 強制執行 pydocstyle 規則 D213。 (#40448)

1.8.0

警告

在 Airflow 2.10.0 中,我們修正了 try_number 的運作方式。對於 Airflow >= 2.10.0,請使用 apache-airflow-providers-openlineage >= 1.8.0。舊版 Airflow 不受影響,如果您執行不相容的版本,將會引發例外,要求您升級供應商版本。

功能

  • 排程器 處理 try_number 的 遞增 (#39336)

錯誤修正

  • fix: 防止 無法 匯入 extractor 時 發生錯誤 (#39736)

  • 排程器中 重新組態 衍生 OpenLineage 程序中的 ORM。 (#39735)

其他

  • chore: 更新 conf 擷取 文件字串, 調整 pool_size (#39721)

  • 移除 Google Snowflake 供應商中 'openlineage.common' 相依性。 (#39614)

  • 使用 'ProcessPoolExecutor' 而非 'ThreadPoolExecutor'。 (#39235)

  • misc: 新增 自訂 供應商 執行階段 檢查 (#39609)

  • 更快的 'airflow_version' 匯入 (#39552)

  • 簡化 'airflow_version' 匯入 (#39497)

  • openlineage: 通知 已捕捉到 記錄的 例外 (#39493)

  • chore: 新增 更多 OpenLineage 記錄 利於 偵錯 (#39136)

1.7.1

其他

  • openlineage, snowflake: 不要 針對 Snowflake 執行 外部 查詢 (#39113)

1.7.0

功能

  • 新增 lineage_job_namespace lineage_job_name OpenLineage 巨集 (#38829)

  • openlineage: 新增 '選擇加入' 選項 (#37725)

錯誤修正

  • fix: facet 中 移除 多餘的 運算子 資訊 (#38264)

  • fix: disabled_for_operators 現在 停止 整個 事件 發射 (#38033)

  • fix: 擷取 Airflow 組態時 新增 回退, 避免 引發 錯誤 (#37994)

  • fix: 修正 parent id 巨集, 移除 未使用的 工具 (#37877)

其他

  • 避免 測試 之外 使用 'assert' (#37718)

  • TaskInstance 上的 'task' 新增 預設值 / 修正 TaskInstancePydantic 上的 attrs (#37854)

1.6.0

功能

  • feat: event_size 擷取 時間 新增 OpenLineage 指標 (#37797)

  • feat: File User Airflow 的 血緣 實體 新增 OpenLineage 支援 (#37744)

  • [OpenLineage] JobTypeJobFacet 屬性 新增 支援。 (#37255)

  • chore: 更新 OpenLineage ExtractorManager 中的 註解 記錄 (#37622)

錯誤修正

  • fix: 檢查 運算子 是否 DefaultExtractor.extract_on_complete 中 停用 (#37392)

其他

  • docs: 更新 整個 OpenLineage 供應商 文件。 (#37620)

1.5.0

功能

  • feat: task 實例 產生 OpenLineage run_id 時 新增 dag_id。 (#36659)

1.4.0

功能

  • Redshift SQL 新增 OpenLineage 支援。 (#35794)

1.3.1

錯誤修正

  • 修正 錯字。 (#36362)

1.3.0

功能

  • feat: COMPLETE FAIL 事件 新增 parent_run_id (#36067)

  • 基本 指標 新增 統計資訊 收集器。 (#35368)

錯誤修正

  • fix: 修復 OpenLineage FAIL 事件的 run_id (#36051)

  • 修正 重新套用 供應商 文件的 範本 (#35686)

其他

  • 移除 ClassVar 註解。 (#36084)

1.2.1

其他

  • schema 篩選器 'create_filter_clauses' 中改為大寫 (#35428)

1.2.0

功能

  • SQL 運算子 發送 欄位沿襲。 (#34843)

1.1.1

其他

  • 調整 OpenLineage 提供者 中的 日誌 層級 (#34801)

1.1.0

功能

  • 允許 運算子 層級 停用 openlineage (#33685)

錯誤修正

  • 修正 'get_custom_facets' 中的 匯入。 (#34122)

其他

  • 改善 Airflow 提供者 模組 匯入,透過 將其中一些 放入 型別檢查 區塊 (#33754)

  • DBT Cloud 新增 OpenLineage 支援。 (#33959)

  • 重構 提供者 中不必要的  跳轉 (#33833)

  • 重構: 提供者 中的 lambdas 替換為 comprehensions (#33771)

1.0.2

錯誤修正

  • openlineage: 不要在 執行器 中執行 任務 實例 監聽器 (#33366)

  • openlineage: 不要 嘗試 編輯 來自 已棄用 配置 Proxy 物件 (#33393)

  • openlineage: 防禦性地 檢查 監聽器 中提供的 日期時間 (#33343)

其他

  • Trino 新增 OpenLineage 支援。 (#32910)

  • 簡化 其他 提供者 len() 的條件 (#33569)

  • repr() 替換為 正確的 格式化 (#33520)

1.0.1

錯誤修正

  • openlineage: 如果未 配置,則 停用 執行 監聽器 (#33120)

  • 未解析 schema 時,不要 使用 database 作為 後備。 (#32959)

其他

  • openlineage, bigquery: BigQueryExecuteQueryOperator 新增 openlineage 方法 支援 (#31293)

  • openlineage 配置 移動到 提供者 (#33124)

1.0.0

提供者的初始版本。

這個條目有幫助嗎?