airflow.providers.google.cloud.triggers.gcs

模組內容

類別

GCSBlobTrigger

當在給定的儲存桶中找到請求的檔案或資料夾時,觸發器會觸發。

GCSCheckBlobUpdateTimeTrigger

此觸發器會非同步呼叫 GCS,以檢查儲存桶中的物件是否已更新。

GCSPrefixBlobTrigger

在儲存桶中尋找符合前綴的物件。

GCSUploadSessionTrigger

如果非活動期間已過且物件數量沒有增加,則傳回觸發器事件。

class airflow.providers.google.cloud.triggers.gcs.GCSBlobTrigger(bucket, object_name, use_glob, poke_interval, google_cloud_conn_id, hook_params)[原始碼]

基底類別: airflow.triggers.base.BaseTrigger

當在給定的儲存桶中找到請求的檔案或資料夾時,觸發器會觸發。

參數
  • bucket (str) – 物件所在的 Google 雲端儲存空間儲存桶。

  • object_name (str) – 儲存桶中存在的檔案或資料夾

  • use_glob (bool) – 若為 true,則 object_name 會被解讀為 glob

  • google_cloud_conn_id (str) – Google 連線的參考

  • poke_interval (float) – 檢查檔案/資料夾的輪詢週期(秒)。

  • hook_params (dict[str, Any]) – 要傳遞到底層 Hook 的額外組態參數。應符合所需的 Hook 建構函式參數。

serialize()[原始碼]

序列化 GCSBlobTrigger 引數和類別路徑。

async run()[原始碼]

迴圈直到找到相關的檔案/資料夾。

class airflow.providers.google.cloud.triggers.gcs.GCSCheckBlobUpdateTimeTrigger(bucket, object_name, target_date, poke_interval, google_cloud_conn_id, hook_params)[原始碼]

基底類別: airflow.triggers.base.BaseTrigger

此觸發器會非同步呼叫 GCS,以檢查儲存桶中的物件是否已更新。

參數
  • bucket (str) – Google 雲端儲存空間儲存桶名稱,物件所在的雲端儲存空間。

  • object_name (str) – 儲存桶中存在的檔案或資料夾

  • target_date (datetime.datetime) – 用於與 Blob 物件更新時間比較的上下文日期時間

  • poke_interval (float) – 檢查檔案/資料夾的輪詢週期(秒)。

  • google_cloud_conn_id (str) – Google 連線的參考

  • hook_params (dict[str, Any]) – 具有 impersonation_chain 的 dict 物件

serialize()[原始碼]

序列化 GCSCheckBlobUpdateTimeTrigger 引數和類別路徑。

async run()[原始碼]

迴圈直到物件更新時間晚於目標日期時間。

class airflow.providers.google.cloud.triggers.gcs.GCSPrefixBlobTrigger(bucket, prefix, poke_interval, google_cloud_conn_id, hook_params)[原始碼]

基底類別: GCSBlobTrigger

在儲存桶中尋找符合前綴的物件。

如果找不到,則休眠間隔時間並再次檢查。否則,傳回符合的項目。

參數
  • bucket (str) – 物件所在的 Google 雲端儲存空間儲存桶。

  • prefix (str) – 要在 Google 雲端儲存空間儲存桶中比對的 blob_names 前綴

  • google_cloud_conn_id (str) – Google 連線的參考

  • poke_interval (float) – 檢查的輪詢週期(秒)

  • hook_params (dict[str, Any]) – 要傳遞到底層 Hook 的額外組態參數。應符合所需的 Hook 建構函式參數。

serialize()[原始碼]

序列化 GCSPrefixBlobTrigger 引數和類別路徑。

async run()[原始碼]

迴圈直到在儲存桶中找到給定前綴的符合項目。

class airflow.providers.google.cloud.triggers.gcs.GCSUploadSessionTrigger(bucket, prefix, poke_interval, google_cloud_conn_id, hook_params, inactivity_period=60 * 60, min_objects=1, previous_objects=None, allow_delete=True)[原始碼]

基底類別: GCSPrefixBlobTrigger

如果非活動期間已過且物件數量沒有增加,則傳回觸發器事件。

參數
  • bucket (str) – 預期物件所在的 Google 雲端儲存空間儲存桶。

  • prefix (str) – 要在 Google 雲端儲存空間儲存桶中檢查的前綴名稱。

  • poke_interval (float) – 檢查的輪詢週期(秒)

  • inactivity_period (float) – 指定上傳工作階段結束的非活動總秒數。請注意,此機制並非即時,並且此運算子可能不會在一段時間後才傳回,此期間已過且未感測到其他物件。

  • min_objects (int) – 上傳工作階段被視為有效所需的最少物件數量。

  • previous_objects (set[str] | None) – 上次輪詢期間找到的物件 ID 集合。

  • allow_delete (bool) – 此感測器是否應將間隔之間刪除物件視為有效行為。若為 true,則發生這種情況時將記錄警告訊息。若為 false,則會引發錯誤。

  • google_cloud_conn_id (str) – 連線至 Google 雲端儲存空間時要使用的連線 ID。

serialize()[原始碼]

序列化 GCSUploadSessionTrigger 引數和類別路徑。

async run()[原始碼]

迴圈直到在非活動期間的列表 Blob 中沒有新檔案或已刪除的檔案。

此條目是否有幫助?