airflow.providers.google.cloud.triggers.dataflow
¶
模組內容¶
類別¶
Dataflow 觸發器,用於檢查範本化作業是否已完成。 |
|
觸發器,用於監控 Dataflow 作業是否已達到任何預期的狀態。 |
|
Dataflow 觸發器,用於檢查 Dataflow YAML 作業的狀態。 |
|
觸發器,用於檢查與 Dataflow 作業相關聯的指標。 |
|
觸發器,用於檢查與 Dataflow 作業相關聯的自動擴展事件。 |
|
觸發器,用於檢查與 Dataflow 作業相關聯的作業訊息。 |
屬性¶
- class airflow.providers.google.cloud.triggers.dataflow.TemplateJobStartTrigger(job_id, project_id, location=DEFAULT_DATAFLOW_LOCATION, gcp_conn_id='google_cloud_default', poll_sleep=10, impersonation_chain=None, cancel_timeout=5 * 60)[原始碼]¶
基底類別:
airflow.triggers.base.BaseTrigger
Dataflow 觸發器,用於檢查範本化作業是否已完成。
- 參數
project_id (str | None) – 必填。啟動作業的 Google Cloud 專案 ID。
job_id (str) – 必填。作業的 ID。
location (str) – 選填。執行作業的位置。如果設定為 None,則會使用 DEFAULT_DATAFLOW_LOCATION 的值
gcp_conn_id (str) – 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選填。要使用短期憑證模擬的服務帳戶,或取得清單中最後一個帳戶的 access_token 所需的鏈結帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予直接前一個身分,清單中的第一個帳戶將此角色授予原始帳戶(範本化)。
cancel_timeout (int | None) – 選填。當任務被終止時,運算子應等待管道成功取消的時間長度(秒)。
- class airflow.providers.google.cloud.triggers.dataflow.DataflowJobStatusTrigger(job_id, expected_statuses, project_id, location=DEFAULT_DATAFLOW_LOCATION, gcp_conn_id='google_cloud_default', poll_sleep=10, impersonation_chain=None)[原始碼]¶
基底類別:
airflow.triggers.base.BaseTrigger
觸發器,用於監控 Dataflow 作業是否已達到任何預期的狀態。
- 參數
job_id (str) – 必填。作業的 ID。
expected_statuses (set[str]) – 作業的預期狀態。請參閱: https://cloud.google.com/dataflow/docs/reference/rest/v1b3/projects.jobs#Job.JobState
project_id (str | None) – 必填。啟動作業的 Google Cloud 專案 ID。
location (str) – 選填。執行作業的位置。如果設定為 None,則會使用 DEFAULT_DATAFLOW_LOCATION 的值。
gcp_conn_id (str) – 用於連線到 Google Cloud 的連線 ID。
poll_sleep (int) – 檢查作業的兩個連續呼叫之間等待的時間(秒)。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選填。要使用短期憑證模擬的服務帳戶,或取得清單中最後一個帳戶的 access_token 所需的鏈結帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予直接前一個身分,清單中的第一個帳戶將此角色授予原始帳戶(範本化)。
- class airflow.providers.google.cloud.triggers.dataflow.DataflowStartYamlJobTrigger(job_id, project_id, location=DEFAULT_DATAFLOW_LOCATION, gcp_conn_id='google_cloud_default', poll_sleep=10, cancel_timeout=5 * 60, expected_terminal_state=None, impersonation_chain=None)[原始碼]¶
基底類別:
airflow.triggers.base.BaseTrigger
Dataflow 觸發器,用於檢查 Dataflow YAML 作業的狀態。
- 參數
job_id (str) – 必填。作業的 ID。
project_id (str | None) – 必填。啟動作業的 Google Cloud 專案 ID。
location (str) – 執行作業的位置。如果設定為 None,則會使用 DEFAULT_DATAFLOW_LOCATION 的值。
gcp_conn_id (str) – 用於連線到 Google Cloud 的連線 ID。
poll_sleep (int) – 選填。輪詢 Google Cloud Platform 以取得 Dataflow 作業的時間間隔(秒)。
cancel_timeout (int | None) – 選填。當任務被終止時,運算子應等待管道成功取消的時間長度(秒)。
expected_terminal_state (str | None) – 選填。Dataflow 作業的預期終止狀態,運算子任務將在此狀態下設定為成功。批次作業預設為 ‘JOB_STATE_DONE’,串流作業預設為 ‘JOB_STATE_RUNNING’。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選填。要使用短期憑證模擬的服務帳戶,或取得清單中最後一個帳戶的 access_token 所需的鏈結帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予直接前一個身分,清單中的第一個帳戶將此角色授予原始帳戶(範本化)。
- class airflow.providers.google.cloud.triggers.dataflow.DataflowJobMetricsTrigger(job_id, project_id, location=DEFAULT_DATAFLOW_LOCATION, gcp_conn_id='google_cloud_default', poll_sleep=10, impersonation_chain=None, fail_on_terminal_state=True)[原始碼]¶
基底類別:
airflow.triggers.base.BaseTrigger
觸發器,用於檢查與 Dataflow 作業相關聯的指標。
- 參數
job_id (str) – 必填。作業的 ID。
project_id (str | None) – 必填。啟動作業的 Google Cloud 專案 ID。
location (str) – 選填。執行作業的位置。如果設定為 None,則會使用 DEFAULT_DATAFLOW_LOCATION 的值。
gcp_conn_id (str) – 用於連線到 Google Cloud 的連線 ID。
poll_sleep (int) – 檢查作業的兩個連續呼叫之間等待的時間(秒)。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選填。要使用短期憑證模擬的服務帳戶,或取得清單中最後一個帳戶的 access_token 所需的鏈結帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予直接前一個身分,清單中的第一個帳戶將此角色授予原始帳戶(範本化)。
fail_on_terminal_state (bool) – 如果設定為 True,則當作業達到終止狀態時,觸發器將產生具有錯誤狀態的 TriggerEvent。
- class airflow.providers.google.cloud.triggers.dataflow.DataflowJobAutoScalingEventTrigger(job_id, project_id, location=DEFAULT_DATAFLOW_LOCATION, gcp_conn_id='google_cloud_default', poll_sleep=10, impersonation_chain=None, fail_on_terminal_state=True)[原始碼]¶
基底類別:
airflow.triggers.base.BaseTrigger
觸發器,用於檢查與 Dataflow 作業相關聯的自動擴展事件。
- 參數
job_id (str) – 必填。作業的 ID。
project_id (str | None) – 必填。啟動作業的 Google Cloud 專案 ID。
location (str) – 選填。執行作業的位置。如果設定為 None,則會使用 DEFAULT_DATAFLOW_LOCATION 的值。
gcp_conn_id (str) – 用於連線到 Google Cloud 的連線 ID。
poll_sleep (int) – 檢查作業的兩個連續呼叫之間等待的時間(秒)。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選填。要使用短期憑證模擬的服務帳戶,或取得清單中最後一個帳戶的 access_token 所需的鏈結帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予直接前一個身分,清單中的第一個帳戶將此角色授予原始帳戶(範本化)。
fail_on_terminal_state (bool) – 如果設定為 True,則當作業達到終止狀態時,觸發器將產生具有錯誤狀態的 TriggerEvent。
- class airflow.providers.google.cloud.triggers.dataflow.DataflowJobMessagesTrigger(job_id, project_id, location=DEFAULT_DATAFLOW_LOCATION, gcp_conn_id='google_cloud_default', poll_sleep=10, impersonation_chain=None, fail_on_terminal_state=True)[原始碼]¶
基底類別:
airflow.triggers.base.BaseTrigger
觸發器,用於檢查與 Dataflow 作業相關聯的作業訊息。
- 參數
job_id (str) – 必填。作業的 ID。
project_id (str | None) – 必填。啟動作業的 Google Cloud 專案 ID。
location (str) – 選填。執行作業的位置。如果設定為 None,則會使用 DEFAULT_DATAFLOW_LOCATION 的值。
gcp_conn_id (str) – 用於連線到 Google Cloud 的連線 ID。
poll_sleep (int) – 檢查作業的兩個連續呼叫之間等待的時間(秒)。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選填。要使用短期憑證模擬的服務帳戶,或取得清單中最後一個帳戶的 access_token 所需的鏈結帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予直接前一個身分,清單中的第一個帳戶將此角色授予原始帳戶(範本化)。
fail_on_terminal_state (bool) – 如果設定為 True,則當作業達到終止狀態時,觸發器將產生具有錯誤狀態的 TriggerEvent。