airflow.providers.google.cloud.operators.datafusion
¶
此模組包含 Google DataFusion 運算子。
模組內容¶
類別¶
Pipeline 連結的輔助類別。 |
|
重新啟動單一 Data Fusion 執行個體。 |
|
刪除單一 Date Fusion 執行個體。 |
|
在指定的專案和位置中建立新的 Data Fusion 執行個體。 |
|
更新單一 Data Fusion 執行個體。 |
|
取得單一 Data Fusion 執行個體的詳細資訊。 |
|
建立 Cloud Data Fusion pipeline。 |
|
刪除 Cloud Data Fusion pipeline。 |
|
列出 Cloud Data Fusion pipeline。 |
|
啟動 Cloud Data Fusion pipeline。適用於批次和串流 pipeline。 |
|
停止 Cloud Data Fusion pipeline。適用於批次和串流 pipeline。 |
- class airflow.providers.google.cloud.operators.datafusion.DataFusionPipelineLinkHelper[source]¶
Pipeline 連結的輔助類別。
警告
此類別已過時。請考慮改用
resource_path_to_dict()
。
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionRestartInstanceOperator(*, instance_name, location, project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
重新啟動單一 Data Fusion 執行個體。
在操作結束時,執行個體會完全重新啟動。
另請參閱
如需更多關於如何使用此運算子的資訊,請參閱指南: 重新啟動 DataFusion 執行個體
- 參數
instance_name (str) – 要重新啟動的執行個體名稱。
location (str) – 處理請求的 Cloud Data Fusion 位置。
project_id (str) – 執行個體所屬的 Google Cloud 專案 ID。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionDeleteInstanceOperator(*, instance_name, location, project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
刪除單一 Date Fusion 執行個體。
另請參閱
如需更多關於如何使用此運算子的資訊,請參閱指南: 刪除 DataFusion 執行個體
- 參數
instance_name (str) – 要重新啟動的執行個體名稱。
location (str) – 處理請求的 Cloud Data Fusion 位置。
project_id (str) – 執行個體所屬的 Google Cloud 專案 ID。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionCreateInstanceOperator(*, instance_name, instance, location, project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
在指定的專案和位置中建立新的 Data Fusion 執行個體。
另請參閱
如需更多關於如何使用此運算子的資訊,請參閱指南: 建立 DataFusion 執行個體
- 參數
instance_name (str) – 要建立的執行個體名稱。
instance (dict[str, Any]) – Instance 的執行個體。 https://cloud.google.com/data-fusion/docs/reference/rest/v1beta1/projects.locations.instances#Instance
location (str) – 處理請求的 Cloud Data Fusion 位置。
project_id (str) – 執行個體所屬的 Google Cloud 專案 ID。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'instance', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionUpdateInstanceOperator(*, instance_name, instance, update_mask, location, project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
更新單一 Data Fusion 執行個體。
另請參閱
如需更多關於如何使用此運算子的資訊,請參閱指南: 更新 DataFusion 執行個體
- 參數
instance_name (str) – 要建立的執行個體名稱。
instance (dict[str, Any]) – Instance 的執行個體。 https://cloud.google.com/data-fusion/docs/reference/rest/v1beta1/projects.locations.instances#Instance
update_mask (str) – 欄位遮罩用於指定更新將覆寫執行個體資源中的哪些欄位。updateMask 中指定的欄位是相對於資源而言,而不是完整請求。如果欄位在遮罩中,則會被覆寫。如果使用者未提供遮罩,則所有支援的欄位 (目前為標籤和選項) 都將被覆寫。以逗號分隔的完整欄位名稱清單。範例:「user.displayName,photo」。 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf?_ga=2.205612571.-968688242.1573564810#google.protobuf.FieldMask
location (str) – 處理請求的 Cloud Data Fusion 位置。
project_id (str) – 執行個體所屬的 Google Cloud 專案 ID。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'instance', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionGetInstanceOperator(*, instance_name, location, project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
取得單一 Data Fusion 執行個體的詳細資訊。
另請參閱
如需更多關於如何使用此運算子的資訊,請參閱指南: 取得 DataFusion 執行個體
- 參數
instance_name (str) – 執行個體的名稱。
location (str) – 處理請求的 Cloud Data Fusion 位置。
project_id (str) – 執行個體所屬的 Google Cloud 專案 ID。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionCreatePipelineOperator(*, pipeline_name, pipeline, instance_name, location, namespace='default', project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
建立 Cloud Data Fusion pipeline。
另請參閱
如需更多關於如何使用此運算子的資訊,請參閱指南: 建立 DataFusion pipeline
- 參數
pipeline_name (str) – 您的 pipeline 名稱。
pipeline (dict[str, Any]) – pipeline 定義。如需更多資訊,請查看: https://docs.cdap.io/cdap/current/en/developer-manual/pipelines/developing-pipelines.html#pipeline-configuration-file-format
instance_name (str) – 執行個體的名稱。
location (str) – 處理請求的 Cloud Data Fusion 位置。
namespace (str) – 如果您的 pipeline 屬於 Basic 版本執行個體,則命名空間 ID 永遠為預設值。如果您的 pipeline 屬於 Enterprise 版本執行個體,您可以建立命名空間。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'pipeline_name', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionDeletePipelineOperator(*, pipeline_name, instance_name, location, version_id=None, namespace='default', project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
刪除 Cloud Data Fusion pipeline。
另請參閱
如需更多關於如何使用此運算子的資訊,請參閱指南: 刪除 DataFusion pipeline
- 參數
pipeline_name (str) – 您的 pipeline 名稱。
version_id (str | None) – 要刪除的 pipeline 版本
instance_name (str) – 執行個體的名稱。
location (str) – 處理請求的 Cloud Data Fusion 位置。
namespace (str) – 如果您的 pipeline 屬於 Basic 版本執行個體,則命名空間 ID 永遠為預設值。如果您的 pipeline 屬於 Enterprise 版本執行個體,您可以建立命名空間。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'version_id', 'pipeline_name', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionListPipelinesOperator(*, instance_name, location, artifact_name=None, artifact_version=None, namespace='default', project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出 Cloud Data Fusion pipeline。
另請參閱
如需瞭解如何使用此運算子的更多資訊,請參閱指南:列出 DataFusion 管線
- 參數
instance_name (str) – 執行個體的名稱。
location (str) – 處理請求的 Cloud Data Fusion 位置。
artifact_version (str | None) – 用於篩選執行個體的成品版本
artifact_name (str | None) – 用於篩選執行個體的成品名稱
namespace (str) – 如果您的 pipeline 屬於 Basic 版本執行個體,則命名空間 ID 永遠為預設值。如果您的 pipeline 屬於 Enterprise 版本執行個體,您可以建立命名空間。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'artifact_name', 'artifact_version', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionStartPipelineOperator(*, pipeline_name, instance_name, location, pipeline_type=DataFusionPipelineType.BATCH, runtime_args=None, success_states=None, namespace='default', pipeline_timeout=5 * 60, project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, asynchronous=False, deferrable=conf.getboolean('operators', 'default_deferrable', fallback=False), poll_interval=3.0, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
啟動 Cloud Data Fusion pipeline。適用於批次和串流 pipeline。
另請參閱
如需瞭解如何使用此運算子的更多資訊,請參閱指南:啟動 DataFusion 管線
- 參數
pipeline_name (str) – 您的 pipeline 名稱。
pipeline_type (airflow.providers.google.cloud.utils.datafusion.DataFusionPipelineType) – 選用管線類型(預設為 BATCH)。
instance_name (str) – 執行個體的名稱。
success_states (list[str] | None) – 如果提供,運算子將等待管線處於提供的其中一種狀態。
pipeline_timeout (int) – 運算子應等待管線處於
success_states
其中一種狀態的時長(秒)。僅在提供success_states
時有效。location (str) – 處理請求的 Cloud Data Fusion 位置。
runtime_args (dict[str, Any] | None) – 要傳遞至管線的可選執行階段引數
namespace (str) – 如果您的 pipeline 屬於 Basic 版本執行個體,則命名空間 ID 永遠為預設值。如果您的 pipeline 屬於 Enterprise 版本執行個體,您可以建立命名空間。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
asynchronous – 提交管線 ID 至 Data Fusion API 後傳回的旗標。這適用於提交長時間執行的管線,並使用 CloudDataFusionPipelineStateSensor 非同步等待它們。
deferrable (bool) – 在可延遲模式下執行運算子。與 asynchronous 參數無關。雖然 asynchronous 參數提供使用 sleep() 方法等待直到管線達到終止狀態的可能性,但 deferrable 模式使用非同步呼叫檢查狀態。無法同時使用 asynchronous 和 deferrable 參數。
poll_interval – 檢查狀態的輪詢間隔(秒)。僅在可延遲模式下使用。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'pipeline_name', 'runtime_args', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.datafusion.CloudDataFusionStopPipelineOperator(*, pipeline_name, instance_name, location, namespace='default', project_id=PROVIDE_PROJECT_ID, api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基底類別:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
停止 Cloud Data Fusion pipeline。適用於批次和串流 pipeline。
另請參閱
如需瞭解如何使用此運算子的更多資訊,請參閱指南:停止 DataFusion 管線
- 參數
pipeline_name (str) – 您的 pipeline 名稱。
instance_name (str) – 執行個體的名稱。
location (str) – 處理請求的 Cloud Data Fusion 位置。
namespace (str) – 如果您的 pipeline 屬於 Basic 版本執行個體,則命名空間 ID 永遠為預設值。如果您的 pipeline 屬於 Enterprise 版本執行個體,您可以建立命名空間。
api_version (str) – 將請求的 API 版本,例如 'v3'。
gcp_conn_id (str) – 擷取連線資訊時要使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 選用的服務帳戶,用於模擬短期憑證,或是取得清單中最後一個帳戶的 access_token 所需的串聯帳戶清單,該帳戶將在請求中被模擬。如果設定為字串,則該帳戶必須授予原始帳戶「服務帳戶權杖建立者」IAM 角色。如果設定為序列,則清單中的身分必須將「服務帳戶權杖建立者」IAM 角色授予緊鄰的前一個身分,清單中的第一個帳戶將此角色授予原始帳戶 (已套用範本)。
- template_fields: collections.abc.Sequence[str] = ('instance_name', 'pipeline_name', 'impersonation_chain')[source]¶