Google Cloud BigQuery 傳輸運算子至 BigQuery¶
Google Cloud BigQuery 是 Google Cloud 的無伺服器資料倉儲產品。此運算子可用於將資料從一個 BigQuery 表格複製到另一個表格。
先決條件任務¶
要使用這些運算子,您必須執行以下幾項操作
使用 Cloud Console 選擇或建立 Cloud Platform 專案。
為您的專案啟用計費功能,如 Google Cloud 文件 中所述。
啟用 API,如 Cloud Console 文件 中所述。
透過 pip 安裝 API 程式庫。
pip install 'apache-airflow[google]'詳細資訊請參閱 安裝。
運算子¶
從一個 BigQuery 表格複製資料到另一個表格,是透過 BigQueryToBigQueryOperator
運算子執行。
使用 Jinja 模板 以及 source_project_dataset_tables
、 destination_project_dataset_table
、 labels
、 impersonation_chain
來動態定義值。
您可以包含多個來源表格,以及定義 write_disposition
和 create_disposition
。如需更多資訊,請參考以上連結。
複製 BigQuery 表格¶
以下運算子將資料從一個或多個 BigQuery 表格複製到另一個表格。
copy_selected_data = BigQueryToBigQueryOperator(
task_id="copy_selected_data",
source_project_dataset_tables=f"{DATASET_NAME}.{ORIGIN}",
destination_project_dataset_table=f"{DATASET_NAME}.{TARGET}",
)