airflow.providers.apache.hive.transfers.mssql_to_hive
¶
此模組包含一個將資料從 MSSQL 移動到 Hive 的運算子。
模組內容¶
類別¶
將資料從 Microsoft SQL Server 移動到 Hive。 |
- class airflow.providers.apache.hive.transfers.mssql_to_hive.MsSqlToHiveOperator(*, sql, hive_table, create=True, recreate=False, partition=None, delimiter=chr(1), mssql_conn_id='mssql_default', hive_cli_conn_id='hive_cli_default', hive_auth=None, tblproperties=None, **kwargs)[原始碼]¶
繼承:
airflow.models.BaseOperator
將資料從 Microsoft SQL Server 移動到 Hive。
此運算子針對 Microsoft SQL Server 執行您的查詢,將檔案儲存在本地端,然後載入到 Hive 表格中。如果
create
或recreate
參數設定為True
,則會產生CREATE TABLE
和DROP TABLE
陳述式。Hive 資料類型是從游標的中繼資料推斷而來。請注意,在 Hive 中產生的表格使用
STORED AS textfile
,這不是最有效率的序列化格式。如果載入了大量資料,和/或表格被大量查詢,您可能會希望僅使用此運算子將資料暫存到臨時表格中,然後再使用HiveOperator
將其載入到最終目的地。- 參數
sql (str) – 要針對 Microsoft SQL Server 資料庫執行的 SQL 查詢。(已套用範本)
hive_table (str) – 目標 Hive 表格,使用點表示法來指定特定資料庫。(已套用範本)
create (bool) – 如果表格不存在是否建立表格
recreate (bool) – 是否在每次執行時刪除並重建表格
partition (dict | None) – 目標分割區,以分割區欄位和值的字典形式表示。(已套用範本)
delimiter (str) – 檔案中的欄位分隔符
mssql_conn_id (str) – 來源 Microsoft SQL Server 連線
hive_cli_conn_id (str) – 參考 Hive CLI 連線 ID。
hive_auth (str | None) – 為 Hive 連線傳遞的可選驗證選項
tblproperties (dict | None) – 要建立的 Hive 表格的 TBLPROPERTIES
- template_fields: collections.abc.Sequence[str] = ('sql', 'partition', 'hive_table')[原始碼]¶
- template_ext: collections.abc.Sequence[str] = ('.sql',)[原始碼]¶