airflow.providers.apache.hdfs.hooks.webhdfs
¶
Web HDFS 的 Hook。
模組內容¶
類別¶
與 HDFS 互動。此類別是 hdfscli 程式庫的封裝器。 |
屬性¶
- exception airflow.providers.apache.hdfs.hooks.webhdfs.AirflowWebHDFSHookException[source]¶
Bases:
airflow.exceptions.AirflowException
WebHDFS hook 的特定例外。
- class airflow.providers.apache.hdfs.hooks.webhdfs.WebHDFSHook(webhdfs_conn_id=default_conn_name, proxy_user=None)[source]¶
Bases:
airflow.hooks.base.BaseHook
與 HDFS 互動。此類別是 hdfscli 程式庫的封裝器。
- get_conn()[source]¶
根據透過組態或環境變數設定的安全性模式建立連線。
- 返回
hdfscli InsecureClient 或 KerberosClient 物件。
- 返回類型
Any
- load_file(source, destination, overwrite=True, parallelism=1, **kwargs)[source]¶
上傳檔案到 HDFS。
- 參數
source (str) – 檔案或資料夾的本機路徑。如果是資料夾,則會上傳其中的所有檔案。 .. note:: 這表示不會遠端建立空的檔案資料夾。
destination (str) – 目標 HDFS 路徑。如果它已存在且為目錄,則檔案將上傳到其中。
overwrite (bool) – 覆寫任何現有的檔案或目錄。
parallelism (int) – 用於平行處理的執行緒數。值 0 (或負數) 會使用與檔案數量一樣多的執行緒。
kwargs (Any) – 轉發到
hdfs.client.Client.upload()
的關鍵字引數。