Apache Pig 運算子

Apache Pig 是一個用於分析大型資料集的平台,它包含一個用於表達資料分析程式的高階語言,以及用於評估這些程式的基礎架構。Pig 程式易於大量平行化,這反過來使它們能夠處理非常大的資料集。

使用 PigOperator 來執行 pig 腳本。

tests/system/apache/pig/example_pig.py[原始碼]

    run_this = PigOperator(
        task_id="run_example_pig_script",
        pig="ls /;",
        pig_opts="-x local",
    )

這個條目是否有幫助?