Apache Pig 運算子¶
Apache Pig 是一個用於分析大型資料集的平台,它包含一個用於表達資料分析程式的高階語言,以及用於評估這些程式的基礎架構。Pig 程式易於大量平行化,這反過來使它們能夠處理非常大的資料集。
使用 PigOperator
來執行 pig 腳本。
run_this = PigOperator(
task_id="run_example_pig_script",
pig="ls /;",
pig_opts="-x local",
)