Yandex.Cloud Data Proc 運算子¶
Yandex Data Proc 是一項服務,可協助您在 Yandex Cloud 基礎架構中部署 Apache Hadoop®* 和 Apache Spark™ 叢集。
透過 Data Proc,您可以管理叢集大小和節點容量,以及使用各種 Apache® 服務,例如 Spark、HDFS、YARN、Hive、HBase、Oozie、Sqoop、Flume、Tez 和 Zeppelin。
Apache Hadoop 用於儲存和分析結構化與非結構化的大數據。
Apache Spark 是一個用於快速資料處理的工具,可以與 Apache Hadoop 和其他儲存系統整合。