CDH 包括除 Apache Hadoop 之外的許多其他開源工具和技術,例如 Apache Spark,它是一種用于大規(guī)模數(shù)據(jù)處理的快速靈活的數(shù)據(jù)處理引擎。 CDH Spark2 是 Apache Spark 的一個版本,包含在 Cloudera Distribution for Apache Hadoop (CDH) 中。它是一個強大而靈活的數(shù)據(jù)處理引擎,非常適合廣泛的數(shù)據(jù)處理任務...
CDH(Cloudera Distribution Including Apache Hadoop)是一個用于在企業(yè)中部署和管理Apache Hadoop生態(tài)系統(tǒng)的分發(fā)版本。CDH包含了Hadoop核心組件,如HDFS、YARN和MapReduce,以及許多其他工具,如Apache Hive、Apache Pig、Apache Spark和Apache HBase。 在CDH中進行調(diào)優(yōu)的...