Dove verranno archiviati i dati intermedi del mappatore?

Sommario:

Dove verranno archiviati i dati intermedi del mappatore?
Dove verranno archiviati i dati intermedi del mappatore?
Anonim

L'output del Mapper (dati intermedi) è memorizzato sul file system locale (non HDFS) di ogni singolo nodo dati del mappatore. Questa è in genere una directory temporanea che può essere impostata nella configurazione dall'amministratore di Hadoop.

Dove si trovano i dati intermedi MapReduce?

  • L'output del mapper (dati intermedi) è archiviato nel file system locale (NON HDFS) di ogni singolo nodo del mapper. …
  • Penso che questo sia il parametro che deve essere modificato per cambiare la posizione dei dati intermedi..
  • mapreduce.cluster.local.dir.
  • Spero che questo aiuti.

Dove viene memorizzato l'output del mappatore?

9) Dove viene memorizzato l'output del Mapper? I dati del valore della chiave intermedia dell'output del mappatore verranno archiviati nel file system locale dei nodi del mappatore. Questa posizione della directory è impostata nel file di configurazione dall'amministratore Hadoop.

Che cosa sono i dati intermedi in MapReduce?

I file di dati intermedi sono generati dalla mappa e riducono le attività in una directory (posizione) sul disco locale. … File di output generati dalle attività della mappa che fungono da input per le attività di riduzione. File temporanei generati dalle attività di riduzione.

Dov'è l'output del mapper scritto in Hadoop?

In Hadoop, l'output di Mapper è memorizzato sul disco locale, poiché è un output intermedio. Non è necessario memorizzare dati intermedisu HDFS perché: la scrittura dei dati è costosa e comporta la replica che aumenta ulteriormente i costi e il tempo.

Consigliato: