HDFS (Hadoop Distributed File System) es uno de los componentes de Hadoop framework.
HDFS es un sistema de archivos distribuido, lo que significa que utiliza un clúster de servidores para crear un espacio de almacenamiento..
HDFS puede almacenar cualquier número de archivos. Los archivos almacenados en el cluster se dividen en bloques de datos y se distribuyen entre los diferentes nodos del cluster HDFS..
Para garantizar la resistencia de los datos, cada bloque de datos se duplica en varios nodos (tres por Default).
Por lo tanto, el sistema de archivos no se ve afectado si falla un nodo.