Spark es un sistema distribuido que fue diseñado para procesar un gran volumen de datos de manera eficiente y rápida. Permite realizar tareas de procesamiento de datos en memoria y distribuir el trabajo en clústeres de máquinas para obtener un rendimiento más rápido.
Ingeniería de datos con Spark y Python


