Spark é un sistema distribuído que foi deseñado para procesar un gran volume de datos de maneira eficiente e rápida. Permite realizar tarefas de procesamento de datos en memoria e distribuír o traballo en agrupacións industriais de máquinas para obter un rendemento máis rápido.
Enxeñería de datos con Spark e Python


