QUI/75/202502/V/EV/NV05/NV05-01-10/N0022-06/2105/TPR: Ruta Académica - RDA2 - Prgramación con Spark – Transformaciones y Acciones | EVA PUCE POSGRADOS MAESTRIASENLINEA 2025-2025

Tamaño de fuente

A-
A
A+

Color del sitio

R
A
A
A

Página Principal

Tema

RDA2 T2

Instrucciones

Configuración del entorno Spark

Usa Google Colab, Jupyter Notebook con findspark, o una VM con Spark instalado.
Crea una SparkSession y verifica la configuración del entorno.

Carga y exploración de datos

Utiliza un dataset público (csv, json, txt) como logs de transacciones, usuarios o registros de eventos.
Cárgalo como RDD (opcionalmente como DataFrame también) y explora la estructura.

Aplica transformaciones narrow

Aplica al menos 3 transformaciones narrow como:

Map()
Filter()
Union()

Aplicar transformaciones wide

ReduceByKey()
GroupByKey()
Join()

Aplicar acciones sobre los RDD:

Collect
Count()
Take(n)
SaveAsTextFile()

Explica cada paso

Incluye comentarios explicativos en el código