Tamaño de fuente
  • A-
  • A
  • A+
Color del sitio
  • R
  • A
  • A
  • A
Salta al contenido principal
EVA PUCE POSGRADOS MAESTRIASENLINEA 2025-2025 EVA PUCE POSGRADOS MAESTRIASENLINEA 2025-2025
  • Página Principal
  • Más
Español - Internacional ‎(es)‎
English ‎(en)‎ Español - Internacional ‎(es)‎
En este momento está usando el acceso para invitados
Acceder
Página Principal

Ruta Académica - RDA2 - Prgramación con Spark – Transformaciones y Acciones

  1. QUI/75/202502/V/EV/NV05/NV05-01-10/N0022-06/2105/TPR
  2. Ruta Académica - RDA2 - Prgramación con Spark – Transformaciones y Acciones

Tema

RDA2 T2

Instrucciones

Configuración del entorno Spark

  • Usa Google Colab, Jupyter Notebook con findspark, o una VM con Spark instalado.
  • Crea una SparkSession y verifica la configuración del entorno.

Carga y exploración de datos

  • Utiliza un dataset público (csv, json, txt) como logs de transacciones, usuarios o registros de eventos.
  • Cárgalo como RDD (opcionalmente como DataFrame también) y explora la estructura.

Aplica transformaciones narrow

Aplica al menos 3 transformaciones narrow como:

  • Map()
  • Filter()
  • Union()

Aplicar transformaciones wide

  • ReduceByKey()
  • GroupByKey()
  • Join()

Aplicar acciones sobre los RDD:

  • Collect
  • Count()
  • Take(n)
  • SaveAsTextFile()

Explica cada paso

  • Incluye comentarios explicativos en el código

Actividad previa Ruta Académica - RDA2 - Introducción de Spark
Siguiente actividad Ruta Académica - RDA3 - Exploración y Preparación de datos para Machine Learning
PUCE Virtual Logo

CAMPUS VIRTUAL

  • → SOPORTE VIRTUAL

CONTACTOS

  • soportevirtual@puce.edu.ec
  • Tel: +593 99 715 1230
  • Sede Quito
    Avenida 12 de Octubre 1076 y
    Vicente Ramón Roca