Tamaño de fuente
  • A-
  • A
  • A+
Color del sitio
  • R
  • A
  • A
  • A
Salta al contenido principal
EVA PUCE POSGRADOS MAESTRIASENLINEA 2025-2025 EVA PUCE POSGRADOS MAESTRIASENLINEA 2025-2025
  • Página Principal
  • Más
Español - Internacional ‎(es)‎
English ‎(en)‎ Español - Internacional ‎(es)‎
En este momento está usando el acceso para invitados
Acceder
Página Principal

Tarea 2 Clase 4

  1. QUI/75/202502/V/EV/NV05/NV05-01-10/N0022-06/2105/TPR
  2. Tarea 2 Clase 4
Requisitos de finalización
Apertura: miércoles, 30 de julio de 2025, 00:00
Cierre: miércoles, 4 de febrero de 2026, 23:59

Tema

Procesamiento de Datos con Spark Core desde HDFS

Instrucciones

Imagina que estás trabajando en un sistema de análisis de datos para una tienda de comercio electrónico. El archivo CSV contiene información de ventas realizadas, incluyendo el ID de la transacción, la fecha de la compra, el producto vendido, la cantidad y el precio.

El archivo CSV debe ser creado manualmente por los estudiantes en su entorno local, cargado a HDFS, procesado con Apache Spark utilizando transformaciones y acciones, y finalmente los resultados deben ser guardados nuevamente en HDFS.

Crea el archivo con estos datos:


Revisa la documentación de spark

 

Guarda los comandos usados y las salidas obtenidas en un archivo .pdf, comenta el código para saber qué es lo que se hizo.

Tipo de entrega: Archivo en PDF


Actividad previa Tarea 1 Clase 4
Siguiente actividad Cuestionario Clase 4
PUCE Virtual Logo

CAMPUS VIRTUAL

  • → SOPORTE VIRTUAL

CONTACTOS

  • soportevirtual@puce.edu.ec
  • Tel: +593 99 715 1230
  • Sede Quito
    Avenida 12 de Octubre 1076 y
    Vicente Ramón Roca