Requisitos de finalización
Apertura: miércoles, 6 de agosto de 2025, 00:00
Cierre: jueves, 19 de febrero de 2026, 23:59
Tema
Spark SQL
Instrucciones
- Subir archivos a HDFS descargarlos desde aquí
- Cargar datos en Spark usando Spark SQL
- Realizar un join entre los DataFrames por userId
- Contar cuántos anuncios han sido mostrados a cada usuario
- Obtener el promedio de isHit por categoría de anuncio
- Contar cuántos usuarios únicos han hecho click en cada categoría
- Guardar el resultado del punto anterior en un archivo de HDFS
Nota: Pasa el código a un archivo PDF con sus respectivos comentarios en él.
- 11 de febrero de 2026, 09:37
- 11 de febrero de 2026, 09:37