Del curso: Fundamentos de la ingeniería de datos
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 24.900 cursos impartidos por expertos del sector.
Solución: transformación de datos
Del curso: Fundamentos de la ingeniería de datos
Solución: transformación de datos
(Música alegre) ¿Cómo te fue resolviendo este desafío? Aquí, te muestro cómo lo resolví para que puedas comparar tu código con el mío. Lo primero, venía a importar SparkSession y col. Posteriormente, se creaba la conexión con SessionSpark. Y aquí venían los primeros espacios en blanco que debíamos completar. Lo primero era el nombre de la base de datos, en este caso, libreria. Posteriormente, hay que colocar el usuario y la contraseña para conectarnos a MySQL. Posteriormente, teníamos que leer la información que se encuentra en la tabla detalle_factura, y era el otro campo que debías de completar. Seguido, teníamos que leer también la información que estaba en la tabla libro. Por eso, dentro de las comillas debías colocar la palabra «libro», que era el nombre de la tabla. Una vez que leemos la información de estas dos tablas, lo siguiente era crear una nueva columna. En esta nueva columna, dentro del DataFrame detalle_ factura_df, colocábamos el nombre de la nueva columna, en este…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
-
-
(Bloqueado)
¿Qué es ETL?2 min 26 s
-
(Bloqueado)
Extracción de datos1 min 50 s
-
Extraer datos de una base de datos3 min 17 s
-
(Bloqueado)
Desafío: extracción de datos1 min 8 s
-
(Bloqueado)
Solución: extracción de datos2 min 13 s
-
(Bloqueado)
Transformando datos4 min 55 s
-
(Bloqueado)
Desafío: transformación de datos1 min 7 s
-
(Bloqueado)
Solución: transformación de datos2 min 54 s
-
(Bloqueado)
Carga de datos4 min 6 s
-
(Bloqueado)
Desafío: carga de datos1 min 16 s
-
(Bloqueado)
Solución: carga de datos2 min 30 s
-
(Bloqueado)
Ruta de aprendizaje de ingeniería de datos2 min 2 s
-
(Bloqueado)