Competencia: Desarrollo de software.
Asignatura: Introducción a los Sistemas de Base de Datos.
Lenguaje: SQL.
Programa: MySQL.
Descripción de la Actividad
Una de mis experiencias desarrolladas en el 1er año de Carrera en esta asignatura fue el crear informes con respecto a un manual llamado Heard First SQL que explica paso a paso como aprender el lenguaje de SQL, es este caso les hablaré del Capítulo 7: Diseñando múltiples tablas de base de datos.
Este informe debe explicar todo lo que contiene el Capítulo 7 con sus respectivos ejemplos y contenidos.
Solución
Teoría de la Naturalización.
El proceso de normalización es un estándar que consiste, básicamente, en un proceso de conversión de las relaciones entre las entidades, evitando:
- La redundancia de los datos: repetición de datos en un sistema.
- Anomalías de actualización: inconsistencias de los datos como resultado de datos redundantes y actualizaciones parciales.
- Anomalías de borrado: pérdidas no intencionadas de datos debido a que se han borrado otros datos.
- Anomalías de inserción: imposibilidad de adicionar datos en la base de datos debido a la ausencia de otros datos.
Se plantean una serie de problemas:
- Redundancia: cuando un autor tiene varios libros, se repite la nacionalidad.
- Anomalías de modificación: Si Ad.Mig. y Ma.Piat. desean cambiar de editor, se modifica en los 2 lugares. A prior no podemos saber cuántos autores tiene un libro. Los errores son frecuentes al olvidar la modificación de un autor. Se pretende modificar en un sólo sitio.
- Anomalías de inserción: Se desea dar de alta un autor sin libros, en un principio. NOMBRE y CODLIBRO son campos clave, una clave no puede tomar valores nulos.
Asegurando:
- Integridad entre los datos: consistencia de la información.
Definición de la clave
Antes de proceder a la normalización de la tabla lo primero que debemos de definir es una clave, esta clave deberá contener un valor único para cada registro (no podrán existir dos valores iguales en toda la tabla) y podrá estar formado por un único campo o por un grupo de campos.
En la tabla de alumnos de un centro de estudios no podemos definir como campo clave el nombre del alumno ya que pueden existir varios alumnos con el mismo nombre. Podríamos considerar la posibilidad de definir como clave los campos nombre y apellidos, pero estamos en la misma situación: podría darse el caso de alumnos que tuvieran los mismos apellidos y los mismos nombres (Juan Fernández Martín).
La solución en este caso es asignar un código de alumno a cada uno, un número que identifique al alumno y que estemos seguros que es único.
Una vez definida la clave podremos pasar a estudiar la primera forma normal.
Primera forma normal (1NF)
Se dice que una tabla se encuentra en primera forma normal (1NF) si y solo si cada uno de los campos contiene un único valor para un registro determinado. Supongamos que deseamos realizar una tabla para guardar los cursos que están realizando los alumnos de un determinado centro de estudios.
Una vez normalizada la tabla en 1NF, podemos pasar a la segunda forma normal.
Segunda forma normal (2NF)
La segunda forma normal compara todos y cada uno de los campos de la tabla con la clave definida. Si todos los campos dependen directamente de la clave se dice que la tabla está es segunda forma normal (2NF).
Tercera forma normal (3NF)
Se dice que una tabla está en tercera forma normal si y solo si los campos de la tabla dependen únicamente de la clave, dicho en otras palabras los campos de las tablas no dependen unos de otros.
Una vez conseguida la segunda forma normal, se puede estudiar la cuarta forma normal.
Cuarta forma normal (4NF)
Una tabla está en cuarta forma normal si y sólo si para cualquier combinación clave - campo no existen valores duplicados.
Ahora si tenemos nuestra base de datos en 4NF.
Otras formas normales
Existen otras dos formas normales, la llamada quinta forma normal (5FN) que no detallo por su dudoso valor práctico ya que conduce a una gran división de tablas y la forma normal dominio / clave (FNDLL) de la que no existe método alguno para su implantación.
Desarrollo
Supongamos que deseamos realizar una tabla para guardar los cursos que están realizando los alumnos de un determinado colegio, podríamos considerar el siguiente diseño:

Podemos observar que el registro de código 1 si cumple la primera forma normal, cada campo del registro contiene un único dato, pero no ocurre así con los registros 2 y 3 ya que en el campo cursos contiene más de un dato cada uno.
La solución en este caso es crear dos tablas del siguiente modo:

Como se puede comprobar ahora todos los registros de ambas tablas contienen valores únicos en sus, por lo tanto ambas tablas cumplen la primera forma normal.
Supongamos que construimos una tabla con los años que cada empleado ha estado trabajando en cada departamento de una empresa:
Tomando como punto de partida que la clave de esta tabla está formada por los campos código de empleado y código de departamento, podemos decir que la tabla se encuentra en primera forma normal.
Ahora veremos si cumple con la segunda forma Normal.
- El campo nombre no depende funcionalmente de toda la clave, sólo depende del código del empleado.
- El campo departamento no depende funcionalmente de toda la clave, sólo del código del departamento.
- El campo años si que depende funcionalmente de la clave ya que depende del código del empleado y del código del departamento (representa el número de años que cada empleado ha trabajado en cada departamento)
Podemos observar que ahora si se encuentran las tres tablas en segunda forma normal, considerando que la tabla A tiene como índice el campo Código Empleado, la tabla B Código Departamento y la tabla C una clave compuesta por los campos Código Empleado y Código Departamento.
Considerando el ejemplo anterior, supongamos que cada alumno sólo puede realizar un único curso a la vez y que deseamos guardar en que sala se imparte el curso.
Podemos plantear la siguiente estructura:
Viendo las dependencias de cada campo con respecto a la clave código:
- Nombre depende directamente del código del alumno.
- Curso depende de igual modo del código del alumno.
- La sala, aunque en parte también depende del alumno, está más ligado al curso que el alumno está realizando.
Revisando la 4NF veamos la siguiente tabla:
Comparemos ahora la clave Figura con el atributo Tamaño, podemos observar que Cuadrado Grande está repetido al igual que Círculo Azul, entre otras. Estas repeticiones son las que se deben evitar para tener una tabla en 4NF.
La solución seria la siguiente:

Ahora separando las tablas tenemos nuestra base de datos en 4NF.
Las claves Primarias y foráneas llevadas al desarrollo funcionaria así:
La tabla FACTURAS tiene ID_FACTURAS que es la clave primaria, única e irrepetible para cada factura, SUCURSAL (otro campo) y FECHA_VTA (otro campo).
En la siguiente tabla tenemos la clave foránea, que también es un indicador muy similar a la clave primaria:
En la siguiente tabla tenemos la clave foránea, que también es un indicador muy similar a la clave primaria:
ID_DETALLE_FACTURAS (IDDetalleFactura es la clave primaria, única e irrepetible para cada detalle de cada factura), ID_Factura (ID_Factura es ahora nuestra clave foránea ya que es la clave por la cual se relacionan ambas tablas) e ITEM (otro campo)
En resumen, las claves primarias y foráneas permiten relacionar tablas, cuando la clave se encuentra como índice único de la tabla se llama primaria, y cuando es la referencia y relación hacia otra tabla es la foránea.
Ahora, los atributos son las propiedades de una entidad. Están relacionados a la POO, Programación Orientada a Objetos, para definirlo en términos más comunes, son como características de cierto objeto.
Por ejemplo:
Objeto: Mesa
Atributos (propiedades):
Color: Cerezo
Material: Madera, etc.
Reflexión
Logramos aprender a conocer las ventajas de usar múltiples tablas con respecto a tablas de base de datos.
Debido a la eficiencia que nos brinda el usar multi-tablas no cabe duda que es la mejor opción a la hora de crear bases de datos inteligentes. A la hora de hacer consultas, ganaremos tiempo, mantendremos un orden en nuestra tabla de datos y además optimizaremos los espacios de memorias en nuestro servidor de base de datos.
Y así, si poseemos una gran base de datos podremos ahorrarnos varios problemas, ya mientras más grande nuestra tabla más complejas y menos manejables resultaran nuestras consultas. Debido a lo mismo podemos encontrarnos problemas de rendimiento o anomalías en nuestros datos.
Reflexión
Logramos aprender a conocer las ventajas de usar múltiples tablas con respecto a tablas de base de datos.
Debido a la eficiencia que nos brinda el usar multi-tablas no cabe duda que es la mejor opción a la hora de crear bases de datos inteligentes. A la hora de hacer consultas, ganaremos tiempo, mantendremos un orden en nuestra tabla de datos y además optimizaremos los espacios de memorias en nuestro servidor de base de datos.
Y así, si poseemos una gran base de datos podremos ahorrarnos varios problemas, ya mientras más grande nuestra tabla más complejas y menos manejables resultaran nuestras consultas. Debido a lo mismo podemos encontrarnos problemas de rendimiento o anomalías en nuestros datos.
No hay comentarios:
Publicar un comentario