SQL - script - clase 1
From Ibbddunq
(→Aliases = cambio de nombre + nombres de atributo vienen con tabla adelante) |
|||
Line 280: | Line 280: | ||
OJO que los atributos se llaman, en realidad, tabla.atributo, y así las puedo tratar en el SELECT. | OJO que los atributos se llaman, en realidad, tabla.atributo, y así las puedo tratar en el SELECT. | ||
- | Por lo tanto, si joineamos tablas que coinciden en los nombres de atributo, van a estar los dos. | + | Por lo tanto, si joineamos tablas que coinciden en los nombres de atributo, van a estar los dos. Esto No se cumple con un join natural. No jode porque es muy raro usar SELECT *, entonces pido los atributos que quiero. |
Y puedo desambiguar en la consulta poniendo el alias. | Y puedo desambiguar en la consulta poniendo el alias. | ||
Line 297: | Line 297: | ||
Más ejemplos: subir dos filas de la misma tabla en una consulta (p.ej. duración payasos y leones en una función). | Más ejemplos: subir dos filas de la misma tabla en una consulta (p.ej. duración payasos y leones en una función). | ||
- | |||
=== Constantes y funciones === | === Constantes y funciones === |
Revision as of 12:39, 25 September 2008
Contents |
Clase 1
Antes que nada, qué base vamos a usar
La del circo, que vamos a ir introduciendo de a poco. Los esquemas de tabla son
ciudad <nomCiudad, provincia, poblacion> funcion <diaFn, horaFn, nomCiudad, precioEntrada, publicoEsperado> acto <nomActo, gradoPel, dmin, dmax> (duraciones mínima y máxima de cada acto) formaParte <diaFn, horaFn, nomActo, nroOrden, duracion> artista <nomArt, fnac, cachet, nomArt-maestro, gradoMaxPel> fnac = fecha de nacimiento, gradoMaxPel = grado máximo de peligrosidad que soporta, "aguante") puedeParticipar <nomActo, nomArt, destreza> actoPublicitario <diaPubl, nomCiudad, hora, contacto> (la PK son los primeros dos)
Intro
Hoy vamos a ver el lenguaje con el que vamos a hablar con una instancia de BD relacional que maneja un SGBD. Ese lenguaje se llama SQL, y cubre todas las operaciones que uno puede tener ganas de hacer con una base. ¿Qué operaciones? Eso lo vamos a ir viendo.
En particular, una operación muy importante es la consulta, nosotros ya sabemos expresar consultas a una BD relacional, lo hacemos con las operaciones del álgebra relacional. El SQL tiene la misma idea del AR, vamos a ver cómo. A lo que vamos a dedicar más tiempo es a aprender a hacer consultas en SQL.
Meternos en el entorno de interacción con una BD relacional
Ahora vamos a trabajar con una BD relacional, les vamos a dar una instancia a c/u para jugar, y un programa para accederla. Vamos a empezar practicando con un modelo relacional del circo.
Imaginarnos cómo va a ser: yo me conecto a la instancia, que es nuevita para mí.
¿Qué es lo primero que tenemos que hacer? Claro, crear las tablas. Eso lo vamos a hacer con un formulario que nos presenta, ahí indicamos el esquema, el nombre, y nos crea en la instancia donde estemos trabajando una nueva tabla cuyo esquema es el que le dijimos.
¿Qué datos necesitamos decir? (esto interactivo, así van despertando).
- El nombre de la tabla nueva.
- Atributos, para cada uno dominio.
- Cuál/es de los atributos conforman la PK.
- Qué FKs a otras tablas hay.
- Otras restricciones, p.ej. not null.
Tambíén podemos crear tablas con SQL (i.e. expresar en el lenguaje la creación de una tabla, indicando todos los datos que dijimos), en las máquinas vamos a ver cómo.
Entonces, paso 1: crear las tablas.
Ejemplo: creamos las tablas funcion y ciudad (ahi anotamos los esquemas).
Repaso de INSERT / UPDATE / DELETE
OK, tengo las tablas creadas cada una con el esquema que dijimos, pero ¿cómo están? Claro, vacías.
Ya vimos (sí lo vimos en la clase de modelo relacional) la sintaxis de INSERT / UPDATE / DELETE, repasémosla.
(sí, que la lean de su carpeta)
INSERT INTO tabla(atr1,...,atrn) VALUES (val1,...,valn) UPDATE tabla SET atr=val, atr=val, ... WHERE condicion DELETE FROM tabla WHERE condicion
Esto lo vamos a practicar el lunes (hoy sólo contarlo rápido)
Hacemos en pizarrón un par de INSERT sobre ciudad y uno sobre funcion, más tal vez un par de UPDATE, para cerrar la idea.
INSERT INTO ciudad (nomCiudad, provincia, poblacion) VALUES ('Rosario', 'Santa Fe', 1200000), ('Rafaela', 'Santa Fe', 130000), ('San Francisco', 'Cordoba', 78000);
(una ciudad más) INSERT INTO ciudad (nomCiudad, provincia, poblacion) VALUES ('Pehuajo', 'Buenos Aires', 53000);
INSERT INTO funcion (diaFn, horaFn, nomCiudad, precioEntrada, publicoEsperado) VALUES (20080601, 19, 'San Francisco', 18, 320);
UPDATE ciudad SET poblacion = 150000 WHERE nomCiudad = 'Rafaela'
... aumentar dos pesos el precio de entrada para las funciones cuyo público esperado no llegue a las 300 personas y cuyo precio de entrada no supere 15 pesos (para ver un UPDATE masivo).
Acá vemos varias cosas
- Formato de los String
- Formato de las fechas (hay otros, este tiene de bueno que no se pone ni comilla ni barra ni nada)
- la sentencia SQL termina en punto y coma.
- que se pueden insertar varias filas de una.
Pregunta, ¿qué pasa si hago un INSERT sobre función poniendo una ciudad que no existe, o para la misma fecha-hora que una que ya está?
ponele ...
INSERT INTO funcion (diaFn, horaFn, nomCiudad, precioEntrada, publicoEsperado) VALUES (20080615, 19, 'Pepelandia', 18, 320); y 'Pepelandia' no es una ciudad
Claro, salta la restricción de integridad correspondiente. Eso lo podemos probar el lunes.
Se puede hacer que digan un INSERT que viole clave, y un UPDATE que haría saltar una restricción, para practicar la sintaxis.
Introducción al SELECT
Una vez que hicimos unos cuantos INSERT válidos, tenemos una base con tablas que tienen filas, que no están vacías.
Ahora queremos obtener información haciendo búsquedas sobre esta instancia de BD. Ya sabemos una forma de expresar qué queremos: AR.
El concepto análogo al álgebra relacional en SQL es una operación que se llama SELECT, que tiene un montón de opciones que cubren la mayor parte del AR y más cosas. Una cosa importante es que al igual que en el AR, todo SELECT de SQL devuelve una tabla, y vamos a pensar al igual que con AR qué atributos tiene (a nivel de esquema) y qué filas tiene (a nivel de instancia) el resultado de un SELECT.
Vamos a empezar con algo sencillo: proyección y selección sobre una tabla.
La sintaxis básica del SELECT es
SELECT atr1,...,atrn FROM tabla WHERE condicion ORDER BY criterio de ordenamiento
La parte SELECT ... FROM ... WHERE ... la podemos escribir en AR así
P<atr1,...,atrn>(S<cond> tabla)
Con el ORDER BY vemos una característica de los SGBD distinta a la teoría del modelo relacional: las tablas están ordenadas,
una tabla es una secuencia de filas, no un conjunto de filas
Las tablas que forman la instancia de BD se ordenan (en ppio) con un criterio físico que no viene al caso. Lo que sí puedo hacer es ordenar el resultado de una consulta, para eso el ORDER BY.
Ejemplos usando ciudad, funcion y formaParte (anotamos los esquemas de acto y formaParte):
En el medio de los ejemplos, ver otra diferencia: en SQL las tablas que son resultado de un SELECT sí pueden tener filas iguales, es como que se les relajara la restricción de clave. Si quiero que el resultado de un SELECT no tenga duplicado, tengo que poner
SELECT DISTINCT atr1, ..., atrn ... el resto igual ...
- nombre y población de las ciudades de la prov. de Santa Fe, ordenados por ciudad.
- variaciones: ciudades de Santa Fe y Córdoba (en la misma consulta), ciudades de Santa Fe con al menos 100000 habitantes, ordenar por población (¿cuál queda primero? debatir), ordenar por población de mayor a menor.
- funciones ordenadas por día/hora, acá ver
SELECT *
- provincias, sirve para ver duplicados y SELECT DISTINCT
- nombre y duración de los actos que se presentan en la función del 01/06/2008, en el orden en el que van en la función, acá se aprecia el ORDER BY.
- nombre de las ciudades donde va a haber funciones donde se esperan más de 300 personas
- día, hora, ciudad, ingreso estimado (precio * público) de las funciones de junio de 2008. Esto para que se vea un atributo calculado.
- variación: donde se esperan más de 300 personas y el precio de la entrada es más de 15 pesos.
- nombres de las ciudades donde se va a presentar el circo en junio de 2008. Este engancha con el primer ejemplo de la ronda siguiente, así que dejalo solito en el pizarrón ;-).
Joins
Join natural
Volvemos a la sintaxis básica
SELECT atr1,...,atrn FROM tabla WHERE condicion ORDER BY criterio de ordenamiento
ahora quiero joinear dos tablas; ponele, quiero día, hora, ciudad y provincia de cada función de abril, entonces (que lo digan ellos) tengo que joinear ciudad con funcion mediante natural join.
¿En qué lugar de la sentencia SELECT pondrían el join ...? Usen su intuición (los que no saben SQL, claro)
Bien, va dentro del FROM, la tabla
del FROM puede ser el resultado de una operación (¿de un SELECT también? pero claro que sí, eso lo vamos a ver en detalle la clase que viene).
Para joinear dos tablas mediante join natural ... tabla 1 NATURAL JOIN tabla2. Por costumbre se escribe así
SELECT atr1,...,atrn FROM tabla1 NATURAL JOIN tabla2 WHERE condicion ORDER BY criterio de ordenamiento
Acá otra ronda de ejemplos
- nombre de ciudad y provincia donde se va a presentar el circo en junio de 2008. Este engancha con el último de la ronda anterior.
- actos que se van a dar en junio.
- día, hora, ciudad y público esperado de las funciones donde va a haber payasos.
¿Y si quiero joinear varias tablas? Ponele las provincias donde se van a presentar payasos en junio de 2008. En AR (que lo piensen) tengo que hacer
(S<acto = 'payasos'>formaParte) * (S<fecha en junio 2008>funcion) * ciudad
que es lo mismo que
S<acto = 'payasos'>formaParte AND fecha en junio 2008>(formaParte * funcion * ciudad)
en SQL lo vamos a escribir en principio de la forma de abajo, con todos los select afuera; los motores se avivan de lo que en AR hacíamos a mano de meter las selecciones para adentro.
La sintaxis para joinear varias tablas nos queda
SELECT atr1,...,atrn FROM tabla1 NATURAL JOIN tabla2 NATURAL JOIN tabla3 WHERE condicion ORDER BY criterio de ordenamiento
Hacer el ejemplo.
Acá detenerse un poco. Un SELECT de SQL como los que vimos equivale en resultado a hacer esto en "AR extendido" (extendido por el ordenamiento)
O<crit>(P<atrs>(S<condiciones>(join de tablas)))
Eso no quiere decir que el SGBD lo vaya a hacer así, muchas veces se aviva de mandar los select para adentro para que el join no se haga entre tablas tan grandes.
Sí debemos recordar que cuando hacemos join natural, mira todos los atributos que coinciden en nombre, entonces a veces hay que tener cuidado con eso.
Más ejemplos
- provincias donde va a haber actos muy peligrosos (grado de peligrosidad > 5)
- nombre, duración minima y duración máxima de los actos que se van a presentar en Santa Fe o Córdoba (en al menos una de las dos provincias) en junio de 2008.
(nota al margen: si pido "que se presenten en Santa Fe y en Córdoba se pone más espeso, lo más directo que se me ocurre es con subselect, tal vez sea un lindo ejemplo para introducir subselect).
- artistas que pueden participar en al menos un acto que se va a presentar en Santa Fe o Córdoba (en al menos una de las dos provincias) en junio de 2008.
- Artistas y actos en los que pueden participar, que son más peligroso que el aguante que declara el artista.
- <día, hora, nro orden, acto, artista posible> para las funciones que se van a hacer en Amstrong, ordenados x día, hora y nro de orden.
Otros joins
También puedo hacer las otras versiones de JOIN
Para join con condición ("moñito")
FROM tabla1 JOIN tabla2 ON condicion
Para producto cartesiano
FROM tabla1 JOIN tabla2
Ejemplos:
- Combinaciones de artistas con actos
- Todos
- Los que le da el aguante al artista
- Aguante y además cachet artista <= 300 * peligrosidad del acto
- Funciones con actos
- todos
- actos de peligrosidad <= precio de la entrada / 5 (o sea, por 15 pesos, sólo presento actos de peligrosidad <= 3, si quieren heavy que paguen :P).
Agrupamiento de joins
Cuando ponemos
FROM tabla1 NATURAL JOIN tabla2 NATURAL JOIN tabla3
o cualquier combinación de sabores de join, el agrupamiento es a izquierda, o sea, lo anterior se lee así
FROM (tabla1 NATURAL JOIN tabla2) NATURAL JOIN tabla3
en la mayor parte de los casos no va a influir, en algunos sí. Si quiero forzar que agrupe distinto, como (tabla1 JOIN tabla2) es una tabla, lo puedo hacer así
FROM tabla1 NATURAL JOIN (tabla2 NATURAL JOIN tabla3)
Ejemplo:
- para los actos de la función del 01/06/2008 a las 19, acto, dmin, dmax, duración real, nro orden, artista que podría hacerlo con criterio aguante, es (formaParte * acto) join-moñito artista, o artista join-moñito (formaParte * acto).
- para las funciones de la prov Sta Fe, los actos que podrían ir con criterio peligrosidad <= precio de la entrada / 5.
Lo que no puede pasar es que cuando hago una consulta no poner el SELECT, si pongo p.ej.
tabla1 NATURAL JOIN tabla2
así solito, y le mando la sentencia al SGBD, me va a tirar un error.
Siempre la sentencia completa tiene que ser
SELECT ... FROM ... [WHERE ...] [ORDER BY ...]
WHERE y ORDER BY pueden faltar, SELECT y FROM no. Si no pongo WHERE, es como no poner selección.
P.ej. si quiero ver toda la tabla acto, ¿cómo hago? ... contar el SELECT * que quiere decir "sin proyección". Sí, ya lo usamos, refrescarlo.
Momento Rexona
Creo que acá viene bien un repaso con un par más de ejemplos antes de seguir
Chiches
Aliases = cambio de nombre + nombres de atributo vienen con tabla adelante
OJO que los atributos se llaman, en realidad, tabla.atributo, y así las puedo tratar en el SELECT. Por lo tanto, si joineamos tablas que coinciden en los nombres de atributo, van a estar los dos. Esto No se cumple con un join natural. No jode porque es muy raro usar SELECT *, entonces pido los atributos que quiero. Y puedo desambiguar en la consulta poniendo el alias.
Probar en una consulta que tenga actos y ciudades, c/u con el nombre, si les pusiera "nombre" a los dos, y ponele que a funcion tb en lugar de ciudad_nombre le pongo nombre.
Claro, OJO ahí que el join natural no ve los nombres de tabla, entonces me va a tomar los nombres para joinear. Para evitar eso, por ahora pasamos a "join moñito" o sea JOIN tabla ON condicion. P.ej.
SELECT acto.nombre, ciudad.nombre FROM formaParte fp NATURAL JOIN acto JOIN funcion ON fp.fn_dia = acto.fn_dia AND funcion.fn_hora = funcion.fn_hora JOIN ciudad ON funcion.nombre = ciudad.nombre
el resultado de este SELECT tiene: acto.nombre, ciudad.nombre y funcion.nombre, tres atributos distintos.
Aliases: ver que es más práctico el cambio de nombre en SQL que en AR.
Más ejemplos: subir dos filas de la misma tabla en una consulta (p.ej. duración payasos y leones en una función).
Constantes y funciones
Cada atributo de la lista del SELECT ... puede ser una cuenta (p.ej. atr1 + atr2), o también una cte (p.ej. 'A').
Union
Contar la sintaxis.
Ver que lo que estamos haciendo es
[O (P (S ( joins ) ) ) ] U [O (P (S ( joins ) ) ) ]
Entonces, en particular, ¿cómo queda ordenado un UNION? Claro, no lo decimos, porque no tenemos un ORDER BY afuera. Entonces el resultado del UNION tiene que ser la "tabla" de otro SELECT, de esta forma
SELECT * FROM ( (SELECT ... FROM ... WHERE ...) UNION (SELECT ... FROM ... WHERE ...) ) ORDER BY ...
analizarlo con un ejemplo, p.ej. funciones y acciones publicitarias en abril, ordenadas x fecha.