КОГДА ВЫ МОЖЕТЕ ДЕЛАТЬ ОБЪЕДИНЕНИЕ МЕЖДУ
ЗАПРОСАМИ ?
Когда два ( или более ) запроса подвергаются объединению, их столбцы
вывода должны быть совместимы для объединения. Это означает, что каждый
запрос должен указывать одинаковое число столбцов и в том же порядке что и
первый, второй, третий, и так далее, и каждый должен иметь тип, совместимый
с каждым. Значение совместимости типов - меняется. ANSI следит за этим
очень строго и поэтому числовые пол должны иметь одинаковый числовой тип
и размер, хотя некоторые имена используемые ANSI для этих типов являются -
синонимами. ( Смотрите Приложение B для подробностей об ANSI числовых
типах. )
Кроме того, символьные поля должны иметь одинаковое число символов ( значение предназначенного номера, не обязательно такое же как используемый
номер ).
Хорошо, что некоторые SQL программы обладают большей гибкостью чем это
определяется ANSI. Типы не определенные ANSI, такие как DATA и BINARY,
обычно должны совпадать с другими столбцами такого же нестандартного типа.
Длина строки также может стать проблемой. Большинство программ разрешают
пол переменной длины, но они не обязательно будут использоваться с UNION.
С другой стороны, некоторые программы (и ANSI тоже) требуют чтобы символь-
ные поля были точно равной длины. В этих вопросах вы должны проконсультироваться с документацией вашей собственной программы.
Другое ограничение на совместимость - это когда пустые значения(NULL)
запрещены в любом столбце объединения, причем эти значения необходимо
запретить и для всех соответствующих столбцов в других запросах объединения.
Пустые значения(NULL) запрещены с ограничением NOT NULL, которое будет
обсуждаться в
UNION И УСТРАНЕНИЕ ДУБЛИКАТОВ
UNION будет автоматически исключать дубликаты строк из вывода.
Это нечто несвойственное для SQL, так как одиночные запросы обычно содер-
жат DISTINCT чтобы устранять дубликаты. Например запрос, чей вывод показывается в Рисунке 14.2,
SELECT snum, city
FROM Customers;
имеет двойную комбинацию значений ( snum=1001, city=London ), потому что
мы не указали, чтобы SQL устранил дубликаты. Однако, если мы используем
=============== SQL Execution Log ============
| |
| SELECT snum, city |
| FROM Customers; |
| ============================================= |
| snum city |
| ----- -------- |
| 1001 London |
| 1003 Rome |
| 1002 San Jose |
| 1002 Berlin |
| 1001 London |
| 1004 Rome |
| 1007 San Jose |
| |
=============================================
Рисунок 14.2: Одиночный запрос с дублированным выводом
UNION в комбинации этого запроса с ему подобным в таблице Продавцов,
то эта избыточная комбинация будет устранена.
Рисунок 14.3 показывает вывод следующего запроса.
SELECT snum, city
FROM Customers
UNION
SELECT snum, city
FROM Salespeople.;
=============== SQL Execution Log ============
| |
| FROM Customers |
| UNION |
| SELECT snum, sity |
| FROM Salespeople; |
| ============================================= |
| |
| ----- -------- |
| 1001 London |
| 1002 Berlin |
| 1007 San Jose |
| 1007 New York |
| 1003 Rome |
| 1001 London |
| 1003 Rome |
| 1002 Barcelona |
| 1007 San Jose |
| |
-----------------------------------------------
Рисунок 14.3: UNION устраняет двойной вывод
Вы можете получить нечто похожее ( в некоторых программах SQL, используя
UNION ALL вместо просто UNION, наподобие этого:
SELECT snum, city
FROM Customers
UNION ALL
SELECT snum, city
FROM Salespeople;
ИСПОЛЬЗОВАНИЕ СТРОК И ВЫРАЖЕНИЙ С UNION
Иногда, вы можете вставлять константы и выражения в предложении
SELECT используемые с UNION. Это не следует строго указаниям ANSI,
но это полезна и необычно используемая возможность. Константы и
выражения которые вы используете, должны встречать совместимые
стандарты которые мы выделяли ранее.
Эта свойство полезно, например, чтобы устанавливать комментарии указывающие какой запрос вывел данную строку.
Предположим что вы должны сделать отчет о том, какие продавцы производят наибольшие и наименьшие порядки по датам.
Мы можем объединить два запроса, вставив туда текст чтобы различать
вывод для каждого из них.
SELECT a.snum, sname, onum, 'Highest on', odate
FROM (Salespeople a, Orders b
WHERE a.snum = b.snum
AND b.amt =
( SELECT MAX (amt)
FROM Orders c
WHERE c.odate = b.odate )
UNION
SELECT a.snum, (sname, (onum ' Lowest on', odate
FROM ( Salespeople a, Orders b
WHERE a.snum = b.snum
AND b.amt =
( SELECT MIN (amt)
FROM Orders c
WHERE c.odate = b.odate );
Вывод из этой команды показывается в Рисунке 14.4.
Мы должны были добавить дополнительный пробел в строку 'Lowest on',
чтобы сделать ее совпадающей по длине со строкой 'Highest on'.
Обратите внимание что Peel выбран при наличии и самого высокого
и самого низкого ( фактически он единственный ) порядка на 5 Октября.
Так как вставляемые строки двух этих запросов различны, строки не
будут устранены как дубликаты.
=============== SQL Execution Log ============
| |
| AND b.amt = |
| ( SELECT min (amt) |
| FROM Orders c |
| WHERE c.odate = b.odate); |
| ============================================= |
| |
| ----- ------- ------ ---------- ----------- |
| 1001 Peel 3008 Highest on 10/05/1990 |
| 1001 Peel 3008 Lowest on 10/05/1990 |
| 1001 Peel 3011 Highest on 10/06/1990 |
| 1002 Serres 3005 Highest on 10/03/1990 |
| 1002 Serres 3007 Lowest on 10/04/1990 |
| 1002 Serres 3010 Lowest on 10/06/1990 |
| 1003 Axelrod 3009 Highest on 10/04/1990 |
| 1007 Rifkin 3001 Lowest on 10/03/1990 |
===============================================
Рисунок 14.4: Выбор наивысших и наинизших порядков, определяемых
с помощью строк
ИСПОЛЬЗОВАНИЕ UNION С ORDER BY
До сих пор, мы не оговаривали что данные многочисленных запросов будут
выводиться в каком то особом порядке. Мы просто показывали вывод сна-
чала из одного запроса а затем из другого. Конечно, вы не можете полагаться на вывод приходящий в произвольном порядке. Мы как раз сделаем
так чтобы этот способ для выполнения примеров был более простым. Вы
можете, использовать предложение ORDER BY чтобы упорядочить вывод
из объединения, точно так же как это делается в индивидуальных запросах.
Давайте пересмотрим наш последний пример чтобы упорядочить имена с
помощью их порядковых номеров. Это может внести противоречие, такое
как повторение имени Peel в последней команде, как вы сможете увидеть
из вывода показанного в Рисунке 14.5.
SELECT a.snum, sname, onum, 'Highest on', odate
FROM Salespeople a, Orders b
WHERE a.snum = b.snum
AND b.amt =
( SELECT MAX (amt)
FROM Orders c
WHERE c.odate = b.odate )
UNION
SELECT a.snum, (sname, (onum, 'Lowest on', odat
FROM Salespeople a, Orders b
WHEREa.snum = b.snum
AND b.amt =
( SELECT MIN (amt)
FROM Orders c
WHERE c.odate = b.odate )
ORDER BY 3;
=============== SQL Execution Log ============
| ( SELECT min (amt) |
| FROM Orders c |
| WHERE c.odate = b.odate) |
| ORDER BY 3; |
| ============================================= |
| |
| ----- ------- ------ ---------- ----------- |
| 1007 Rifkin 3001 Lowest on 10/03/1990 |
| 1002 Serres 3005 Highest on 10/03/1990 |
| 1002 Serres 3007 Lowest on 10/04/1990 |
| 1001 Peel 3008 Highest on 10/05/1990 |
| 1001 Peel 3008 Lowest on 10/05/1990 |
| 1003 Axelrod 3009 Highest on 10/04/1990 |
| 1002 Serres 3010 Lowest on 10/06/1990 |
| 1001 Peel 3011 Highest on 10/06/1990 |
===============================================
Рисунок 14.5: Формирование объединения с использованием ORDER BY
Пока ORDER BY используется по умолчанию, мы не должны его указывать. Мы
можем упорядочить наш вывод с помощью нескольких полей, одно внутри другого
и указать ASC или DESC для каждого, точно также как мы делали это для одиноч-
ных запросов. Заметьте, что номер 3 в предложении ORDER BY указывает какой
столбец из предложения SELECT будет упорядочен. Так как столбцы объединения -
это столбцы вывода, они не имеют имен, и следовательно, должны определяться
по номеру. Этот номер указывает на их место среди других столбцов вывода.
( Смотрите
ВНЕШНЕЕ ОБЪЕДИНЕНИЕ
Операция которая бывает часто полезна - это объединение из двух зап-
росов в котором второй запрос выбирает строки, исключенные первым.
Наиболее часто, вы будете делать это, так чтобы не исключать строки
которые не удовлетворили предикату при объединении таблиц. Это
называется - внешним объединением.
Предположим что некоторые из ваших заказчиков еще не были назначены к продавцам. Вы можете захотеть увидеть имена и города всех ваших
заказчиков, с именами их продавцов, не учитывая тех кто еще не был
назначен. Вы можете достичь этого, формируя объединение из двух зап-
росов, один из которых выполняет объединение, а другой выбирает заказ-
чиков с пустыми(NULL) значениями пол snum. Этот последний запрос
должен вставлять пробелы в пол соответствующие полю sname в первом
запросе.
Как и раньше, вы можете вставлять текстовые строки в ваш вывод чтобы
идентифицировать запрос который вывел данную строку.
Использование этой методики во внешнем объединении, дает возможность
использовать предикаты для классификации, а не для исключения.
Мы использовали пример нахождения продавцов с заказчиками размещенными в их городах и раньше. Однако вместо просто выбора только
этих строк, вы возможно захотите чтобы ваш вывод перечислял всех про-
давцов, и указывал тех, кто не имел заказчиков в их городах, и кто имел.
Следующий запрос, чей вывод показывается в Рисунке 14.6, выполнит это:
SELECT Salespeople.snum, sname, cname, comm
FROM (Salespeople, Customers
WHERE Salespeople.city = Customers.city.
UNION
SELECT snum, sname, ' NO MATCH ', comm
FROM (Salespeople
WHERE NOT city = ANY
( SELECT city
FROM Customers )
ORDER BY 2 DESC;
=============== SQL Execution Log ============
| |
| FROM Salespeople |
| WHERE NOT city = ANYate) |
| ( SELECT city |
| FROM Customers) |
| ORDER BY 2 DESC; |
| ============================================= |
| |
| ----- ------- --------- ------------ |
| 1002 Serres Cisneros 0.1300 |
| 1002 Serres Liu 0.1300 |
| 1007 Rifkin NO MATCH 0.1500 |
| 1001 Peel Clemens 0.1200 |
| 1001 Peel Hoffman 0.1200 |
| 1004 Motika Clemens 0.1100 |
| 1004 Motika Hoffman 0.1100 |
| 1003 Axelrod NO MATCH 0.1000 |
| |
===============================================
Рисунок 14. 6: Внешнее объединение
Строка ' NO MATCH ' была дополнена пробелами, чтобы получить совпадение поля cname по длине ( это не обязательно во всех реализациях SQL ).
Второй запрос выбирает даже те строки которые исключил первый.
Вы можете также добавить комментарий или выражение к вашему запросу,
в виде дополнительного поля. Если вы сделаете это, вы будете должны добавить некоторый дополнительный комментарий или выражение, в той же са-
мой позиции среди выбранных полей, для каждого запроса в операции объединения. Совместимость UNION предотвращает вас от добавления дополнительного поля для первого запроса, но не для второго. Имеется запрос который добавляет строки к выбранным полям, и указывает совпадает ли данный продавец с его заказчиком в его городе:
SELECT a.snum, sname, a.city, ' MATCHED '
FROM Salespeople a, Customers b
WHERE a.city = b.city
UNION
SELECT snum, sname, city, 'NO MATCH'
FROM Salespeople
WHERE NOT city = ANY
( SELECT city
FROM Customers )
ORDER BY 2 DESC;
Рисунок 14,7 показывает вывод этого запроса.
=============== SQL Execution Log ============
| |
| WHERE a.city = b.city |
| UNION |
| SELECT snum,sname,city, 'NO MATCH' |
| FROM Salespeople |
| WHERE NOT city = ANYate) |
| ( SELECT city |
| FROM Customers) |
| ORDER BY 2 DESC; |
| ============================================= |
| |
| ----- ------- ------------ --------- |
| 1002 Serres San Jose MATCHED |
| 1007 Rifkin Barselona NO MATCH |
| 1001 Peel London MATCHED |
| 1004 Motika London MATCHED |
| 1003 Axelrod New York NO MATCH |
| |
===============================================
Рисунок 14. 7: Внешнее объединение с полем комментария
Это не полное внешнее объединение, так как оно включает только несовпадающие поля одной из объединяемых таблиц. Полное внешнеее объединение должно включать всех заказчиков имеющих и не имеющих про-
давцов в их городах.
Такое условие будет более полным, как вы это сможете увидеть (вывод
следующего запроса показан на Рисунке 14,8 ) :
SELECT snum, city, 'SALESPERSON - MATCH'
FROM Salespeople
WHERE NOT city = ANY
(SELECT city
FROM Customers)
UNION
SELECT snum, city, 'SALESPERSON - NO MATCH'
FROM Salespeople
WHERE NOT city = ANY
(SELECT city
FROM Customers))
UNION
(SELECT cnum, city, 'CUSTOMER - MATCHED'
FROM Customers
WHERE city = ANY
(SELECT city
FROM Salespeople)
UNION
SELECT cnum, city, 'CUSTOMER - NO MATCH'
FROM Customers
WHERE NOT city = ANY
(SELECT city
FROM Salespeople))
ORDER BY 2 DESC;
=============== SQL Execution Log ===============
| |
| FROM Salespeople) |
| ORDER BY 2 DESC; |
| |
| ================================================ |
| |
| ---- -------- ------------------------ |
| 2003 San Jose CUSTOMER - MATCHED |
| 2008 San Jose CUSTOMER - MATCHED |
| 2002 Rome CUSTOMER - NO MATCH |
| 2007 Rome CUSTOMER - NO MATCH |
| 1003 New York SALESPERSON - MATCHED |
| 1003 New York SALESPERSON - NO MATCH |
| 2001 London CUSTOMER - MATCHED |
| 2006 London CUSTOMER - MATCHED |
| 2004 Berlin CUSTOMER - NO MATCH |
| 1007 Barcelona SALESPERSON - MATCHED |
| 1007 Barcelona SALESPERSON - NO MATCH |
| |
==================================================
Рисунок 1.8: Полное внешнее объединение
( Понятно, что эта формула использующая ANY - эквивалентна объединению в предыдущем примере. )
Сокращенное внешнее объединение с которого мы начинали, использует-
с чаще чем этот последний пример.
Этот пример, однако, имеет другой смысл. Всякий раз, когда вы выполняете объединение более чем двух запросов, вы можете использовать круг-
лые скобки чтобы определить порядок оценки. Другими словами, вместо
просто -
query X UNION query Y UNION query Z;
вы должны указать, или
( query X UNION query Y )UNION query Z;
или
query X UNION ( query Y UNION query Z );
Это потому, что UNION и UNION ALL могут быть скомбинированы, чтобы
удалять одни дубликаты, не удал других. Предложение -
( query X UNION ALL query Y )UNION query Z;
не обязательно воспроизведет те же результаты что предложение -
query X UNION ALL( query Y UNION query Z );
если двойные строки в нем, будут удалены.