ОДНО ИМЯ ДЛЯ КАЖДОГО
Если вы планируете иметь таблицу Заказчиков используемую большим
числом пользователей, лучше всего что бы они ссылались к ней с помощью одного и того же имени. Это даст вам возможность, например, использовать это им в вашем внутреннем общении без ограничений.
Чтобы создать единое им для всех пользователей, вы создаете общий
синоним. Например, если все пользователи будут вызывать таблицу
Заказчиков с именем Customers, вы можете ввести
CREATE PUBLIC SYNONYM Customers FOR Customers;
Мы пронимаем, что таблица Заказчиков это ваша собственность, поэтому
никакого префикса имени пользователя в этой команды не указывается.
В основном, общие синонимы создаются владельцами объектов или привилегированными пользователями, типа DBA. Пользователям кроме того,
должны еще быть предоставлены привилегии в таблице Заказчиков что-
бы они могли иметь к ней доступ. Даже если им является общим, сама
таблица общей не является. Общие синонимы становятся собственными
с помощью команды PUBLIC, а не с помощью их создателей.
КАК БАЗА ДАННЫХ РАСПРЕДЕЛЕНА ДЛЯ
ПОЛЬЗОВАТЕЛЕЙ ?
Таблицы и другие объекты данных сохраняются в базе данных и находятся там связанными с определенными пользователями которые ими владеют. В некотором смысле, вы могли бы сказать, что они сохраняются
в " именной области пользователя ", хотя это никак не отражает их физического расположения, но зато, как и большинство вещей в SQL, находятся в строгой логической конструкции. Однако, на самом деле, объекты данных сохраняться, в физическом смысле, и количество памяти
которое может использоваться определенным объектом или пользователем, в данное врем, имеют свой предел.
В конце концов, никакой компьютер не имеет прямого доступа к бесконечному числу аппаратных средств ( диску, ленте, или внутренней памяти) для хранения данных. Кроме того, эффективность SQL расширится если логическая структура данных будет отображаться неким физическим
способом при котором эти команды получать преимущество.
В больших SQL системах, база данных будет разделена на области, так
называемые Области Базы Данных или Разделы.
Это области сохраняемой информации, которые размещены так, чтобы
информация внутри них находилась близко друг к другу для выполнения
команд; то есть программа не должна искать где-то далеко информацию,
сгруппированную в одиночной области базы данных. Хотя ее физические
возможности зависят от аппаратного оборудования, целесообразно чтобы
команда работала в этих областях внутри самой SQL.
Системы которые используют области базы данных ( в дальнейшем называемых - DBS (Data Base Spaces)), позволяют вам с помощью команд
SQL обрабатывать эти области как объекты.
DBS создаются командами CREATE DBSPACE (СОЗДАТЬ DBS),
ACQUIRE DBSPACE(ПОЛУЧИТЬ DBS) или CREATE TABLE-
SPACE (СОЗДАТЬ ТАБЛИЧНУЮ ОБЛАСТЬ), в зависимости от используемой реализации. Одна DBS может вмещать любое число пользователей, и отдельный пользователь может иметь доступ к многим DBS. Привилегия создавать таблицы, хотя и может быть передана по всей базу данных,
часто передается в конкретной DBS.
Мы можем создать DBS с именем Sampletables, следующей командой:
CREATE DBSPACE Sampletables
( pctindex 10,
pctfree 25);
Параметр pctindex определяет какой процент DBS должен быть оставлен,
чтобы сохранять в нем индексы таблиц. Pctfree - это процент DBS который
оставлен чтобы позволить таблицам расширять размеры их строк ( ALTER
TABLE может добавлять столбцы или увеличивать размер столбцов, дела
каждую строку длиннее. Это - расширение памяти отводимой для этого).
Имеются также другие параметры которые вы также можете определять,
и которые меняются от программы к программе. Большинство программ
автоматически будут обеспечивать значения по умолчанию, поэтому вы
можете создавать DBS не определяя эти параметры.
DBS может иметь или определенное ограничение размера, или ей может
быть позволено расти неограниченно вместе с таблицами.
Если DBS создалась, пользователям предоставляются права создавать в
ней объекты. Вы можете например предоставить Diane право создать таблицу Sampletables с помощью следующей команды:
GRANT RESOURCE ON Sampletables TO Diane;
Это даст вам возможность более конкретно определять место хранени
данных. Первый DBS назначаемый данному пользователю - обычно тот,
где все объекты этого пользователя создаются по умолчанию.
Пользователи имеющие доступ к многочисленным DBS могут определить,
где они хотят разместить определенный объект.
При разделении вашей базы данных на DBSы, вы должны иметь в виду
типы операций, которые вы будете часто выполнять. Таблицы которые,
как вам уже известно, будут часто объединяться, или которые имеют
одну таблицу ссылающуюся на другую во внешнем ключе, должны находиться вместе в одной DBS.
Например, вы могли бы сообщить при назначении типовых таблиц, что
таблица Порядков будет часто объединяться с одной или обеими из двух
других таблиц,, так как таблица Порядков использует значения из обеих
этих таблиц. При прочих равных условиях, эти три таблицы должны входить в ту же самую область DBS, независимо от того, кто их владелец.
Возможное присутствие ограничения внешнего ключа в таблице Порядков, просто приведет к более строгому совместному использованию области DBS.
КОГДА СДЕЛАННЫЕ ИЗМЕНЕНИЯ СТАНОВЯТСЯ
ПОСТОЯННЫМИ ?
Визуально, среда базы данных, это картина которая постоянно отображает
для существующих пользователей, постоянно вводимые и изменяемые данные, допуская, что если система правильно разработана, она будет функционировать без сбоев. Однако реально, благодаря человеческим или компьютерным сбоям, ошибки время от времени случаются, и поэтому хорошие компьютерные программы стали применять способы отмены действий вызвавших такие ошибки.
Команда SQL, которая воздействует на содержание или структуру базы
данных - например команда модификации DML или команда DROP TABLE,
- не обязательно будет необратимой. Вы можете определить после окончания ее действия, останутся ли изменения сделанные данной командой или
группой команд постоянными в базы данных, или они будут полностью
проигнорированы. С этой целью, команды обрабатываются группами, называемыми - транзакциями.
Транзакция начинается всякий раз, когда вы начинаете сеанс с SQL. Все
команды которые вы введете будут частью этой транзакции, пока вы не за-
вершите их вводом команды COMMIT WORK или команды ROLLBACK
WORK. COMMIT может сделать все изменения постоянными с помощью
транзакции, а ROLLBACK может откатить их обратно или отменить. Новая
транзакция начинается после каждой команды COMMIT или ROLLBACK.
Этот процесс известен как диалоговая обработка запросов или транзакция.
Синтаксис, чтобы оставить все ваши изменения постоянными во время регистрации, или во время последнего COMMIT или ROLLBACK
Синтаксис отмены изменения -
В большинстве реализаций, вы можете установить параметр, называемый
AUTOCOMMIT. Он будет автоматически запоминать все действия которые будут выполняться. Действия которые приведут к ошибке, всегда будут
автоматически "прокручены" обратно. Если это предусмотрено в вашей системе, для фиксации всех ваших действий, вы можете использовать эту
возможность с помощью команды типа:
Вы можете вернуться к обычной диалоговой обработке запросов с помощью такой команды:
Имеется возможность установки AUTOCOMMIT которую система выполнит
автоматически при регистрации.
Если сеанс пользователя завершается аварийно - например, произошел сбой
системы или выполнена перезагрузка пользователя, - то текущая транзакция
выполнит автоматический откат изменений. Это - одна из причин, по которой
вы можете управлять выполнением вашей диалоговой обработки запросов,
разделив ваши команды на большое количество различных транзакций. Одиночная транзакция не должна содержать много несвязанных команд; фактически, она может состоять из единственной команды.
Транзакции которые включают всю группу несвязанных изменений не оставляют вам фактически никакого выбора сохранить или отклонить целую
группу, если вы хотите отменить только одно определенное изменение.
Хорошим правилом которому надо следовать, это делать ваши транзакции
состоящими из одной команды или нескольких близко связанных команд.
Например, предположим вы хотите удалить продавца Motika из базы данных. Прежде, чем вы удалите его из таблицы Продавцов, вы сначала должны сделать что-нибудь с его порядками и его заказчиками. ( Если используются ограничения внешнего ключа, и ваша система, следу ANSI, ограничивает изменение родительского ключа, у вас не будет выбора делать
или не делать этого. Это будет сделано обязательно.)
Одно из логических решений, будет состоять в том, чтобы установить поле
snum в его порядках в NULL, в следствии чего ни один продавец не получит
комиссионные в этих порядках, пока комиссионные не будут предоставлены
заказчикам для Peel. Затем вы можете удалить их из таблицы Продавцов:
UPDATE Orders
SET snum = NULL
WHERE snum = 1004;
UPDATE Cudomers
SET snum = 1001
WHERE snum = 1004;
DELETE FROM Salespeople
WHERE snum = 1004;
Если у вас проблема с удалением Motika ( возможно имеется другой
внешний ключ ссылающийся на него о котором вы не знали и не учитывали ), вы могли бы отменить все изменения которые вы сделали, до тех
пор пока проблема не будет определена и решена.
Более того, это должна быть группа команд, чтобы обрабатывать ее как
одиночную транзакцию. Вы можете предусмотреть это с помощью команды COMMIT, и завершить ее с помощью команды COMMIT или
ROLLBACK.
КАК SQL ОБЩАЕТСЯ СРАЗУ СО МНОГИМИ
ПОЛЬЗОВАТЕЛЯМИ
SQL часто используется в многопользовательских средах - в средах, где
сразу много пользователей могут выполнять действия в базе данных одновременно. Это создает потенциальную возможность конфликта между
различными выполняемыми действиями. Например, предположим что вы
выполняете команду в таблице Продавцов :
UPDATE Salespeople
SET comm = comm * 2
WHERE sname LIKE 'R%';
и в это же врем, Diane вводит такой запрос:
SELECT city, AVG (comm)
FROM Salespeople
GROUP BY city;
Может ли усредненное значение(AVG) Diane отразить изменения которые вы
делаете в таблице? Не важно, будет это сделано или нет, а важно что бы бы-
ли отражены или все или ни одно из значений комиссионных (comm) для
которых выполнялись изменения. Любой промежуточный результат является случайным или непредсказуемым, для порядка в котором значения бы-
ли изменены физически. Вывод запроса, не должен быть случайным и непредсказуемым.
Посмотрим на это с другой стороны. Предположим, что вы находите ошибку и прокручиваете обратно все ваши модификации уже после того, как
Diane получила их результаты в виде вывода. В этом случае Diane получит
ряд усредненных значений основанных на тех изменениях которые были
позже отменены, не зная что ее информации неточна.
Обработка одновременных транзакций называется - параллелизмом или сов-
падением, и имеет номера возможных проблем которые могут при этом возникать. Имеются следующие примеры:
* Модификация может быть сделана без учета другой
модификации. Например, продавец должен сделать запрос к таблице инвентаризации, чтобы найти десять фрагментов пунктов торговцев акциями, и упорядочить шесть из их для заказчика. Прежде, чем
это изменение было сделано, другой продавец делает запрос к таблице и упорядочивает семь из тех же фрагментов для своего заказчика.
ПРИМЕЧАНИЕ: Термин "упорядочить",
аналогичен общепринятому - "заказать",
что в принципе более соответствует логике
запроса, потому что с точки зрения
пользователя, он именно "заказывает"
информацию в базе данных, которая
упорядочивает эту информацию в
соответствии с "заказом".
* Изменения в базе данных могут быть прокручены обратно
уже после того, как их действия уже были закончены.
Например если Вы отменили вашу ошибку уже после того, как Diane
получила свой вывод.
* Одно действие может воздействовать частично на результат другого действия. Например когда Diane получает среднее от
значений в то врем как вы выполняете модификацию этих значений.
Хотя это не всегда проблематично, в большинстве случаев действие
такое же как если бы агрегаты должны были отразить состояние базы
данных в пункте относительной стабильности. Например в ревизионных книгах, должна быть возможность вернуться назад и найти это
существующее усредненное значение для Diane в некоторой времен-
ной точке, и оставить его без изменений которые можно было бы сделаны начиная уже с этого места. Это будет невозможно сделать, если
модификация была выполнена во время вычисления функции.
* Тупик. Два пользователя могут попытаться выполнить действия которые конфликтуют друг с другом. Например, если два
пользователя попробуют изменить и значение внешнего ключа и значение родительского ключа одновременно.
Имеется много сложнейших сценариев которые нужно было бы последовательно просматривать, если бы одновременные транзакции были неуправляемыми. К счастью, SQL обеспечивает вас средством управления
параллелизмом для точного указания места получения результата. Что
ANSI указывает для управления параллелизмом - это что все одновременные команды будут выполняться по принципу - ни одна команда не должна быть выдана, пока предыдущая не будет завершена (включая команды COMMIT или ROLLBACK ).
Более точно, нужно просто не позволить таблице быть доступной более
чем для одной транзакции в данный момент времени. Однако в большинстве ситуаций, необходимость иметь базу данных доступную сразу многим
пользователям, приводит к некоторому компромиссу в управлении параллелизмом. Некоторые реализации SQL предлагают пользователям выбор,
позволяя им самим находить золотую середину между согласованностью
данных и доступностью к базе данных. Этот выбор доступен пользователю,
DBA, или тому и другому.
На самом деле они осуществляют это управление вне SQL, даже если и
воздействуют на процесс работы самой SQL.
Механизм используемый SQL для управления параллелизмом операций,
называется - блокировкой. Блокировки задерживают определенные операции в базе данных, пока другие операции или транзакции не завершены.
Задержанные операции выстраиваются в очередь и выполняются только
когда блокировка снята ( некоторые инструменты блокировок дают вам возможность указывать NOWAIT, которая будет отклонять команду вместо
того чтобы поставить ее в очередь, позволяя вам делать что-нибудь другое).
Блокировки в многопользовательских системах необходимы. Следователь-
но, должен быть некий тип схемы блокировки по умолчанию, который мог
бы применяться ко всем командам в базе данных. Такая схема по умолчанию,
может быть определена для всей базы данных, или в качестве параметра в
команде CREATE DBSPACE или команде ALTER DBSPACE, и таким
образом использовать их по разному в различных DBS.
Кроме того, системы обычно обеспечиваются неким типом обнаружителя
зависания, который может обнаруживать ситуации, где две операции имеют блокировки, блокирующие друг друга. В этом случае, одна из команд
будет прокручена обратно и получит сброс блокировки.
Так как терминология и специфика схем блокировок меняются от программы к программе, мы можем смоделировать наши рассуждения на примере
программы базы данных DB2 фирмы IBM. IBM - лидер в этой области
(как впрочем и во многих других ), и поэтому такой подход наиболее удобен. С другой стороны, некоторые реализации могут иметь значительные
различи в синтаксисе и в функциях, но в основном их действия должно
быть очень похожими.
ТИПЫ БЛОКИРОВОК
Имеется два базовых типа блокировок:
- распределяемые блокировки и
- специальные блокировки.
Распределяемые ( или S-блокировки ) могут быть установлены более чем
одним пользователем в данный момент времени. Это дает возможность любому числу пользователей обращаться к данным, но не изменять их.
Специальные блокировки ( или X-блокировки ) не позволяют никому вообще, кроме владельца этой блокировки обращаться к данным.
Специальные блокировки используются для команд которые изменяют содержание или структуру таблицы. Они действуют до конца транзакции.
Общие блокировки используются для запросов. Насколько они продолжительны зависит фактически от уровня изоляции.
Что такое уровень изоляции блокировки? Это - то, что определяет, сколь-
ко таблиц будет блокировано.
В DB2, имеется три уровня изоляции, два из которых можно применить и
к распределенным и к специальным блокировкам, а третий, ограниченный,
чтобы использовать эти блокировки совместно. Они управляются команда-
ми поданными извне SQL, так что мы можем обсуждать не указывая их
точного синтаксиса. Точный синтаксис команд связанных с блокировками
- различен для различных реализаций.
Следующее обсуждение полезно прежде всего на концептуальном уровне.
Уровень изоляции - повторное чтение - гарантирует, что внутри данной
транзакции, все записи извлеченные с помощью запросов, не могут быть
изменены. Поскольку записи модифицируемые в транзакции являются
субъектами специальной блокировки, пока транзакция не завершена, они
не могут быть изменены в любом случае.
С другой стороны для запросов, повторное чтение означает, что вы можете решить заранее, какие строки вы хотите заблокировать и выполнить
запрос который их выберет. Выполняя запроса, вы гарантированы, что
никакие изменения не будут сделаны в этих строках, до тех пор пока вы
не завершите текущую транзакцию.
В то время как повторное чтение защищает пользователя, который поместил блокировку, она может в то же время значительно снизить производительность.
Уровень указатель стабильности - предохраняет каждую запись от изменений, на время когда она читается или от чтения на врем ее изменения.
Последний случай это специальна блокировка, и применяется пока изменение не завершено или пока оно не отменено( т.е. на время отката изменения ).
Следовательно, когда вы модифицируете группу записей использующих
указатель стабильности, эти записи будут заблокированы пока транзакция
не закончится, что аналогично действию производимому уровнем повторное чтение. Различие между этими двум уровнями в их воздействии на
запросы. В случае уровня указатель стабильности, строки таблицы которые в данное время не используются запросом, могут быть изменены.
Третий уровень изоляции DB2 - это уровень только чтение.
Только чтение фиксирует фрагмент данных; хотя на самом деле он блокирует всю таблицу. Следовательно, он не может использоваться с команда-
ми модификации. Любое содержание таблицы как единое целое, в момент
выполнения команды, будет отражено в выводе запроса.
Это не обязательно так как в случае с уровнем указатель стабильности.
Блокировка только чтение, гарантирует что ваш вывод будет внутренне
согласован, если конечно нет необходимости во второй блокировке, не связывающей большую часть таблицы с уровнем повторное чтение.
Блокировка только чтение удобна тогда, когда вы делаете отчеты, которые
должны быть внутренне согласованны, и позволять доступ к большинству
или ко всем строкам таблицы, не связывая базу данных.
РЕЗЮМЕ
Ключевые определения, с которыми вы познакомились в этой главе:
* Синонимы, или как создавать новые имена для объектов данных.
* Области базы данных (DBS), или как распределяется доступна
память в базе данных.
* Транзакция, или как сохранять или восстанавливать изменения в
базе данных.
* Управление Параллелизмом, или как SQL предохраняет от конфликта одной команды с другой.
Синонимы - это объекты, в том смысле, что они имеют имена и (иногда)
владельцев, но естественно они не могут существовать без таблицы, чье
им они замещают. Они могут быть общими и следовательно доступны-
ми каждому кто имеет доступ к объекту, или они могут принадлежать
определенному пользователю.
Области DBS или просто DBS - это подразделы базы данных, которые
распределены для пользователей. Связанные таблицы, ( например таблицы, которые будут часто объединяться,) лучше хранить в общей для
них DBS.
СOMMIT и ROLLBACK-это команды, используемые для выполнения
изменений в базе данных, в то врем когда предыдущая команда COMMIT
или команда ROLLBACK, начинают сеанс и оставляют изменения , или
игнорируют их как группу.
Средство Управление Параллелизмом - определяет в какой степени
одновременно поданные команды будут мешать друг другу. Оно является адаптируемым средством, находящим компромисс между производительностью базы данных и изоляцией действующих команд.
РАБОТА С SQL
1. Создайте область базы данных с именем Myspace которая
выделяет 15 процентов своей области для индексов, и 40
процентов на расширение строк.
2. Вы получили право SELECT в таблице Порядков продавца Diane.
Введите команду так чтобы вы могли ссылаться к этой таблице
как к "Orders" не используя им "Diane" в качестве префикса.
3. Если произойдет сбой питания, что случится с всеми изменениями
сделанными во врем текущей транзакции ?
4. Если вы не можете видеть строку из-за ее блокировки, какой это
тип блокировки ?
5. Если вы хотите получить общее, максимальное, и усредненное
значения сумм приобретений для всех порядков, и не хотите при
этом запрещать другим пользоваться таблицей, какой уровень
изоляции будет этому соответствовать ?
( См.