|
|||||||
Оптимизация SQL-запросов (Часть 2)
Время создания: 30.03.2020 20:03
Текстовые метки: SQL Server, SQL
Раздел: Разные закладки - Почитать
Запись: xintrea/mytetra_db_adgaver_new/master/base/15855878285754e4r3iv/text.html на raw.githubusercontent.com
|
|||||||
|
|||||||
Оптимизация SQL-запросов (Часть 2) 26 июня 2014 в 15:18 В данной статье рассматриваются рекомендации по разработке оптимальной структуры БД. В первой части статьи «Оптимизация SQL-запросов (Часть 1)» рассматриваются особенности запросов на выборку данных, виды индексов, использование планов запросов, различные подходы к оптимизации запросов. 6. Представления, временные таблицы, хранимые процедуры Иногда сложный запрос можно оптимизировать, разбив его на части и сохранив промежуточные результаты во временную таблицу. Можно также использовать представления и/или хранимые процедуры, что также в некоторых ситуациях снизит дублирование кода. Некоторые рекомендации по оптимизации хранимых процедур:
7. Рекомендации по разработке структуры БД Лучший способ решения проблем с производительностью — просто не допустить их. Оптимизация производительности базы данных SQL Server начинается с выбора корректной конфигурации базы данных и модели данных. Можно повысить быстродействие, дополнив базу данных индексами различных типов и более мощными аппаратными средствами, но полностью ликвидировать недостатки модели данных все равно не удастся. Следствием неудачной конфигурации базы данных или модели данных может стать слишком большое время отклика системы, блокированные или зависшие транзакции, неверные или неточные результаты при подготовке бизнес-отчетов, рассинхронизация данных, несогласованность данных и невозможность составить запрос для извлечения нужных данных. 7.1. Выбор первичного ключа Исторически сложилось так, что наиболее общим подходом в проектировке БД для идентификации конкретной строки использовалась целочисленная последовательность. Как правило, такая последовательность генерируется на стороне сервера в момент вставки новой строки. Такой подход подходит для многих приложений. Тем не менее возникают ситуации, когда ключ необходимо сгенерировать на стороне клиента. Тогда альтернативой становится использование GUID в роли первичного ключа. Основным преимуществом GUID является возможность генерации его на лету, на стороне клиента, без необходимости проверки уникальности в базе данных. На первый взгляд это идеальное решение проблемы уникальных ключей, однако возникает проблема в производительности. Т. к. в MS SQL для первичного ключа используется кластеризованный индекс, где строки хранятся в индексе, то использование GUID в первичном ключе замедляет вставку записей и приводит к фрагментации БД. По этой причине практика использования в качестве первичного ключа в больших базах ключей на основе GUID противопоказана. 7.2. Создание индексов по внешним ключам MS SQL автоматически НЕ создает индексы по внешним ключам. Однако индексация таблиц по внешнему ключу может оказаться полезна по следующим причинам:
7.3. Денормализация БД Иногда для оптимизации запросов может быть оправдана денормализация БД. В запросах к полностью нормализованной базе нередко приходится соединять до десятка, а то и больше, таблиц. А каждое соединение — операция весьма ресурсоемкая. Как следствие, такие запросы кушают ресурсы сервера и выполняются медленно. В такой ситуации может помочь:
Расчетные значения в запросе зачастую медленно выполняются, и потребляют много ресурсов запросы, в которых производятся какие-то сложные вычисления, особенно при использовании группировок и агрегатных функций (Sum, Max и т. п.). Иногда имеет смысл добавить в таблицу 1-2 дополнительных столбца, содержащих часто используемые (и сложно вычисляемые) расчетные данные. В рассматриваемом примере можно добавить поле «общая стоимость заказа» и хранить его отдельным полем в таблице Order. 8. Примеры оптимизации запроса 8.1. Использование правильных типов данных Пример запроса:
Поле «OrderNumber» объявлено на типе varchar, поэтому при выполнении приведенного выше запроса, СУБД выполняет приведение типов. Если переписать запрос следующим образом:
То запрос будет эффективнее. 8.2. Использование функций при составлении условий Пример:
Запрос отбирает все заказы с номером, начинающимся на 5.
То в плане Index Scan меняется на Index Seek, и запрос становится эффективнее. 8.3. Оптимизация с использованием индекса Допустим, необходимо отобрать список заказов по определенному поставщику за определенный период.
Добавим индекс по дате заказа.
Добавим составной индекс.
Таким образом, добавление нужного индекса может ускорить запрос в десятки раз. 8.4. Оптимизация с изменением текста запроса Допустим, необходимо отобрать список завершенных заказов (по номеру заказа), имеющих общую стоимость более 1 млн, и получить следующие данные: номер заказа, наименование клиента и стоимость заказа. Напишем такой запрос:
Статистика выполнения:
Посмотрев план, обнаруживаем, что самая затратная операция — поиск статуса заказа через короткий SELECT. Перепишем запрос через вложенные запросы.
Результат:
Отбор по статусу теперь является менее затратной операцией, чем все остальное. Чтобы убедится в этом, удалим из запроса выборку статуса заказа:
Результат:
Т. е. определение статуса занимает порядка 20 % запроса. О чем и свидетельствует план: Основное время уходит на расчет стоимости заказа: поиск всех элементов и умножение на цену. Если бы общая стоимость заказа хранилась непосредственно в Order, то запрос был бы оптимальнее? Проведем эксперимент: добавим стоимость заказа в таблицу Order.
Перепишем запрос:
Результат:
Как видим, производительности особо не прибавилось. Основное время по прежнему занимает группировка. Попробуем группировать не по имени клиента, а по Id:
Добавим индекс по номеру заказа и коду клиента:
Эффект появился.
Эффект усилился. Для получения наименования поставщика обернем все во внешний запрос:
Таким образом, исходный запрос был оптимизирован с 67 секунд до 10 секунд. 9. Оптимизация БД 9.1. Обслуживание статистики индексов Статистика индексов — ключевой момент для оптимизатора запроса в выборе плана выполнения. Если статистика устареет и не будет отражать реальную картину с данными в таблице, то выбор индекса может быть неверен. Чтобы быть полезной, статистика должна содержать текущие реальные данные. SQL Server позволяет обновлять статистику автоматически, без привлечения дополнительных усилий со стороны DBA. Проверить, установлен ли флаг автоматического обновления статистики, можно командой:
Если результат равен 1 — опция автоматического обновления статистики включена. Установить опцию можно командой:
А выключить:
В большинстве случаев рекомендуется оставлять эту функцию включенной. В этом случает SQL Server будет сам обновлять статистику, когда посчитает ее устаревшей. Алгоритм обновления полностью определяется SQL Server и зависит от количества обновлений, удалений и добавлений записей в таблицу. Если таблица имеет один миллион записей, и только 100 из них были изменены (0.01 %), вряд ли имеет смысл обновлять статистику, поскольку такие изменения в таблице вряд ли драматически поменяли общую картину данных. Кроме того, если размер таблицы более 8 МБ (1 000 страниц), SQL Server не будет использовать все данные для вычисления статистики. Все эти ограничения разработаны для того, чтобы работа со обновлением статистики наносила как можно меньший удар на быстродействие сервера. Если автоматическое обновление все же будет отключено, то необходимо обновлять статистику вручную. Эта операция для любого индекса может быть выполнена командой:
9.2. Дефрагментация БД Когда запись удаляется, в файле БД высвобождается место. Когда вставляется новая запись, это может привести к расщеплению страниц, что приводит к появлению пустого пространства на страницах данных. Когда данные обновляются, это может привести к изменению размера записи и к возникновению двух ранее упоминавшихся случаев. Все это приводит к фрагментации. В SQL Server выделяют два типа фрагментации: внутренняя и внешняя. Если страницы не полностью заполнены данными, это приводит к дополнительным операциям I/O и «повышенному расходу» оперативной памяти, т. к. страницы в оперативной памяти есть зеркальное отражение страниц на диске. В SQL Server есть несколько путей преодоления внутренней фрагментации. Один из этих методов состоит в том, чтобы использовать команду DBCC REINDEX для перестройки кластеризованных и некластеризованных индексов. После перестройки индексов страницы данных становятся логически непрерывными, и дисковый ввод/вывод минимизирован. К сожалению, внутренняя фрагментация — это только лишь часть проблемы фрагментации: выполнение DBCC REINDEX не сказывается на внешней фрагментации. Внешняя фрагментация — это фрагментация физических файлов на дисках вашего сервера, которая может вызвать такое же большое количество ненужных операций ввода/вывода, как и внутренняя, если не больше. Ненужные операции ввода-вывода, приводят к снижению производительности SQL Server. Для устранения внешней фрагментации используются специализированные утилиты. 10. Резюме
11. Источники technet.microsoft.com/ru-ru/magazine/2007.11.sqlquery.aspx www.lektorium.tv/lecture/?id=14561 В первой части статьи «Оптимизация SQL-запросов (Часть 1)» рассматриваются особенности запросов на выборку данных, виды индексов, использование планов запросов, различные подходы к оптимизации запросов. |
|||||||
Так же в этом разделе:
|
|||||||
|
|||||||
|