MyTetra Share
Делитесь знаниями!
Как думать на SQL? (Краткое введение в язык запросов)
Время создания: 21.07.2016 13:00
Автор: Рахим Давлеткалиев
Текстовые метки: sql, postgresql, mysql, база данных, язык запросов
Раздел: Компьютер - Программирование - SQL
Запись: xintrea/mytetra_syncro/master/base/14690952334tz91v1ohl/text.html на raw.github.com

Если вы похожи на меня, то согласитесь: SQL — это одна из тех штук, которые на первый взгляд кажутся легкими (читается как будто по-английски!), но почему-то приходится гуглить каждый простой запрос, чтобы найти правильный синтаксис.


А потом начинаются джойны, агрегирование, подзапросы, и получается совсем белиберда. Вроде такой:



SELECT members.firstname || ' ' || members.lastname

AS "Full Name"

FROM borrowings

INNER JOIN members

ON members.memberid=borrowings.memberid

INNER JOIN books

ON books.bookid=borrowings.bookid

WHERE borrowings.bookid IN (SELECT bookid

FROM books

WHERE stock>(SELECT avg(stock)

FROM books))

GROUP BY members.firstname, members.lastname;



Буэ! Такое спугнет любого новичка, или даже разработчика среднего уровня, если он видит SQL впервые. Но не все так плохо.


Легко запомнить то, что интуитивно понятно, и с помощью этого руководства я надеюсь снизить порог входа в SQL для новичков, а уже опытным предложить по-новому взглянуть на SQL.


Не смотря на то, что синтаксис SQL почти не отличается в разных базах данных, в этой статье для запросов используется PostgreSQL. Некоторые примеры будут работать в MySQL и других базах.



1. Три волшебных слова


В SQL много ключевых слов, но SELECT, FROM и WHERE присутствуют практически в каждом запросе. Чуть позже вы поймете, что эти три слова представляют собой самые фундаментальные аспекты построения запросов к базе, а другие, более сложные запросы, являются всего лишь надстройками над ними.



2. Наша база


Давайте взглянем на базу данных, которую мы будем использовать в качестве примера в этой статье:


У нас есть книжная библиотека и люди. Также есть специальная таблица для учета выданных книг.


  • В таблице "books" хранится информация о заголовке, авторе, дате публикации и наличии книги. Все просто.
  • В таблице “members” — имена и фамилии всех записавшихся в библиотеку людей.
  • В таблице “borrowings” хранится информация о взятых из библиотеки книгах. Колонка bookid относится к идентификатору взятой книги в таблице “books”, а колонка memberid относится к соответствующему человеку из таблицы “members”. У нас также есть дата выдачи и дата, когда книгу нужно вернуть.



3. Простой запрос


Давайте начнем с простого запроса: нам нужны имена и идентификаторы (id) всех книг, написанных автором “Dan Brown”


Запрос будет таким:


SELECT bookid AS "id", title

FROM books

WHERE author='Dan Brown';


А результат таким:



id

title

2

The Lost Symbol

4

Inferno


Довольно просто. Давайте разберем запрос чтобы понять, что происходит.



3.1 FROM — откуда берем данные


Сейчас это может показаться очевидным, но FROM будет очень важен позже, когда мы перейдем к соединениям и подзапросам.


FROM указывает на таблицу, по которой нужно делать запрос. Это может быть уже существующая таблица (как в примере выше), или таблица, создаваемая на лету через соединения или подзапросы.



3.2 WHERE — какие данные показываем


WHERE просто-напросто ведет себя как фильтр строк, которые мы хотим вывести. В нашем случае мы хотим видеть только те строки, где значение в колонке author — это “Dan Brown”.




3.3 SELECT — как показываем данные


Теперь, когда у нас есть все нужные нам колонки из нужной нам таблицы, нужно решить, как именно показывать эти данные. В нашем случае нужны только названия и идентификаторы книг, так что именно это мы и выберем с помощью SELECT. Заодно можно переименовать колонку используя AS.

Весь запрос можно визуализировать с помощью простой диаграммы:




4. Соединения (джойны)


Теперь мы хотим увидеть названия (не обязательно уникальные) всех книг Дэна Брауна, которые были взяты из библиотеки, и когда эти книги нужно вернуть:


SELECT books.title AS "Title", borrowings.returndate AS "Return Date"

FROM borrowings JOIN books ON borrowings.bookid=books.bookid

WHERE books.author='Dan Brown';


Результат:



Title

Return Date

The Lost Symbol

2016-03-23 00:00:00

Inferno

2016-04-13 00:00:00

The Lost Symbol

2016-04-19 00:00:00


По большей части запрос похож на предыдущий за исключением секции FROM. Это означает, что мы запрашиваем данные из другой таблицы. Мы не обращаемся ни к таблице “books”, ни к таблице “borrowings”. Вместо этого мы обращаемся к новой таблице, которая создалась соединением этих двух таблиц.


borrowings JOIN books ON borrowings.bookid=books.bookid — это, считай, новая таблица, которая была сформирована комбинированием всех записей из таблиц "books" и "borrowings", в которых значения bookid совпадают. Результатом такого слияния будет:



А потом мы делаем запрос к этой таблице так же, как в примере выше. Это значит, что при соединении таблиц нужно заботиться только о том, как провести это соединение. А потом запрос становится таким же понятным, как в случае с «простым запросом» из пункта 3.


Давайте попробуем чуть более сложное соединение с двумя таблицами.


Теперь мы хотим получить имена и фамилии людей, которые взяли из библиотеки книги автора “Dan Brown”.

На этот раз давайте пойдем снизу вверх:


Шаг Step 1 — откуда берем данные? Чтобы получить нужный нам результат, нужно соединить таблицы “member” и “books” с таблицей “borrowings”. Секция JOIN будет выглядеть так:


borrowings

JOIN books ON borrowings.bookid=books.bookid

JOIN members ON members.memberid=borrowings.memberid


Результат соединения будет таким:



borrowings

.id

borrowings

.bookid

borrowings

.memberid

borrowings

.borrowdate

borrowings

.returndate

books

.bookid

books

.title

books

.author

books

.published

books

.stock

member

.memberid

member

.firstname

member

.lastname

1

1

3

20/01/16 00:00

17/03/16 00:00

1

Scion of Ikshvaku

Amish Tripathi

22/06/15 00:00

2

3

Henry

Clarke

2

2

4

19/01/16 00:00

23/03/16 00:00

2

The Lost Symbol

Dan Brown

22/07/10 00:00

3

4

Mike

Willis

3

1

1

17/02/16 00:00

18/05/16 00:00

1

Scion of Ikshvaku

Amish Tripathi

22/06/15 00:00

2

1

Sue

Mason

4

4

2

15/12/15 00:00

13/04/16 00:00

4

Inferno

Dan Brown

05/05/14 00:00

3

2

Ellen

Horton

5

2

2

18/02/16 00:00

19/04/16 00:00

2

The Lost Symbol

Dan Brown

22/07/10 00:00

3

2

Ellen

Horton

6

3

5

29/02/16 00:00

11/04/16 00:00

3

Who Will Cry When You Die?

Robin Sharma

15/06/06 00:00

4

5

Lida

Tyler


Шаг 2 — какие данные показываем? Нас интересуют только те данные, где автор книги — “Dan Brown”


WHERE books.author='Dan Brown'


Шаг 3 — как показываем данные? Теперь, когда данные получены, нужно просто вывести имя и фамилию тех, кто взял книги:


SELECT

members.firstname AS "First Name",

members.lastname AS "Last Name"


Супер! Осталось лишь объединить три составные части и сделать нужный нам запрос:


SELECT

members.firstname AS "First Name",

members.lastname AS "Last Name"

FROM borrowings

JOIN books ON borrowings.bookid=books.bookid

JOIN members ON members.memberid=borrowings.memberid

WHERE books.author='Dan Brown';


Что даст нам:



First Name

Last Name

Mike

Willis

Ellen

Horton

Ellen

Horton


Отлично! Но имена повторяются (они не уникальны). Мы скоро это исправим.



5. Агрегирование


Грубо говоря, агрегирования нужны для конвертации нескольких строк в одну. При этом, во время агрегирования для разных колонок используется разная логика.


Давайте продолжим наш пример, в котором появляются повторяющиеся имена. Видно, что Ellen Horton взяла больше одной книги, но это не самый лучший способ показать эту информацию. Можно сделать другой запрос:


SELECT

members.firstname AS "First Name",

members.lastname AS "Last Name",

count(*) AS "Number of books borrowed"

FROM borrowings

JOIN books ON borrowings.bookid=books.bookid

JOIN members ON members.memberid=borrowings.memberid

WHERE books.author='Dan Brown'

GROUP BY members.firstname, members.lastname;


Что даст нам нужный результат:



First Name

Last Name

Number of books borrowed

Mike

Willis

1

Ellen

Horton

2



Почти все агрегации идут вместе с выражением GROUP BY. Эта штука превращает таблицу, которую можно было бы получить запросом, в группы таблиц. Каждая группа соответствует уникальному значению (или группе значений) колонки, которую мы указали в GROUP BY. В нашем примере мы конвертируем результат из прошлого упражнения в группу строк. Мы также проводим агрегирование с count, которая конвертирует несколько строк в целое значение (в нашем случае это количество строк). Потом это значение приписывается каждой группе.

Каждая строка в результате представляет собой результат агрегирования каждой группы.



Можно прийти к логическому выводу, что все поля в результате должны быть или указаны в GROUP BY, или по ним должно производиться агрегирование. Потому что все другие поля могут отличаться друг от друга в разных строках, и если выбирать их SELECT'ом, то непонятно, какие из возможных значений нужно брать.


В примере выше функция count обрабатывала все строки (так как мы считали количество строк). Другие функции вроде sum или max обрабатывают только указанные строки. Например, если мы хотим узнать количество книг, написанных каждым автором, то нужен такой запрос:


SELECT author, sum(stock)

FROM books

GROUP BY author;


Результат:



author

sum

Robin Sharma

4

Dan Brown

6

John Green

3

Amish Tripathi

2


Здесь функция sum обрабатывает только колонку stock и считает сумму всех значений в каждой группе.



6. Подзапросы



Подзапросы это обычные SQL-запросы, встроенные в более крупные запросы. Они делятся на три вида по типу возвращаемого результата.



6.1 Двумерная таблица


Есть запросы, которые возвращают несколько колонок. Хороший пример это запрос из прошлого упражнения по агрегированию. Будучи подзапросом, он просто вернет еще одну таблицу, по которой можно делать новые запросы. Продолжая предыдущее упражнение, если мы хотим узнать количество книг, написанных автором “Robin Sharma”, то один из возможных способов — использовать подзапросы:


SELECT *

FROM (

SELECT author, sum(stock)

FROM books

GROUP BY author

) AS results

WHERE author='Robin Sharma';


Результат:



author

sum

Robin Sharma

4


6.2 Одномерный массив


Запросы, которые возвращают несколько строк одной колонки, можно использовать не только как двумерные таблицы, но и как массивы.


Допустим, мы хотим узнать названия и идентификаторы всех книг, написанных определенным автором, но только если в библиотеке таких книг больше трех. Разобьем это на два шага:



1. Получаем список авторов с количеством книг больше 3. Дополняя наш прошлый пример:


SELECT author

FROM (

SELECT author, sum(stock)

FROM books

GROUP BY author

) AS results

WHERE sum > 3;


Результат:



author

Robin Sharma

Dan Brown


Можно записать как: ['Robin Sharma', 'Dan Brown']



2. Теперь используем этот результат в новом запросе:


SELECT title, bookid

FROM books

WHERE author IN (

SELECT author

FROM (

SELECT author, sum(stock)

FROM books

GROUP BY author

) AS results

WHERE sum > 3);


Результат:



title

bookid

The Lost Symbol

2

Who Will Cry When You Die?

3

Inferno

4


Это то же самое, что:


SELECT title, bookid

FROM books

WHERE author IN ('Robin Sharma', 'Dan Brown');


6.3 Отдельные значения


Бывают запросы, результатом которых являются всего одна строка и одна колонка. К ним можно относиться как к константным значениям, и их можно использовать везде, где используются значения, например, в операторах сравнения. Их также можно использовать в качестве двумерных таблиц или массивов, состоящих из одного элемента.


Давайте, к примеру, получим информацию о всех книгах, количество которых в библиотеке превышает среднее значение в данный момент.


Среднее количество можно получить таким образом:


select avg(stock) from books;


Что дает нам:



avg

3.000


И это можно использовать в качестве скалярной величины 3.


Теперь, наконец, можно написать весь запрос:


SELECT *

FROM books

WHERE stock>(SELECT avg(stock) FROM books);


Это то же самое, что:


SELECT *

FROM books

WHERE stock>3.000


И результат:



bookid

title

author

published

stock

3

Who Will Cry When You Die?

Robin Sharma

2006-06-15 00:00:00

4



7. Операции записи


Большинство операций записи в базе данных довольно просты, если сравнивать с более сложными операциями чтения.


7.1 Update


Синтаксис запроса UPDATE семантически совпадает с запросом на чтение. Единственное отличие в том, что вместо выбора колонок SELECT'ом, мы задаем знаения SET'ом.


Если все книги Дэна Брауна потерялись, то нужно обнулить значение количества. Запрос для этого будет таким:


UPDATE books

SET stock=0

WHERE author='Dan Brown';


WHERE делает то же самое, что раньше: выбирает строки. Вместо SELECT, который использовался при чтении, мы теперь используем SET. Однако, теперь нужно указать не только имя колонки, но и новое значение для этой колонки в выбранных строках.




7.2 Delete


Запрос DELETE это просто запрос SELECT или UPDATE без названий колонок. Серьезно. Как и в случае с SELECT и UPDATE, блок WHERE остается таким же: он выбирает строки, которые нужно удалить. Операция удаления уничтожает всю строку, так что не имеет смысла указывать отдельные колонки. Так что, если мы решим не обнулять количество книг Дэна Брауна, а вообще удалить все записи, то можно сделать такой запрос:


DELETE FROM books

WHERE author='Dan Brown';


7.3 Insert


Пожалуй, единственное, что отличается от других типов запросов, это INSERT. Формат такой:


INSERT INTO x

(a,b,c)

VALUES

(x, y, z);


Где a, b, c это названия колонок, а x, y и z это значения, которые нужно вставить в эти колонки, в том же порядке. Вот, в принципе, и все.


Взглянем на конкретный пример. Вот запрос с INSERT, который заполняет всю таблицу "books":


INSERT INTO books

(bookid,title,author,published,stock)

VALUES

(1,'Scion of Ikshvaku','Amish Tripathi','06-22-2015',2),

(2,'The Lost Symbol','Dan Brown','07-22-2010',3),

(3,'Who Will Cry When You Die?','Robin Sharma','06-15-2006',4),

(4,'Inferno','Dan Brown','05-05-2014',3),

(5,'The Fault in our Stars','John Green','01-03-2015',3);



8. Проверка


Мы подошли к концу, предлагаю небольшой тест. Посмотрите на тот запрос в самом начале статьи. Можете разобраться в нем? Попробуйте разбить его на секции SELECT, FROM, WHERE, GROUP BY, и рассмотреть отдельные компоненты подзапросов.


Вот он в более удобном для чтения виде:


SELECT members.firstname || ' ' || members.lastname AS "Full Name"


FROM borrowings

INNER JOIN members

ON members.memberid=borrowings.memberid

INNER JOIN books

ON books.bookid=borrowings.bookid


WHERE borrowings.bookid IN (SELECT bookid FROM books WHERE stock> (SELECT avg(stock) FROM books) )


GROUP BY members.firstname, members.lastname;


Этот запрос выводит список людей, которые взяли из библиотеки книгу, у которой общее количество выше среднего значения.


Результат:



Full Name

Lida Tyler


Надеюсь, вам удалось разобраться без проблем. Но если нет, то буду рад вашим комментариям и отзывам, чтобы я мог улучшить этот пост.


 
MyTetra Share v.0.65
Яндекс индекс цитирования