1/25
Looks like no tags are added yet.
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
База данных
Это организованный набор данных, которые связаны между собой и могут быть использованы для обработки и хранения информации. Пример: список контактов на телефоне или таблица с заказами в интернет-магазине.
Данные
Это любая информация, которую можно сохранить в базе данных. Данные могут быть связаны с реальными объектами (например, людьми, вещами, местами). Пример: имя, адрес, дата рождения.
Модели баз данных
это способ, с помощью которого данные хранятся и связаны между собой. Существуют разные модели, и каждая по-своему организует данные. Самые известные из них — иерархическая, сетевая, реляционная и модель "ключ — значение”
Иерархическая модель
В этой модели данные представляют собой древовидную структуру, где каждый элемент (запись) связан с одним родителем. Это похоже на структуру папок на компьютере: одна папка может содержать другие папки и файлы.
Сетевая модель
это модель, в которой данные организованы в виде графа. В отличие от иерархической модели, где каждая запись может иметь только одного родителя, в сетевой модели одна запись может быть связана с несколькими родительскими и дочерними записями, то есть реализуются многие-ко-многим отношения.
Реляционная модель
Одна из самых популярных моделей. В ней данные хранятся в виде таблиц, которые могут быть связаны между собой. Каждая таблица содержит строки (записи) и столбцы (поля). Модель называется реляционной, потому что основана на понятии отношения из математики — по сути, таблицы представляют собой множества данных, связанных определёнными правилами. Такие базы данных используются повсеместно: в банках, магазинах, на сайтах и т.д.
Модель ключ — значение
В этой модели каждый элемент данных хранится в виде пары: уникальный ключ и значение. Это подходит для быстрого поиска данных, например, для хранения настроек приложения или кеша.
Документная модель
Здесь данные хранятся в виде документов (например, в форматах JSON или XML). Каждый документ может содержать разные типы информации, и не нужно заранее задавать структуру (не требуется заранее определять, какие поля и типы данных будут у документов — в отличие от реляционных баз данных). Эта модель используется для гибкого хранения данных, например, в социальных сетях или интернет-магазинах (гибкость и отсутствие фиксированной структуры).
Пример применения баз данных
Бизнес: Хранение данных о клиентах и продажах.
Медицина: Хранение данных о пациентах, результатах анализов.
В банках: Хранение информации о клиентах, счетах и транзакциях.
Таблица в реляционной базе
Таблица — это основная структура хранения в реляционной базе. Она состоит из строк и столбцов:
Строки (или записи) содержат данные об отдельных объектах. Например, одна строка может описывать одного человека.
Столбцы (или поля) представляют характеристики этих объектов — например, имя, фамилия, дата рождения. Все значения в одном столбце имеют одинаковый тип: например, только числа или только текст.
Первичный ключ
Это поле (или несколько полей) таблицы, значения которого не повторяются. С помощью первичного ключа можно однозначно определить каждую запись. Например, в таблице людей это может быть уникальный идентификатор — ID.
Если уникальность можно обеспечить только сочетанием нескольких полей, такой ключ называют составным. Первичный ключ не обязателен, но обычно используется для надёжности и навигации по данным.
Внешний ключ
Поле в таблице, которое содержит ссылки на значения первичного ключа в другой таблице. Благодаря этому возможно связать данные между таблицами. Например, таблица «Люди» может содержать поле «Код страны», которое ссылается на таблицу «Страны».
Внешние ключи позволяют не дублировать данные: страна указывается в одном месте, а в других таблицах просто используются её коды.
Схема данных
Это описание структуры базы данных: какие таблицы есть, какие у них поля и какие связи между таблицами. Обычно схема изображается в виде таблиц, связанных линиями, которые показывают первичные и внешние ключи. Схема помогает понять, как устроена база и как в ней находить нужную информацию.
Нормализация данных
Это процесс организации данных по определённым правилам, чтобы убрать дублирование и ошибки. Это помогает сделать базу данных удобной для хранения и обработки.
Избыточность данных
Когда одна и та же информация повторяется в разных местах базы данных. Это плохо, потому что занимает лишнее место и может привести к ошибкам, например, когда меняешь данные в одном месте, а забываешь в другом.
Аномалии
Это ошибки, которые возникают из-за плохой структуры таблицы:
Типы аномалий:
Аномалия вставки — это невозможность добавления данных в базу данных из-за отсутствия других данных. Например, если студент ещё не выбрал курс, а поле курса обязательно — запись не добавится. Решается разбиением данных на отдельные таблицы.
Аномалия удаления — это потеря важной информации при удалении записи из базы данных.
Например, если студент — единственный, кто записан на курс, и его удалить, то вместе с ним удалится и информация о самом курсе.
3. Аномалия изменения — когда данные дублируются и при изменении нужно править во многих местах.
Первая нормальная форма (1НФ)
Таблица должна содержать только простые, неделимые значения (в каждой ячейке — одно значение), не должно быть полей с одинаковым смыслом (повторяющихся по сути). Также таблица должна иметь первичный ключ — уникальный идентификатор записи.
Вторая нормальная форма (2НФ)
Таблица должна быть в первой нормальной форме, и при этом все неключевые поля должны зависеть от всего первичного ключа, а не только от части. Если ключ состоит из нескольких полей, то каждое неключевое поле должно зависеть от всех этих полей.
Неключевые поля
это поля (столбцы) таблицы, которые не входят в состав первичного ключа.
Третья нормальная форма (3НФ)
3НФ означает, что таблица находится во второй нормальной форме и в ней отсутствуют транзитивные зависимости: каждый неключевой столбец зависит только от первичного ключа, а не от других неключевых столбцов.
EmployeeID | Name | DepartmentID | DepartmentName |
---|
EmployeeID
— ключ
DepartmentID
— неключевое поле
DepartmentName
— неключевое поле
И здесь:
DepartmentName
зависит от DepartmentID
DepartmentID
зависит от EmployeeID
Декомпозиция
Процесс разделения большой таблицы на несколько меньших, чтобы устранить избыточность и аномалии.
Денормализация
Обратный процесс нормализации — добавление избыточности намеренно для ускорения чтения данных, когда это выгодно по производительности.
СУБД (Система Управления Базами Данных)
это программное обеспечение, которое позволяет работать с базой данных. Она как посредник между пользователем (или программой) и файлами, где хранятся данные.
Запрос
Команда на языке SQL (или другом языке), которая отправляется СУБД для выполнения операции с данными.
SQL
декларативный язык запросов к реляционным базам. С его помощью мы описываем, какие данные хотим получить или изменить, а СУБД сама решает, как это сделать.
Типы СУБД по расположению данных
Локальные СУБД — база данных находится на одном компьютере или сервере.
Распределённые СУБД — данные хранятся на нескольких серверах, связанных между собой, часто в разных физических местах.