По данным рейтинга DB-Engines, четыре самые популярные системы управления базами данных являются реляционными. Они занимают львиную долю рынка - поэтому довольно часто новичкам известно только лишь о них. Однако существуют самые различные типы и виды баз данных, каждый из которых представляет различный способ хранения данных.
Понимание их различий и уникальных преимуществ очень важно для правильного выбора. Мы подготовили подробное руководство про типы баз данных, чтобы помочь вам узнать про все доступные для вас варианты.
Содержание
Что Было До Современных Баз Данных?
Последняя сделка действительна прямо сейчас:
GET 50% OFF
DataCamp Black Friday Sale
During this DataCamp Black Friday, you can access the top-rated courses with a 50% discount. Enroll now for way less!
Ранние виды баз данных имели довольно ограниченный функционал. В самом начале компьютерные энтузиасты использовали нечто, что они называли плоскими базами данных, которые по сути представляли собой обычные текстовые файлы. Это означало, что данные должны были быть текстовыми и иметь ограниченный размер. Чтобы обозначить начало каждого нового поля, программистам был необходим делимитер - специальный знак, выбранный для определения границы (например, запятая или точка с запятой). Так как в таком случае нет связей между полями, в плоской базе данных сложно искать что-либо. Однако она работала для небольшого количества данных. Чтобы увидеть базовые примеры подобных баз данных, просто взгляните на файлы CSV (Comma Separated Values).
В 1960 году IBM представила иерархические базы данных. Как понятно из названия, записи были связаны древовидной структурой, основанной на родительско-дочерних отношениях. Один предмет может иметь только одного родителя, тогда как один родитель может иметь несколько дочерних предметов. Это был первый шаг к созданию реляционных баз данных. Однако логика иерархических отношений работала хорошо не для всех типов записей, что в некоторых случаях усложняло организацию данных. Чтобы решить эту проблему, спустя десять лет Чарльз Уиллиам Бачман III, представил более гибкую модель под названием сетевые базы данных. Они ещё имели древовидную структуру, но дочерние элементы также могли иметь несколько родителей. Хотя к этому моменту сетевые базы данных уже полностью вымерли: большинство компаний, которые использовали их, запрыгнули на поезд реляционной базы данных как только он прибыл.
Реляционные Против Не реляционных Баз Данных
При взгляде на современные типы и виды баз данных, больше всех выделяются реляционные. Эдгар Ф.Кодд использовал этот термин в 1962, когда работал в IBM. MySQL, PostgreSQL или SQL Server - все они являются отличными примерами реляционных баз данных. Их имена также содержат подсказку: чтобы получить доступ и управлять данными, вам нужно знать SQL (Structured Query Language). SQL имеет хорошо установленные стандарты и позволяет вашим данным легко перемещаться.
При использовании реляционной базы данных вы можете хранить данные в таблицах, которые состоят из строк и столбцов. Каждая строка представляет собой отдельную запись, а колонка является полем с назначенными ей типом данных. Таблицы, которые содержат связанную информацию могут быть связаны с помощью первичных и внешних ключей.
В последние годы не реляционные типы БД также начали испытывать некий рост популярности. Основной причиной этого является рост потребности в неструктурированных хранилищах данных. В век больших данных нам часто необходимо справляться с информационным разнообразием. Данные теперь могут представлять собой изображения, видео и даже записи в социальных сетях. Чтобы работать с не табличными данными, вам нужна не реляционная база данных. Разработчики иногда называют их NoSQL базы данных: в отличие от реляционных, они не поддерживают SQL-запросы.
Существуют четыре типа баз данных, которые не используют реляционную модель. В зависимости от вашего выбора вы можете хранить данные как документы, пары ключ-значение, графики или семейства столбцов.
Документо-ориентированные Базы Данных
В документо-ориентированных базах данных (которые часто называются магазинами документов), данные хранятся в коллекциях документов, обычно использующих форматы JSON, XML или BSON. Одна запись может хранить столько данных, сколько вам необходимо в любом типе данных (или типах) - нет никаких ограничений. Есть определённая внутренняя структура в одном документе, но она может отличаться для каждого документа. Вы также можете их вкладывать.
Если мы говорим про не реляционные виды баз данных, магазины документов являются самыми популярными. Лучшим примером может стать MongoDB, которая на данный момент имеет порядка 400 миллионов скачиваний. Изначально представленная в 2008 году, теперь она используется гигантами индустрии вроде Barclays и Bosch. Разработчикам нравится её плавная кривая обучаемости и превосходная гибкость. Вы можете использовать бесплатную версию для Сообщества и платную версию для Предприятий - обе версии работают на Windows, Linux и macOS.
Виды ДБ Ключ-Значение
Как можно догадаться по названию, каждая запись в этой не реляционной базе данных имеет ключ и значение. Похожим образом как и в словарях, ключ может быть использован для определения значения. Это настолько просто. Разработчики в основном используют данные типы БД, когда они работают с не очень сложными данными и скорость является приоритетом. Например, это отличный выбор для хранения данных настроек.
Хранимым данным не назначается схема, а сама база данных гораздо более лёгкая, по сравнению с реляционной. Это также делает такие виды баз данных лучшим вариантом для встраивания. На момент 2023 самой популярной базой данных ключ-значение является Redis. Она также была выбрана как самая любимая база данных по результатам ежегодного опроса StackOverflow в течение трёх лет (2017, 2018 и 2023).
Графовые Базы Данных
Используя графовую базу данных, вы сможете работать с двумя типами данных. Ноды означают предметы в базе данных, а рёбра определяют их отношения, также называемые графами. На первый взгляд графовые базы данных напоминают старые сетевые базы данных, но есть одно различие. Сетевым базам данных не хватало абстракции, которая гораздо более профессионально моделируется в графовых базах данных вроде Neo4J или Dgraph.
Сравнивая все типы и виды баз данных, этот вариант будет самым лучшим, когда отношения и их анализ являются приоритетом. Однако графовые базы данных имеют один явный недостаток: хотя вам необходим язык запросов для доступа к данным, вы не можете использовать ни SQL, ни какой-либо другой универсально принятый подход. Недостаток стандартизации означает, что большинство языков запросов может быть использовано лишь для одного или нескольких типов графовых баз данных.
- Простой в использовании
- Предлагает качественный контент
- Очень открытый в своих ценах
- Бесплатные сертификаты об окончании
- Фокус на навыки науки о данных
- Гибкое расписание занятий
- Простой дизайн (без бесполезной информации)
- Хорошее качество курсов (даже бесплатных)
- Разнообразие возможностей обучения
- Программа Nanodegree
- Подходит для корпоративного обучения
- Платные сертификаты об окончании
- Известная платформа в индустрии
- Широкий спектр особенностей
- Курсы университетского уровня
- Курсы университетского уровня
- Подходит для компаний
- Платные сертификаты об окончании
База Данных Колоночного Хранения
Последней из не реляционных типов баз данных является база данных колоночного хранения или база данных колоночного семейства. Хорошим вариантом для хранения данных их делает быстрая производительность, эффективная компрессия данных и отличная масштабируемость.
Вместо схемы, которую можно найти в реляционных базах данных, колоночная база данных используют пространство ключей для хранения семейств столбцов. Схожим образом с таблицами, семейство колонок содержит строки и столбцы. Хотя есть чёткое различие: в этом случае колонки не распространяются на все строки. Вместо этого они содержатся в строке, что также означает, что разные строки могут иметь разные столбцы. Помимо колонок каждая строка имеет свой идентификатор под названием ключ и каждая колонка содержит название, значение и временную метку. Если мы говорим про такие виды баз данных, то хорошими примерами будут Cassandra, Vertica и Druid.
Вы знали?
Вы когда-либо хотели узнать, какие платформы для онлайн обучения лучше всего подходят для вашей карьеры?
Виды Баз Данных: Что Дальше?
В 2011 году Мэтью Аслетт стал первым, кто использовал термин NewSQL. Этот термин был связан с новым поколением хранения данных: тех, что совмещает масштабируемость NoSQL с ACID-соответствием реляционных баз данных. ACID означает Атомарность, Согласованность, Изолированность и Прочность - самые важные принципы хранения данных. Одним из способов получить лучшее из двух миров - это забыть об общем назначении и попытаться сосредоточиться на одной задаче. Например, MemSQL, работает только лишь с кластерной аналитикой.
По данным The Economist, данные являются новой нефтью - поэтому вполне естественно, что виды и типы БД постоянно растут. Хотя реляционные базы данных до сих пор остаются самыми популярными, особые случаи требуют наличия различных инструментов. Мы надеемся наше детальное руководство помогло пролить свет на эту тему - ведь если понять различные виды баз данных, то вам будет легче сделать правильный выбор.