Содержание[Скрывать][Показывать]
- 1. Что вы подразумеваете под базой данных?
- 2. Что вы подразумеваете под СУБД?
- 3. Расскажите о различных языках СУБД.
- 4. Перечислите несколько преимуществ СУБД?
- 5. Укажите недостатки обычных файловых систем, которые есть у СУБД.
- 6. Что вы подразумеваете под свойствами ACID в СУБД?
- 7. Какую роль выполняет SQL в СУБД?
- 8. Считаются ли пробелы или ноль значениями NULL в базах данных?
- 9. Что такое хранилище данных?
- 10. Что означает контрольная точка СУБД?
- 11. Описать различные уровни абстракции данных СУБД.
- 12. Что для вас означает «оптимизация запросов»?
- 13. Моделирование сущность-связь: что это такое?
- 14. Что означают фразы «сущность», «тип сущности» и «набор сущностей» в системе управления базами данных?
- 15. Что такое соединения и какие виды отношений существуют в СУБД?
- 16. Что такое СУБД?
- 17. Что означают термины «намерение» и «расширение» в базе данных?
- 18. Какие существуют методы нормализации и что означает термин «нормализация»?
- 19. Опишите замок. Необходимо объяснить основное различие между разделяемой блокировкой и монопольной блокировкой во время транзакции базы данных.
- 20. Что означают термины «нормализация» и «денормализация»?
- 21. Опишите разделение базы данных и его значение.
- 22. Что для вас означают термины «упреждающий», «ретроактивный» и «одновременное обновление»?
- 23. Что для вас означает термин «курсор»? Опишите различные виды курсоров.
- 24. Опишите различия между сетевой и иерархической моделями баз данных.
- 25. Опишите MongoDB.
- 26. Опишите различия между двухуровневой и трехуровневой системой СУБД.
- 27. Что означает термин «хеширование» в базе данных?
- 28. Какую роль в СУБД выполняет администратор базы данных?
- Заключение
Данные можно найти в любой точке мира! На современном рынке каждый день производится более 2.5 квинтиллионов байтов данных.
Очень важно, чтобы мы все анализировали эти данные и предоставляли требуемые результаты, используя системы управления базами данных (СУБД). С другой стороны, знание СУБД позволяет работать администратором базы данных.
Учитывая, что вы читаете этот пост о вопросах для интервью с СУБД, я предполагаю, что вы уже знаете об этих деталях. Любая профессия в области анализа данных должна начинаться с глубокого понимания систем управления базами данных (СУБД).
Создание эффективных систем баз данных требует способности организовывать, оценивать, обрабатывать и осмысливать огромные объемы данных.
Вот несколько вопросов для собеседования по СУБД, которые помогут вам добиться успеха на следующем собеседовании и получить должность, о которой вы мечтали, независимо от того, начали ли вы карьеру в области анализа данных или только начинаете.
Самые популярные вопросы для собеседования по СУБД собраны в список для вашего удобства, чтобы помочь вам пройти собеседование и укрепить свое понимание предмета.
1. Что вы подразумеваете под базой данных?
База данных — это логически структурированный набор данных, которые можно легко обновлять, получать к ним доступ и поддерживать. Все, что создается с помощью команды create, является объектом базы данных, а базы данных часто состоят из наборов таблиц или объектов, содержащих записи и поля.
Одна запись в таблице представлена кортежем или строкой. Основные части хранилища данных, которые предоставляют подробную информацию о конкретном аспекте таблицы, — это атрибут или столбец.
СУБД извлекает данные из базы данных с помощью пользовательских запросов.
2. Что вы подразумеваете под СУБД?
СУБД — это программы, помогающие создавать логически связанные данные и управлять ими.
Другими словами, система управления базами данных (СУБД) предоставляет нам интерфейс или инструмент для выполнения различных операций, включая создание базы данных, добавление в нее данных, ее удаление, изменение данных и т. д.
Программное обеспечение, называемое системой управления базами данных (СУБД), позволяет хранить данные более безопасным способом, чем файловая система.
3. Расскажите о различных языках СУБД.
Ниже приведены некоторые из языков, используемых СУБД:
- DDL (язык определения данных): в нем содержатся инструкции, необходимые для определения базы данных. CREATE, ALTER, DROP, TRUNCATE, RENAME и т. д. — вот несколько примеров.
- DML (язык манипулирования данными): включает в себя команды, необходимые для работы с данными в базе данных. Примеры включают SELECT, UPDATE, INSERT, DELETE и т. д.
- DCL (язык управления данными): включает команды, необходимые для работы с разрешениями пользователей и элементами управления системой базы данных. Например, GRANT и REVOKE.
- TCL (язык управления транзакциями): включает команды, которые необходимо использовать для управления транзакциями базы данных. Например, COMMIT, ROLLBACK и SAVEPOINT.
4. Перечислите несколько преимуществ СУБД?
- Несколько пользователей могут одновременно обмениваться данными из одной и той же базы данных. Более того, такое совместное использование позволяет пользователям быстро реагировать на изменения в среде базы данных.
- Несколько пользователей могут одновременно просматривать данные одной и той же базы данных.
- уменьшает дублирование в базе данных за счет введения системы, объединяющей все данные в единую базу данных.
- При необходимости данные в базе данных могут быть восстановлены, а резервная копия данных может быть запрограммирована на автоматическое создание.
- Позволяет изменять формат данных, сохраняя состав всех запущенных процессов приложения.
5. Укажите недостатки обычных файловых систем, которые есть у СУБД.
Мы вынуждены сканировать каждую страницу в типичной файловой системе, поскольку индексация отсутствует, что делает доступ к контенту трудоемким и медленным.
Избыточность и несогласованность являются другими проблемами, поскольку файлы часто содержат избыточные и дублирующиеся данные, и изменение одного из них делает их все несогласованными.
Доступ к данным более сложен в традиционных файловых системах, поскольку данные дезорганизованы. Другим недостатком является отсутствие контроля параллелизма, что предотвращает одновременную работу многих операций с одним и тем же файлом и вместо этого заставляет одно действие блокировать всю страницу.
Системы управления базами данных также решили проблемы с традиционными файловыми системами, включая проверки целостности, разделение данных, атомарность, безопасность и многое другое.
6. Что вы подразумеваете под свойствами ACID в СУБД?
Фундаментальные рекомендации, которым необходимо следовать для сохранения целостности данных, — это характеристики ACID системы управления базами данных. Вот какие они:
- Атомарность. Атомарность, также называемая принципом «все или ничего», утверждает, что каждая оценка отдельного блока либо выполняется полностью, либо не выполняется вообще.
- Согласованность: это свойство показывает, что данные в базе данных постоянны как до, так и после каждой транзакции.
- Изоляция — это свойство определяет, что одновременно может выполняться множество транзакций.
- Долговечность — это свойство гарантирует, что каждая транзакция после завершения записывается в энергонезависимую память.
7. Какую роль выполняет SQL в СУБД?
SQL расшифровывается как язык структурированных запросов, и его основная функция заключается в взаимодействии с реляционными базами данных путем ввода и обновления/изменения данных.
8. Считаются ли пробелы или ноль значениями NULL в базах данных?
Нет, значение NULL сильно отличается от нуля и пробела, поскольку оно обозначает присвоенное, неизвестное, недоступное или нерелевантное значение, в отличие от пробела и нуля, каждое из которых представляет символ.
9. Что такое хранилище данных?
Хранилище данных — это процесс сбора, извлечения, обработки и импорта данных из нескольких источников для их хранения в одной базе данных.
Хранилище данных можно рассматривать как центральный репозиторий, где данные используются для анализа данных и потоков из транзакционных систем и других реляционных баз данных.
A информационное хранилище содержит ряд исторических данных из организации, которые используются для улучшения принятия решений внутри компании.
10. Что означает контрольная точка СУБД?
Метод Checkpoint удаляет все предыдущие журналы из системы и постоянно сохраняет их на устройстве хранения.
Два метода, которые могут помочь СУБД восстановить и сохранить качества ACID, включают сохранение теневых страниц и ведение журнала каждой транзакции. Контрольные точки важны для механизма восстановления на основе журнала.
Запись журнала транзакций может использоваться для восстановления всех зафиксированных данных до момента сбоя из контрольных точек, которые являются минимальными точками, с которых ядро базы данных может восстановиться после сбоя.
11. Описать различные уровни абстракции данных СУБД.
Абстракция данных скрывает от пользователя неважную информацию, чтобы обеспечить более плавное взаимодействие. Существуют три уровня абстракции:
- Физический уровень: наименьший уровень абстракции описывает физическое хранение данных в памяти. Для доступа к данным могут использоваться как последовательные, так и произвольные методы доступа. Для упорядочивания файлов используются B+-деревья и методы хеширования.
- Логический уровень: Уровень, на котором данные хранятся в виде таблиц. Кроме того, базовые структуры используются для хранения связей между различными элементами.
- Уровень просмотра: это самый высокий уровень абстракции. Пользователям доступна только часть реальной базы данных, представленная строками и столбцами. Возможно несколько представлений одной и той же базы данных. Пользователей не уведомляют об особенностях хранения и реализации.
12. Что для вас означает «оптимизация запросов»?
Шаг оптимизации запроса находит стратегию оценки с наименьшими прогнозируемыми затратами. Этот этап становится актуальным, когда для решения одной и той же задачи доступно несколько алгоритмов и методов.
Ниже приведены некоторые преимущества оптимизации запросов:
- Результат доставляется быстрее
- Уменьшает сложность времени и пространство
- Больше запросов можно обработать за меньшее время.
13. Моделирование сущность-связь: что это такое?
В этом методе проектирования базы данных диаграммы используются для изображения реальных элементов реального мира в виде сущностей и отображения их взаимосвязей. Этот метод упрощает понимание схемы группой администраторов баз данных.
14. Что означают фразы «сущность», «тип сущности» и «набор сущностей» в системе управления базами данных?
Сущность: предмет реального мира считается сущностью, если у него есть свойства, соответствующие его конкретным атрибутам. Например, студент, сотрудник или учитель символизируют сущность.
Тип объекта: тип объекта описывается как группа объектов со схожими характеристиками. Тип объекта представлен одной или несколькими связанными таблицами в базе данных. Тип сущности или атрибуты можно рассматривать как черту, которая конкретно идентифицирует сущность. Студент, например, символизирует объект с такими характеристиками, как идентификатор студента, имя студента и т. д.
Набор сущностей: все сущности в базе данных, принадлежащие к определенному типу сущностей, собираются вместе как набор сущностей. Например, набор сущностей — это совокупность всех учащихся, сотрудников, учителей и т. д.
15. Что такое соединения и какие виды отношений существуют в СУБД?
В СУБД отношение — это ситуация, в которой два объекта связаны друг с другом. В этом случае таблица внешнего ключа имеет ссылку на первичный ключ другой таблицы.
Следующий список включает в себя множество типов отношений, встречающихся в СУБД:
- Отношение «один к одному»: этот термин используется для описания отношения между одной строкой в таблице A и одной строкой в таблице B.
- Отношение «один ко многим»: используется, когда существует отношение между одной строкой в таблице A и многими строками в таблице B.
- Отношение «многие ко многим» — используется, когда большое количество строк в таблице A может быть связано с большим количеством строк в таблице B.
- Самореферентная связь — используется, когда запись в таблице А связана с другой записью в той же таблице.
16. Что такое СУБД?
РСУБД, или системы управления реляционными базами данных, являются аббревиатурой этих систем. Он используется для отслеживания индексов таблиц и записей данных.
РСУБД представляют собой подмножество систем управления базами данных, которые используют структуру для поиска и извлечения информации о других объектах базы данных. Система управления реляционными базами данных (RDBMS) позволяет легко обновлять, вставлять, удалять, редактировать и управлять реляционной базой данных.
Большую часть времени РСУБД использует язык SQL, поскольку он удобен для пользователя и регулярно используется.
17. Что означают термины «намерение» и «расширение» в базе данных?
Основное различие между намерением и расширением в базе данных заключается в следующем:
Намерение: Намерение, иногда называемое схемой базы данных, используется для описания описания базы данных. Он устанавливается при построении базы данных и в основном не изменяется.
Расширение. С другой стороны, расширение — это измерение общего количества кортежей в базе данных в любой момент времени. Когда в базе данных создаются, изменяются или удаляются кортежи, значение расширения, также называемого снимком базы данных, постоянно изменяется.
18. Какие существуют методы нормализации и что означает термин «нормализация»?
Нормализация — это процесс структурирования данных для предотвращения их дублирования и избыточности. Несколько стадий нормализации следуют друг за другом и называются нормальными формами. Следующие типичные формы зависят друг от друга.
Первые три нормальные формы таковы.
NF-1, или первая нормальная форма, строки без повторяющихся группировок
2NF означает вторую нормальную форму. Каждое значение вспомогательного (не ключевого) столбца зависит от всего основного ключа.
Three-Normal-Form (3NF) зависит только от первичного ключа и не зависит ни от каких других поддерживающих (неключевых) значений столбца.
У вас также есть высшие нормальные формы, такие как BCNF, в дополнение к этим.
BNCF — более сложный и требовательный вариант 3NF называется 3.5NF. Таблица должна быть в 3NF и соответствовать правилу BCNF, согласно которому A должен быть суперключом таблицы для любой функциональной зависимости A->B.
19. Опишите замок. Необходимо объяснить основное различие между разделяемой блокировкой и монопольной блокировкой во время транзакции базы данных.
Блокировка базы данных — это мера безопасности, которая не позволяет двум или более пользователям базы данных одновременно обновлять общую часть данных.
Никакой другой пользователь или сеанс базы данных не может редактировать данные до тех пор, пока блокировка не будет снята с конкретной базы данных, когда один пользователь базы данных или сеанс получили блокировку.
Общая блокировка: для чтения элемента данных требуется общая блокировка, и многие транзакции могут удерживать блокировку одного и того же элемента данных под общей блокировкой. Элементы данных в общей блокировке могут быть прочитаны многими транзакциями.
Эксклюзивная блокировка. Любая транзакция, предназначенная для выполнения операции записи, имеет блокировку, известную как монопольная блокировка. Эта форма блокировки запрещает несколько транзакций, предотвращая любые несоответствия в базе данных.
20. Что означают термины «нормализация» и «денормализация»?
Процесс нормализации включает разбиение данных на множество таблиц для уменьшения избыточности. Нормализация приводит к большему использованию дискового пространства и упрощает сохранение целостности базы данных.
Денормализация — это противоположность нормализации, поскольку она объединяет нормализованные таблицы в одну для ускорения извлечения данных. Переворачивая нормализацию, операция JOIN позволяет нам получить денормализованное представление данных.
21. Опишите разделение базы данных и его значение.
Логическая база данных разделяется на отдельные автономные объекты в процессе разделения данных, что повышает доступность, производительность и управляемость.
Ниже приведены некоторые причины важности секционирования базы данных:
- Повышает эффективность запросов
- Позволяет вам получить доступ к значительным частям определенного раздела
- Данные можно хранить в медленном недорогом хранилище.
22. Что для вас означают термины «упреждающий», «ретроактивный» и «одновременное обновление»?
Упреждающее обновление: перед тем, как база данных вступит в силу в реальном мире, в нее вносятся эти корректировки.
Ретроактивное обновление: после того, как база данных заработает в реальном мире, в нее вносятся эти ретроактивные модификации.
Одновременное обновление: эти изменения вносятся в базу данных в тот самый момент, когда они вступают в силу в реальном мире.
23. Что для вас означает термин «курсор»? Опишите различные виды курсоров.
Курсор — это объект базы данных, который упрощает построчную обработку данных и представляет набор результатов.
Вот несколько видов курсоров:
- Неявный курсор: этот тип курсора объявляется немедленно, как только выполняется SQL. В этом случае пользователь не информируется об объявлении курсора.
- Явный курсор: поскольку он обрабатывает запрос в нескольких строках, этот вид курсора описывается PL/SQL.
24. Опишите различия между сетевой и иерархической моделями баз данных.
Данные организованы в узлы, что напоминает дерево в парадигме иерархической базы данных. К узлу может быть присоединен только один родительский узел.
В результате данные этой модели имеют соединение «один ко многим». Объектный подход документа (DOM), который часто используется в веб-браузерах, является ярким примером этой модели.
Улучшенным вариантом иерархической модели является модель сетевой базы данных. В этом случае данные устроены аналогично дереву. Однако один дочерний узел может быть связан с несколькими родительскими узлами.
В результате между узлами данных возникает связь «многие ко многим». Сетевые базы данных включают интегрированное хранилище данных (IDS) и IDMS (интегрированная система управления базами данных).
25. Опишите MongoDB.
MongoDB — это нереляционная неструктурированная база данных с открытым исходным кодом. Ваши данные хранятся в коллекциях, состоящих из отдельных документов в нашей базе данных, ориентированной на документы.
Документ в MongoDB — это большой объект JSON без определенной структуры или синтаксиса. Документы JSON представлены MongoDB в двоичном формате, называемом BSON.
26. Опишите различия между двухуровневой и трехуровневой системой СУБД.
Термин «двухуровневая архитектура» относится к архитектуре клиент-сервер, в которой приложения, работающие на клиентах, напрямую взаимодействуют с базами данных, работающими на серверах, без использования какого-либо промежуточного программного обеспечения.
Трехуровневый дизайн включает дополнительный уровень между клиентом и сервером, чтобы предложить пользователям графический пользовательский интерфейс и сделать систему более безопасной и доступной. В этой форме дизайна клиентское приложение взаимодействует с серверным приложением, которое затем взаимодействует с системой базы данных.
27. Что означает термин «хеширование» в базе данных?
Строка символов хэшируется в ключ или значение, которое представляет исходную строку, но часто имеет фиксированную меньшую длину. Поскольку поиск элемента с использованием более короткого хэш-ключа, чем исходное значение, выполняется быстрее, хеширование используется для индексации и извлечения объектов в базах данных.
28. Какую роль в СУБД выполняет администратор базы данных?
Администратор базы данных (DBA) выполняет следующие важные роли в СУБД:
- Настройка и установка баз данных
- Перенос данных
- Оценка эффективности
- Планирование и реализация мер безопасности
- Восстановление и хранение данных
- УСТРАНЕНИЕ НЕПОЛАДОК
Заключение
Сборник вопросов и ответов для интервью с СУБД был предоставлен в качестве справочного материала, чтобы потенциальные кандидаты могли быстро и легко понять эти вопросы.
В заключение мы проанализировали самые популярные вопросы интервью по СУБД, которые часто задают в организациях.
Оставьте комментарий