Obsah[Skryť][Šou]
- 1. Čo rozumiete pod pojmom Databáza?
- 2. Čo rozumiete pod pojmom DBMS?
- 3. Vysvetlite rôzne jazyky DBMS.
- 4. Uveďte niekoľko výhod DBMS?
- 5. Uveďte nevýhody konvenčných súborových systémov, ktoré majú DBMS.
- 6. Čo rozumiete pod pojmom ACID vlastnosti v DBMS?
- 7. Akú úlohu má SQL v DBMS?
- 8. Počítajú sa prázdne miesta alebo nuly ako hodnoty NULL v databázach?
- 9. Čo je to vlastne dátové sklady?
- 10. Čo znamená kontrolný bod DBMS?
- 11. Popíšte rôzne vrstvy abstrakcie údajov DBMS.
- 12. Čo pre vás znamená „optimalizácia dopytov“?
- 13. Modelovanie vzťahov entít: čo to je?
- 14. Čo znamenajú frázy „entita“, „typ entity“ a „množina entít“ v systéme riadenia databázy?
- 15. Čo sú spojenia a aké druhy vzťahov existujú v DBMS?
- 16. Čo je to vlastne RDBMS?
- 17. Čo znamenajú pojmy „zámer“ a „predĺženie“ v databáze?
- 18. Aké sú mnohé metódy normalizácie a čo znamená pojem „normalizácia“?
- 19. Opíšte zámok. Mal by sa vysvetliť hlavný rozdiel medzi zdieľaným zámkom a výhradným zámkom počas transakcie databázy.
- 20. Čo znamenajú pojmy „normalizácia“ a „denormalizácia“?
- 21. Opíšte rozdelenie databázy a jeho význam.
- 22. Čo pre vás znamenajú pojmy „proaktívna“, „retroaktívna“ a „súčasná aktualizácia“?
- 23. Čo pre vás znamená pojem „kurzor“? Popíšte rôzne druhy kurzorov.
- 24. Popíšte variácie medzi sieťovými a hierarchickými databázovými modelmi.
- 25. Popíšte MongoDB.
- 26. Opíšte variácie medzi 2-vrstvovým a 3-vrstvovým systémom DBMS.
- 27. Čo v databáze znamená pojem „hašovanie“?
- 28. Akú úlohu má správca databázy v DBMS?
- záver
Údaje možno nájsť kdekoľvek na svete! Na dnešnom trhu sa každý deň vyprodukuje viac ako 2.5 bilióna bajtov dát.
Je nevyhnutné, aby sme tieto údaje analyzovali a poskytli požadované výsledky pomocou systémov správy databáz (DBMS). Na druhej strane znalosť DBMS umožňuje pracovať ako správca databázy.
Vzhľadom na to, že čítate tento príspevok o otázkach na pohovor DBMS, predpokladám, že tieto podrobnosti už poznáte. Akákoľvek profesia v dátovej analytike musí začať dôkladným pochopením systémov správy databáz (DBMS).
Budovanie efektívnych databázových systémov vyžaduje schopnosť organizovať, hodnotiť, prechádzať a dávať zmysel obrovským objemom údajov.
Tu je niekoľko otázok na pohovore DBMS, ktoré vám pomôžu uspieť na ďalšom pracovnom pohovore a získať pozíciu, o ktorej ste snívali, či už ste kariéru v analytike údajov začali alebo len začínate.
Najlepšie otázky na pohovore DBMS boli zhromaždené do zoznamu pre váš prospech, aby vám pomohli zvládnuť pohovor a upevnili vaše pochopenie predmetu.
1. Čo rozumiete pod pojmom Databáza?
Databáza je logicky štruktúrovaný súbor údajov, ktorý možno ľahko aktualizovať, pristupovať a udržiavať. Čokoľvek vygenerované príkazom create je databázový objekt a databázy často obsahujú kolekcie tabuliek alebo objektov, ktoré majú položky a polia.
Jeden záznam v tabuľke je reprezentovaný n-ticou alebo riadkom. Základné časti ukladania údajov, ktoré poskytujú podrobnosti o konkrétnom aspekte tabuľky, sú atribút alebo stĺpec.
DBMS získava údaje z databázy pomocou užívateľom poskytnutých dotazov.
2. Čo rozumiete pod pojmom DBMS?
DBMS sú softvérové programy, ktoré vám pomáhajú pri vytváraní a správe logicky prepojených údajov.
Inými slovami, systém správy databáz (DBMS) nám poskytuje rozhranie alebo nástroj na vykonávanie rôznych operácií vrátane vytvárania databázy, pridávania údajov do nej, odstraňovania, zmeny údajov atď.
Softvér nazývaný systém správy databáz (DBMS) umožňuje ukladanie údajov bezpečnejším spôsobom ako systém založený na súboroch.
3. Vysvetlite rôzne jazyky DBMS.
Nasledujú niektoré z jazykov, ktoré používajú DBMS:
- DDL (Data Definition Language): Obsahuje inštrukcie potrebné na definovanie databázy. CREATE, ALTER, DROP, TRUNCATE, RENAME atď. je niekoľko príkladov.
- DML (Data Manipulation Language): Obsahuje príkazy potrebné na prácu s údajmi v databáze. Príklady zahŕňajú SELECT, UPDATE, INSERT, DELETE atď.
- DCL (Data Control Language): Zahŕňa príkazy, ktoré sú potrebné na riešenie používateľských oprávnení a ovládacích prvkov databázového systému. Napríklad GRANT a REVOKE.
- TCL (Jazyk riadenia transakcií): Obsahuje príkazy, ktoré sa musia použiť na riadenie databázových transakcií. Napríklad COMMIT, ROLLBACK a SAVEPOINT.
4. Uveďte niekoľko výhod DBMS?
- Je možné, aby si viacero používateľov vymieňalo údaje z tej istej databázy naraz. Okrem toho tento druh zdieľania umožňuje používateľom rýchlo reagovať na zmeny v databázovom prostredí.
- Viacerí používatelia môžu súčasne prezerať údaje tej istej databázy.
- znižuje duplicitu v databáze zavedením systému, ktorý zjednocuje všetky údaje do jednej databázy.
- V prípade potreby je možné údaje v databáze obnoviť a naprogramovať automatické vytváranie zálohy údajov.
- Umožňuje úpravu formátu údajov pri zachovaní zloženia všetkých spustených aplikačných procesov.
5. Uveďte nevýhody konvenčných súborových systémov, ktoré majú DBMS.
Sme nútení skenovať každú stránku v typickom súborovom systéme, pretože neexistuje žiadne indexovanie, čo robí prístup k obsahu časovo náročným a pomalým.
Ďalším problémom sú redundancia a nekonzistentnosť, pretože súbory často obsahujú nadbytočné a duplicitné údaje a zmena jedného z nich spôsobuje, že sú všetky nekonzistentné.
Prístup k údajom je náročnejší v prípade tradičných súborových systémov, pretože údaje sú neusporiadané. Ďalšou nevýhodou je chýbajúca kontrola súbežnosti, ktorá bráni mnohým operáciám pracovať na rovnakom súbore súčasne a namiesto toho núti jednu akciu na uzamknutie celej stránky.
Systémy správy databáz tiež vyriešili problémy s tradičnými systémami založenými na súboroch vrátane kontroly integrity, separácie údajov, atomicity, bezpečnosti a ďalších.
6. Čo rozumiete pod pojmom ACID vlastnosti v DBMS?
Základné pokyny, ktoré sa musia dodržiavať, aby sa zachovala integrita údajov, sú ACID charakteristiky systému správy databáz. Toto sú:
- Atomicita – Tiež označovaná ako princíp „všetko alebo nič“, atomicita zastáva názor, že každé hodnotenie jedinej jednotky sa buď úplne alebo vôbec nevykoná.
- Konzistencia: Táto vlastnosť ukazuje, že údaje v databáze sú konštantné pred každou transakciou aj po nej.
- Izolácia – Táto vlastnosť definuje, že v rovnakom čase môže prebiehať veľa transakcií.
- Trvanlivosť – Táto vlastnosť zabezpečuje, že každá transakcia sa po dokončení zaznamená do energeticky nezávislej pamäte.
7. Akú úlohu má SQL v DBMS?
SQL je skratka pre Structured Query Language a jeho hlavnou funkciou je interakcia s relačnými databázami zadávaním a aktualizáciou/úpravou údajov.
8. Počítajú sa prázdne miesta alebo nuly ako hodnoty NULL v databázach?
Nie, hodnota NULL je úplne odlišná od nuly a prázdneho miesta, pretože označuje hodnotu, ktorá je priradená, neznáma, nedostupná alebo nerelevantná, na rozdiel od medzier a nuly, z ktorých každý predstavuje znak.
9. Čo je to vlastne dátové sklady?
Dátové sklady sú procesom zhromažďovania, extrakcie, spracovania a importu údajov z viacerých zdrojov s cieľom ich uloženia do jednej databázy.
Dátový sklad možno považovať za centrálne úložisko, kde sa údaje využívajú na analýzu údajov a toky z transakčných systémov a iných relačných databáz.
A dátový sklad obsahuje celý rad historických údajov z organizácie, ktoré sa používajú na zlepšenie rozhodovania v rámci spoločnosti.
10. Čo znamená kontrolný bod DBMS?
Metóda Checkpoint vymaže všetky predchádzajúce protokoly zo systému a natrvalo ich uloží na úložné zariadenie.
Dve techniky, ktoré môžu pomôcť DBMS obnoviť a zachovať vlastnosti ACID, zahŕňajú zachovanie tieňových stránok a vedenie denníka o každej transakcii. Kontrolné body sú dôležité pre mechanizmus obnovy založený na protokoloch.
Záznam protokolu transakcií možno použiť na obnovenie všetkých potvrdených údajov až do času zlyhania z kontrolných bodov, čo sú minimálne body, z ktorých sa môže databázový nástroj po zlyhaní zotaviť.
11. Popíšte rôzne vrstvy abstrakcie údajov DBMS.
Abstrakcia údajov skrýva nedôležité informácie pred používateľom, aby sa podporila hladšia interakcia. Existujú tri vrstvy abstrakcie:
- Fyzická úroveň: Najmenšia úroveň abstrakcie popisuje fyzické ukladanie údajov v pamäti. Na prístup k údajom možno použiť metódy sekvenčného aj náhodného prístupu. Na usporiadanie súborov sa používajú stromy B+ a hašovacie techniky.
- Logická úroveň: Úroveň, kde sa údaje uchovávajú vo forme tabuliek. Okrem toho sa základné štruktúry používajú na uloženie spojení medzi rôznymi prvkami.
- Úroveň zobrazenia: Je to najvyššia úroveň abstrakcie. Používatelia majú k dispozícii iba časť skutočnej databázy, ktorú predstavujú riadky a stĺpce. Sú mysliteľné viaceré pohľady na rovnakú databázu. Používatelia nie sú informovaní o špecifikách ukladania a implementácie.
12. Čo pre vás znamená „optimalizácia dopytov“?
Krok optimalizácie dotazu nájde stratégiu hodnotenia s najnižšími projektovanými nákladmi. Táto fáza sa stáva relevantnou, keď je k dispozícii niekoľko algoritmov a techník na riešenie rovnakého problému.
Nasledujú niektoré výhody optimalizácie dopytov:
- Výstup sa dodáva rýchlejšie
- Znižuje zložitosť času a priestor
- Viac dopytov je možné spracovať v kratšom čase.
13. Modelovanie vzťahov entít: čo to je?
Táto metóda návrhu databázy používa diagramy na zobrazenie skutočných položiek v reálnom svete ako entity a zobrazenie ich vzťahov. Táto metóda uľahčuje tímu DBA pochopenie schémy.
14. Čo znamenajú frázy „entita“, „typ entity“ a „množina entít“ v systéme riadenia databázy?
Entita: Položka reálneho sveta sa považuje za entitu, ak má vlastnosti, ktoré zodpovedajú jej špecifickým atribútom. Napríklad študent, zamestnanec alebo učiteľ symbolizuje entitu.
Typ entity: Typ entity je opísaný ako skupina entít s podobnými charakteristikami. Typ entity je reprezentovaný jednou alebo viacerými prepojenými tabuľkami v databáze. Typ entity alebo atribúty je možné považovať za vlastnosť, ktorá špecificky identifikuje entitu. Študent napríklad symbolizuje objekt s charakteristikami, ako je ID študenta, meno študenta atď.
Množina entít: Všetky entity v databáze, ktoré patria do určitého typu entít, sú zhromaždené ako množina entít. Napríklad množina entít je zbierka všetkých študentov, zamestnancov, učiteľov atď.
15. Čo sú spojenia a aké druhy vzťahov existujú v DBMS?
V DBMS je vzťah situácia, v ktorej sú dve entity navzájom prepojené. V tomto prípade má tabuľka cudzích kľúčov odkaz na primárny kľúč druhej tabuľky.
Nasledujúci zoznam obsahuje množstvo typov vzťahov, ktoré sa nachádzajú v DBMS:
- Vzťah jeden k jednému: Tento výraz sa používa na opis vzťahu medzi jedným riadkom v tabuľke A a jedným riadkom v tabuľke B.
- Vzťah jeden k mnohým: Používa sa, keď existuje vzťah medzi jedným riadkom v tabuľke A a mnohými riadkami v tabuľke B.
- Vzťah veľa k mnohým – používa sa, keď je možné spojiť veľký počet riadkov v tabuľke A s veľkým počtom riadkov v tabuľke B.
- Self-Referencing Relationship – používa sa, keď je záznam v tabuľke A spojený s iným záznamom v tej istej tabuľke.
16. Čo je to vlastne RDBMS?
RDBMS, alebo relačné databázové systémy, je skratka pre tieto systémy. Používa sa na sledovanie indexov tabuliek a dátových záznamov.
RDBMS sú podmnožinou systémov správy databáz, ktoré používajú štruktúru na vyhľadávanie a získavanie informácií o iných databázových objektoch. Systém správy relačných databáz (RDBMS) uľahčuje aktualizáciu, vkladanie, odstraňovanie, úpravu a správu relačnej databázy.
Väčšinu času používa RDBMS jazyk SQL, pretože je užívateľsky prívetivý a pravidelne používaný.
17. Čo znamenajú pojmy „zámer“ a „predĺženie“ v databáze?
Hlavný rozdiel medzi zámerom a rozšírením v databáze je nasledujúci:
Zámer: Zámer, niekedy označovaný ako databázová schéma, sa používa na opis popisu databázy. Vzniká počas výstavby databázy a väčšinou sa nemení.
Rozšírenie: Na druhej strane rozšírenie je meranie celkového počtu n-tic v databáze v ľubovoľnom čase. Keď sa v databáze vytvoria, upravia alebo odstránia n-tice, hodnota rozšírenia, známa aj ako snímka databázy, sa neustále mení.
18. Aké sú mnohé metódy normalizácie a čo znamená pojem „normalizácia“?
Normalizácia je proces štruktúrovania údajov, aby sa zabránilo duplicite a redundancii údajov. Niekoľko normalizačných stupňov nasleduje po sebe a označujeme ich ako normálne formy. Nasledujúce typické formy sú na sebe závislé.
Prvé tri normálne formy sú nasledovné.
NF-1, alebo First Normal Form, riadky bez opakovaných zoskupení
2NF znamená Second Normal Form. Každá hodnota podporného (nekľúčového) stĺpca závisí od celého hlavného kľúča.
Three-Normal-Form (3NF) je závislý iba od primárneho kľúča a nezávisí od žiadnych iných podporných (nekľúčových) hodnôt stĺpca.
Okrem nich máte aj vyššie normálne formy, ako je BCNF.
BNCF – Sofistikovanejší a náročnejší variant 3NF sa označuje ako 3.5NF. Tabuľka by mala byť v 3NF a dodržiavať pravidlo BCNF, že A by malo byť superkľúčom tabuľky pre akúkoľvek funkčnú závislosť A->B.
19. Opíšte zámok. Mal by sa vysvetliť hlavný rozdiel medzi zdieľaným zámkom a výhradným zámkom počas transakcie databázy.
Zámok databázy je bezpečnostné opatrenie, ktoré bráni dvom alebo viacerým používateľom databázy aktualizovať zdieľané údaje naraz.
Žiadny iný databázový užívateľ alebo relácia nemôže upravovať údaje, kým sa neuvoľní zámok na konkrétnej databáze, keď jeden užívateľ databázy alebo relácia získa zámok.
Zdieľaný zámok: Čítanie údajovej položky vyžaduje zdieľaný zámok a mnohé transakcie môžu uzamknúť rovnakú údajovú položku pod zdieľaným zámkom. Dátové prvky v zdieľanom zámku môžu byť čítané mnohými transakciami.
Exkluzívny zámok: Každá transakcia, ktorá má vykonať operáciu zápisu, má zámok, známy ako exkluzívny zámok. Táto forma zámku zakazuje viacnásobné transakcie, čím sa zabráni akýmkoľvek nezrovnalostiam v databáze.
20. Čo znamenajú pojmy „normalizácia“ a „denormalizácia“?
Proces normalizácie zahŕňa rozdelenie údajov do mnohých tabuliek, aby sa znížila nadbytočnosť. Normalizácia má za následok väčšie využitie miesta na disku a zjednodušuje zachovanie integrity databázy.
Denormalizácia je opakom normalizácie, pretože spája normalizované tabuľky do jednej tabuľky, aby sa urýchlilo získavanie údajov. Prevrátením normalizácie nám operácia JOIN umožňuje vytvoriť denormalizovanú reprezentáciu údajov.
21. Opíšte rozdelenie databázy a jeho význam.
Logická databáza je rozdelená do samostatných samostatných entít procesom delenia údajov, čo zlepšuje dostupnosť, výkon a spravovateľnosť.
Nasleduje niekoľko dôvodov, prečo je dôležité rozdelenie databázy:
- Zvyšuje efektivitu dopytov
- Umožňuje vám prístup k významným častiam určitého oddielu
- Dáta môžu byť uložené na pomalom a lacnom úložisku.
22. Čo pre vás znamenajú pojmy „proaktívna“, „retroaktívna“ a „súčasná aktualizácia“?
Proaktívna aktualizácia: Predtým, ako databáza nadobudne účinnosť v skutočnom svete, vykonajú sa v nej tieto úpravy.
Spätná aktualizácia: Po uvedení databázy do prevádzky v reálnom svete sa v nej vykonajú tieto spätné úpravy.
Simultánna aktualizácia: Tieto úpravy sa vykonajú v databáze presne v tom istom momente, keď sa prejavia v skutočnom svete.
23. Čo pre vás znamená pojem „kurzor“? Popíšte rôzne druhy kurzorov.
Kurzor je databázový objekt, ktorý uľahčuje manipuláciu s údajmi riadok po riadku a predstavuje množinu výsledkov.
Toto je niekoľko druhov kurzorov:
- Implicitný kurzor: Tento druh kurzora je okamžite deklarovaný hneď po vykonaní SQL. Používateľ v tomto prípade nie je informovaný o deklarácii kurzora.
- Explicitný kurzor: Keďže spracováva dotaz v niekoľkých riadkoch, tento druh kurzora je opísaný v PL/SQL.
24. Popíšte variácie medzi sieťovými a hierarchickými databázovými modelmi.
Údaje sú usporiadané do uzlov v podobe stromu v hierarchickej databázovej paradigme. K uzlu môže byť pripojený iba jeden nadradený uzol.
Výsledkom je, že údaje tohto modelu majú prepojenie typu one-to-many. Vzorovým príkladom tohto modelu je dokumentový objektový prístup (DOM), ktorý sa často používa vo webových prehliadačoch.
Vylepšeným variantom hierarchického modelu je sieťový databázový model. Údaje sú v tomto prípade usporiadané podobne ako strom. Jeden podriadený uzol však môže byť prepojený s niekoľkými nadradenými uzlami.
Výsledkom je, že medzi dátovými uzlami sa vytvorí mnohonásobné prepojenie. Sieťové databázy zahŕňajú Integrated Data Store (IDS) a IDMS (Integrated Database Management System).
25. Popíšte MongoDB.
MongoDB je open source, nerelačná, neštruktúrovaná databáza. Vaše údaje sú uložené v zbierkach zložených z jednotlivých dokumentov v našej databáze orientovanej na dokumenty.
Dokument v MongoDB je veľký objekt JSON bez špecifickej štruktúry alebo syntaxe. Dokumenty JSON sú reprezentované MongoDB v binárne kódovanom formáte nazývanom BSON.
26. Opíšte variácie medzi 2-vrstvovým a 3-vrstvovým systémom DBMS.
Pojem „dvojvrstvová architektúra“ sa vzťahuje na architektúru klient-server, v ktorej aplikácie bežiace na klientoch priamo interagujú s databázami bežiacimi na serveroch bez použitia akéhokoľvek middlewaru.
3-vrstvový dizajn obsahuje ďalšiu vrstvu medzi klientom a serverom, ktorá používateľom ponúka grafické používateľské rozhranie a robí systém bezpečnejším a prístupnejším. Pri tejto forme dizajnu komunikuje aplikácia na strane klienta s aplikáciou na strane servera, ktorá potom hovorí s databázovým systémom.
27. Čo v databáze znamená pojem „hašovanie“?
Reťazec znakov je hašovaný do kľúča alebo hodnoty, ktorá predstavuje pôvodný reťazec, ale často je pevne stanovená na kratšiu dĺžku. Keďže nájdenie položky pomocou kratšieho hašovaného kľúča ako je pôvodná hodnota je rýchlejšie, hašovanie sa používa na indexovanie a získavanie objektov v databázach.
28. Akú úlohu má správca databázy v DBMS?
Správca databázy (DBA) má v DBMS tieto kľúčové úlohy:
- Nastavenie a inštalácia databáz
- Migrácia údajov
- Hodnotenie výkonnosti
- Plánovanie a implementácia bezpečnostných opatrení
- Obnova a ukladanie dát
- Riešenie problémov
záver
Zbierka otázok a odpovedí na pohovor DBMS bola poskytnutá ako referencia, aby potenciálni kandidáti mohli rýchlo a ľahko porozumieť týmto otázkam.
Na záver sme analyzovali najčastejšie otázky týkajúce sa rozhovorov s DBMS, ktoré sa často kladú v organizáciách.
Nechaj odpoveď