Πίνακας περιεχομένων[Κρύβω][Προβολή]
Μπορεί να είναι λίγο δύσκολο να λάβετε υπόψη όλες τις διαθέσιμες υπηρεσίες και αρχιτεκτονικές επιλογές όταν σκέφτεστε τις πλατφόρμες δεδομένων.
Μια εταιρική πλατφόρμα δεδομένων αποτελείται συχνά από αποθήκες δεδομένων, μοντέλα δεδομένων, λίμνες δεδομένων και αναφορές, το καθένα με συγκεκριμένο σκοπό και ένα σύνολο απαιτούμενων δεξιοτήτων. Αντίθετα, ένα νέο σχέδιο που ονομάζεται data lakehouse έχει εμφανιστεί τα τελευταία χρόνια.
Η ευελιξία των λιμνών δεδομένων και της διαχείρισης δεδομένων αποθήκης δεδομένων συνδυάζονται σε μια επαναστατική αρχιτεκτονική αποθήκευσης δεδομένων που ονομάζεται "data lakehouse".
Θα εξετάσουμε το data lakehouse σε βάθος σε αυτήν την ανάρτηση, συμπεριλαμβανομένων των στοιχείων, των χαρακτηριστικών, της αρχιτεκτονικής και άλλων πτυχών του.
Τι είναι το Data Lakehouse;
Όπως υποδηλώνει το όνομα, ένα data lakehouse είναι ένας νέος τύπος αρχιτεκτονικής δεδομένων που συνδυάζει μια λίμνη δεδομένων με μια αποθήκη δεδομένων για να λύσει τις ελλείψεις του καθενός ξεχωριστά.
Στην ουσία, το σύστημα lakehouse χρησιμοποιεί φθηνή αποθήκευση για να διατηρεί τεράστιες ποσότητες δεδομένων στην αρχική τους μορφή, όπως και οι λίμνες δεδομένων. Η προσθήκη του επιπέδου μεταδεδομένων στην κορυφή του καταστήματος παρέχει επίσης δομή δεδομένων και ενισχύει εργαλεία διαχείρισης δεδομένων όπως αυτά που βρίσκονται στις αποθήκες δεδομένων.
Αποθηκεύει τους τεράστιους όγκους οργανωμένων, ημιδομημένων και μη δομημένων δεδομένων που λαμβάνουν από τις διάφορες επιχειρηματικές εφαρμογές, συστήματα και gadget που χρησιμοποιούνται σε όλη την επιχείρησή τους.
Τις περισσότερες φορές, οι λίμνες δεδομένων χρησιμοποιούν υποδομή αποθήκευσης χαμηλού κόστους με διεπαφή προγραμματισμού εφαρμογών αρχείων (API) για την αποθήκευση δεδομένων σε ανοιχτές, γενικές μορφές αρχείων.
Αυτό δίνει τη δυνατότητα σε πολλές ομάδες να έχουν πρόσβαση σε όλα τα δεδομένα της εταιρείας μέσω ενός ενιαίου συστήματος για μια ποικιλία πρωτοβουλιών, όπως η επιστήμη δεδομένων, μάθηση μηχανήςκαι επιχειρηματική ευφυΐα.
Χαρακτηριστικά
- Χαμηλό κόστος αποθήκευσης. Ένα data lakehouse πρέπει να μπορεί να αποθηκεύει δεδομένα σε φθηνή αποθήκευση αντικειμένων, όπως π.χ Google Cloud Storage, Azure Blob Storage, Amazon Simple Storage Service ή εγγενώς χρησιμοποιώντας ORC ή Parquet.
- Δυνατότητα βελτιστοποίησης δεδομένων: Η βελτιστοποίηση διάταξης δεδομένων, η προσωρινή αποθήκευση και η ευρετηρίαση είναι μερικά παραδείγματα του τρόπου με τον οποίο ένα data lakehouse πρέπει να είναι σε θέση να βελτιστοποιεί τα δεδομένα διατηρώντας την αρχική μορφή των δεδομένων.
- Ένα επίπεδο μεταδεδομένων συναλλαγών: Εκτός από τη βασική αποθήκευση χαμηλού κόστους, αυτό επιτρέπει δυνατότητες διαχείρισης δεδομένων που είναι ζωτικής σημασίας για την απόδοση της αποθήκης δεδομένων.
- Υποστήριξη για το Declarative DataFrame API: Η πλειονότητα των εργαλείων τεχνητής νοημοσύνης μπορεί να χρησιμοποιήσει DataFrames για να ανακτήσει δεδομένα αποθήκευσης ακατέργαστων αντικειμένων. Η υποστήριξη για το Declarative DataFrame API αυξάνει την ικανότητα δυναμικής βελτίωσης της παρουσίασης και της δομής των δεδομένων ως απόκριση σε συγκεκριμένη εργασία επιστήμης δεδομένων ή τεχνητής νοημοσύνης.
- Υποστήριξη για συναλλαγές ACID: Το ακρωνύμιο ACID, το οποίο σημαίνει ατομικότητα, συνέπεια, απομόνωση και ανθεκτικότητα, είναι ένα κρίσιμο στοιχείο για τον ορισμό μιας συναλλαγής και τη διασφάλιση της συνέπειας και της αξιοπιστίας των δεδομένων. Τέτοιες συναλλαγές ήταν προηγουμένως δυνατές μόνο σε αποθήκες δεδομένων, αλλά το Το lakehouse προσφέρει τη δυνατότητα χρήσης τους με λίμνες δεδομένων επισης. Με πολλές σωλήνες δεδομένων, συμπεριλαμβανομένων των ταυτόχρονων αναγνωσμένων και εγγραφής δεδομένων, αυτό επιλύει το πρόβλημα της χαμηλής ποιότητας δεδομένων των τελευταίων.
Στοιχεία του Data Lakehouse
Η αρχιτεκτονική του data lakehouse χωρίζεται σε δύο κύριες βαθμίδες σε υψηλό επίπεδο. Η πρόσληψη δεδομένων του στρώματος αποθήκευσης ελέγχεται από την πλατφόρμα Lakehouse (δηλαδή, τη λίμνη δεδομένων).
Χωρίς να χρειάζεται να φορτώσει τα δεδομένα σε μια αποθήκη δεδομένων ή να τα μετατρέψει σε ιδιόκτητη μορφή, το επίπεδο επεξεργασίας μπορεί στη συνέχεια να αναζητήσει τα δεδομένα στο επίπεδο αποθήκευσης απευθείας χρησιμοποιώντας μια σειρά εργαλείων.
Στη συνέχεια, οι εφαρμογές BI, καθώς και οι τεχνολογίες AI και ML, μπορούν να χρησιμοποιήσουν τα δεδομένα. Τα οικονομικά μιας λίμνης δεδομένων παρέχονται από αυτόν τον σχεδιασμό, αλλά επειδή κάθε μηχανή επεξεργασίας μπορεί να διαβάσει αυτά τα δεδομένα, οι επιχειρήσεις έχουν την ελευθερία να κάνουν τα προετοιμασμένα δεδομένα προσβάσιμα για ανάλυση από μια σειρά συστημάτων. Η απόδοση και το κόστος του επεξεργαστή μπορούν να βελτιωθούν με τη χρήση αυτής της μεθόδου για επεξεργασία και ανάλυση.
Λόγω της υποστήριξής της για συναλλαγές βάσης δεδομένων που συμμορφώνονται με τα ακόλουθα κριτήρια ACID (ατομικότητα, συνέπεια, απομόνωση και ανθεκτικότητα), η αρχιτεκτονική επιτρέπει επίσης σε πολλά μέρη να έχουν πρόσβαση και να γράφουν δεδομένα ταυτόχρονα εντός του συστήματος:
- Ατομικότητα αναφέρεται στο γεγονός ότι είτε η πλήρης συναλλαγή είτε καμία από αυτήν, πετυχαίνει κατά την ολοκλήρωση μιας συναλλαγής. Σε περίπτωση που μια διαδικασία διακοπεί, αυτό βοηθά στην αποφυγή απώλειας ή καταστροφής δεδομένων.
- Συνοχή εγγυάται ότι οι συναλλαγές πραγματοποιούνται με προβλέψιμο και συνεπή τρόπο. Διατηρεί την ακεραιότητα των δεδομένων διασφαλίζοντας ότι όλα τα δεδομένα είναι νόμιμα σύμφωνα με προκαθορισμένους κανόνες.
- Απομόνωση διασφαλίζει ότι, μέχρι να ολοκληρωθεί, καμία συναλλαγή δεν μπορεί να επηρεαστεί από οποιαδήποτε άλλη συναλλαγή εντός του συστήματος. Αυτό επιτρέπει σε πολλά μέρη να διαβάζουν και να γράφουν από το ίδιο σύστημα ταυτόχρονα χωρίς να παρεμβαίνουν μεταξύ τους.
- Αντοχή εγγυάται ότι οι αλλαγές στα δεδομένα ενός συστήματος συνεχίζουν να υπάρχουν μετά την ολοκλήρωση μιας συναλλαγής, ακόμη και σε περίπτωση αποτυχίας του συστήματος. Οποιεσδήποτε αλλαγές προκύψουν από μια συναλλαγή διατηρούνται στο αρχείο για πάντα.
Data Lakehouse Architecture
Η Databricks (ο καινοτόμος και σχεδιαστής της ιδέας Delta Lake) και η AWS είναι οι δύο κύριοι υποστηρικτές της ιδέας ενός data lakehouse. Θα βασιστούμε λοιπόν στη γνώση και τη διορατικότητά τους για να περιγράψουμε την αρχιτεκτονική διάταξη των λιμνών σπιτιών.
Ένα σύστημα lakehouse δεδομένων θα έχει συνήθως πέντε επίπεδα:
- Στρώμα κατάποσης
- Στρώμα αποθήκευσης
- Επίπεδο μεταδεδομένων
- Επίπεδο API
- Στρώμα κατανάλωσης
Στρώμα κατάποσης
Το πρώτο επίπεδο του συστήματος είναι υπεύθυνο για τη συλλογή δεδομένων από διάφορες πηγές και την αποστολή τους στο επίπεδο αποθήκευσης. Το επίπεδο μπορεί να χρησιμοποιήσει πολλά πρωτόκολλα για να συνδεθεί με πολλές εσωτερικές και εξωτερικές πηγές, συμπεριλαμβανομένου του συνδυασμού δυνατοτήτων επεξεργασίας δεδομένων δέσμης και ροής, όπως π.χ.
- NoSQL βάσεις δεδομένων,
- κοινόχρηστα αρχεία
- εφαρμογές CRM,
- ιστότοποι,
- αισθητήρες IoT,
- μεσα ΚΟΙΝΩΝΙΚΗΣ ΔΙΚΤΥΩΣΗΣ,
- Εφαρμογές λογισμικού ως υπηρεσίας (SaaS) και
- συστήματα διαχείρισης σχεσιακών βάσεων δεδομένων κ.λπ.
Σε αυτό το σημείο, μπορούν να χρησιμοποιηθούν στοιχεία όπως το Apache Kafka για ροή δεδομένων και η Amazon Data Migration Service (Amazon DMS) για την εισαγωγή δεδομένων από βάσεις δεδομένων RDBMS και NoSQL.
Στρώμα αποθήκευσης
Η αρχιτεκτονική lakehouse προορίζεται να επιτρέπει την αποθήκευση διαφόρων τύπων δεδομένων ως αντικείμενα σε φθηνά καταστήματα αντικειμένων, όπως το AWS S3. Χρησιμοποιώντας ανοιχτές μορφές αρχείων, τα εργαλεία πελάτη μπορούν στη συνέχεια να διαβάσουν αυτά τα στοιχεία απευθείας από το κατάστημα.
Αυτό επιτρέπει σε πολλά API και στοιχεία επιπέδου κατανάλωσης να έχουν πρόσβαση και να χρησιμοποιούν τα ίδια δεδομένα. Το επίπεδο μεταδεδομένων αποθηκεύει τα σχήματα για δομημένα και ημι-δομημένα σύνολα δεδομένων, έτσι ώστε τα στοιχεία να μπορούν να τα εφαρμόσουν στα δεδομένα καθώς τα διαβάζουν.
Η πλατφόρμα Hadoop Distributed File System (HDFS), για παράδειγμα, μπορεί να χρησιμοποιηθεί για τη δημιουργία υπηρεσιών αποθήκευσης cloud που χωρίζουν υπολογιστές και αποθηκευτικούς χώρους εσωτερικής εγκατάστασης. Το Lakehouse είναι ιδανικό για αυτές τις υπηρεσίες.
Επίπεδο μεταδεδομένων
Το επίπεδο μεταδεδομένων είναι το θεμελιώδες στοιχείο ενός χώρου λίμνης δεδομένων που διακρίνει αυτό το σχέδιο. Είναι ένας ενιαίος κατάλογος που προσφέρει μεταδεδομένα (πληροφορίες για άλλα κομμάτια δεδομένων) για όλα τα αντικείμενα που είναι αποθηκευμένα στη λίμνη και επιτρέπει στους χρήστες να χρησιμοποιούν δυνατότητες διαχείρισης όπως:
- Μια συνεπής έκδοση της βάσης δεδομένων φαίνεται από ταυτόχρονες συναλλαγές χάρη στις συναλλαγές ACID.
- προσωρινή αποθήκευση για αποθήκευση αρχείων αποθήκευσης αντικειμένων cloud.
- προσθήκη ευρετηρίων δομών δεδομένων χρησιμοποιώντας ευρετηρίαση για την επιτάχυνση της επεξεργασίας ερωτημάτων.
- χρήση κλωνοποίησης μηδενικού αντιγράφου για την αντιγραφή αντικειμένων δεδομένων. και
- για να αποθηκεύσετε ορισμένες εκδόσεις των δεδομένων, κ.λπ., χρησιμοποιήστε την έκδοση εκδόσεων δεδομένων.
Επιπλέον, το επίπεδο μεταδεδομένων επιτρέπει την υλοποίηση της διαχείρισης σχημάτων, τη χρήση τοπολογιών σχημάτων DW όπως τα σχήματα αστεριών/νιφάδων χιονιού και την παροχή δυνατότητας διαχείρισης δεδομένων και ελέγχου απευθείας στη λίμνη δεδομένων, ενισχύοντας την ακεραιότητα ολόκληρης της γραμμής δεδομένων.
Λειτουργίες για την εξέλιξη και την επιβολή του σχήματος περιλαμβάνονται στη διαχείριση σχημάτων. Με την απόρριψη τυχόν εγγραφών που δεν πληρούν το σχήμα του πίνακα, η επιβολή σχήματος δίνει τη δυνατότητα στους χρήστες να διατηρήσουν την ακεραιότητα και την ποιότητα των δεδομένων.
Η εξέλιξη του σχήματος επιτρέπει την τροποποίηση του τρέχοντος σχήματος του πίνακα για την προσαρμογή των μεταβαλλόμενων δεδομένων. Λόγω μιας ενιαίας διεπαφής διαχείρισης στην κορυφή της λίμνης δεδομένων, υπάρχουν επίσης δυνατότητες ελέγχου πρόσβασης και ελέγχου.
Επίπεδο API
Ένα άλλο κρίσιμο επίπεδο της αρχιτεκτονικής είναι τώρα παρόν, φιλοξενώντας έναν αριθμό API που μπορούν να χρησιμοποιήσουν όλοι οι τελικοί χρήστες για να εκτελούν εργασίες πιο γρήγορα και να λαμβάνουν πιο εξελιγμένα στατιστικά στοιχεία.
Η χρήση των API μεταδεδομένων διευκολύνει τον εντοπισμό και την πρόσβαση στα στοιχεία δεδομένων που απαιτούνται για μια δεδομένη εφαρμογή.
Όσον αφορά τις βιβλιοθήκες μηχανικής μάθησης, ορισμένες από αυτές, όπως το TensorFlow και το Spark MLlib, μπορούν να διαβάσουν ανοιχτές μορφές αρχείων όπως το Parquet και να αποκτήσουν απευθείας πρόσβαση στο επίπεδο μεταδεδομένων.
Ταυτόχρονα, τα DataFrame API προσφέρουν μεγαλύτερες πιθανότητες βελτιστοποίησης, επιτρέποντας στους προγραμματιστές να οργανώνουν και να αλλάζουν τα διασκορπισμένα δεδομένα.
Στρώμα κατανάλωσης
Το Power BI, το Tableau και άλλα εργαλεία και εφαρμογές φιλοξενούνται κάτω από το επίπεδο κατανάλωσης. Με τη σχεδίαση lakehouse, όλα τα μεταδεδομένα και όλα τα δεδομένα που διατηρούνται σε μια λίμνη είναι προσβάσιμα στις εφαρμογές-πελάτες.
Το lakehouse μπορεί να χρησιμοποιηθεί από όλους τους χρήστες σε μια εταιρεία για την εκτέλεση όλων των ειδών λειτουργίες ανάλυσης, συμπεριλαμβανομένης της δημιουργίας πινάκων εργαλείων επιχειρηματικής ευφυΐας και της εκτέλεσης ερωτημάτων SQL και εργασιών μηχανικής εκμάθησης.
Πλεονεκτήματα του Data Lakehouse
Οι οργανισμοί μπορούν να δημιουργήσουν ένα data lakehouse για να ενοποιήσουν την τρέχουσα πλατφόρμα δεδομένων τους και να βελτιστοποιήσουν ολόκληρη τη διαδικασία διαχείρισης δεδομένων. Με την αποσυναρμολόγηση των φραγμών του σιλό που συνδέουν διάφορες πηγές, μια λίμνη δεδομένων μπορεί να αντικαταστήσει την ανάγκη για ξεχωριστές λύσεις.
Σε σύγκριση με επιμελημένες πηγές δεδομένων, αυτή η ενοποίηση παράγει μια σημαντικά πιο αποτελεσματική διαδικασία από άκρο σε άκρο. Αυτό έχει πολλά πλεονεκτήματα:
- Λιγότερη διοίκηση: Αντί να εξάγει δεδομένα από ακατέργαστα δεδομένα και να τα προετοιμάζει για χρήση σε μια αποθήκη δεδομένων, ένα data lakehouse επιτρέπει σε οποιεσδήποτε πηγές που συνδέονται με αυτό να έχουν τα δεδομένα τους διαθέσιμα και οργανωμένα για χρήση.
- Αυξημένη σχέση κόστους-αποτελεσματικότητας: Τα lakehouses δεδομένων κατασκευάζονται χρησιμοποιώντας σύγχρονη υποδομή που χωρίζει τον υπολογισμό και την αποθήκευση, καθιστώντας εύκολη την επέκταση της αποθήκευσης χωρίς αύξηση της υπολογιστικής ισχύος. Μόνο η χρήση της φθηνής αποθήκευσης δεδομένων έχει ως αποτέλεσμα επεκτασιμότητα που είναι οικονομικά αποδοτική.
- Καλύτερη διακυβέρνηση δεδομένων: Τα lakehouses δεδομένων κατασκευάζονται με τυποποιημένη ανοιχτή αρχιτεκτονική, επιτρέποντας περισσότερο έλεγχο της ασφάλειας, των μετρήσεων, της πρόσβασης βάσει ρόλων και άλλων σημαντικών στοιχείων διαχείρισης. Ενοποιώντας πόρους και πηγές δεδομένων, απλοποιούν και ενισχύουν τη διακυβέρνηση.
- Απλοποιημένα πρότυπα: Δεδομένου ότι η σύνδεση ήταν πολύ περιορισμένη τη δεκαετία του 1980, όταν αναπτύχθηκαν για πρώτη φορά οι αποθήκες δεδομένων, τα τοπικά πρότυπα σχημάτων αναπτύχθηκαν συχνά μέσα στις επιχειρήσεις, ακόμη και στα τμήματα. Τα lakehouses δεδομένων κάνουν χρήση του γεγονότος ότι πολλοί τύποι δεδομένων έχουν πλέον ανοιχτά πρότυπα για το σχήμα, απορροφώντας πολλές πηγές δεδομένων με το επικαλυπτόμενο ομοιόμορφο σχήμα για να εξορθολογίσουν τις διαδικασίες.
Μειονεκτήματα του Data Lakehouse
Παρ' όλες τις ταραχές γύρω από τα lakehouses δεδομένων, είναι σημαντικό να έχετε κατά νου ότι η ιδέα είναι ακόμα πολύ νέα. Φροντίστε να σταθμίσετε τα μειονεκτήματα προτού αφοσιωθείτε πλήρως σε αυτό το νέο σχέδιο.
- Μονολιθική δομή: Ο all-inclusive σχεδιασμός ενός lakehouse προσφέρει πολλά πλεονεκτήματα, αλλά δημιουργεί επίσης ορισμένα προβλήματα. Η μονολιθική αρχιτεκτονική συχνά οδηγεί σε κακή εξυπηρέτηση για όλους τους χρήστες και μπορεί να είναι άκαμπτη και δύσκολη στη συντήρηση. Συνήθως, στους αρχιτέκτονες και τους σχεδιαστές αρέσει μια πιο αρθρωτή αρχιτεκτονική που μπορούν να προσαρμόσουν για διάφορες περιπτώσεις χρήσης.
- Η τεχνολογία δεν είναι ακόμα εκεί: ο τελικός στόχος συνεπάγεται σημαντικό όγκο μηχανικής μάθησης και τεχνητής νοημοσύνης. Προτού τα λιμνόσπιτα μπορέσουν να λειτουργήσουν όπως οραματιζόμαστε, αυτές οι τεχνολογίες πρέπει να αναπτυχθούν περαιτέρω.
- Δεν είναι σημαντική πρόοδος σε σχέση με τις υπάρχουσες δομές: Εξακολουθεί να υπάρχει μεγάλος σκεπτικισμός σχετικά με το πόσο μεγαλύτερη αξία θα συνεισφέρουν πραγματικά τα lakehouses. Ορισμένοι επικριτές υποστηρίζουν ότι ένας σχεδιασμός αποθήκης λίμνης σε συνδυασμό με τον κατάλληλο αυτοματοποιημένο εξοπλισμό μπορεί να επιτύχει συγκρίσιμη αποτελεσματικότητα.
Προκλήσεις του Data Lakehouse
Θα μπορούσε να είναι δύσκολο να υιοθετήσετε την τεχνική data lakehouse. Λόγω της πολυπλοκότητας των συστατικών του κομματιών, είναι λάθος να βλέπουμε το data lakehouse ως μια ολοκληρωμένη ιδανική δομή ή «μία πλατφόρμα για όλα», για ένα.
Επιπλέον, λόγω της αυξανόμενης υιοθέτησης των λιμνών δεδομένων, οι επιχειρήσεις θα πρέπει να μεταφέρουν τις τρέχουσες αποθήκες δεδομένων τους σε αυτές, βασιζόμενες μόνο σε μια υπόσχεση επιτυχίας χωρίς αποδεδειγμένο οικονομικό όφελος.
Εάν υπάρχουν προβλήματα καθυστέρησης ή διακοπές κατά τη διάρκεια της διαδικασίας μεταφοράς, αυτό μπορεί να καταλήξει να είναι ακριβό, χρονοβόρο και ίσως μη ασφαλές.
Οι επιχειρησιακοί χρήστες πρέπει να υιοθετήσουν εξαιρετικά εξειδικευμένες τεχνολογίες, σύμφωνα με ορισμένους προμηθευτές που εμπορεύονται ρητά ή σιωπηρά λύσεις ως κέντρα δεδομένων. Αυτά μπορεί να μην λειτουργούν πάντα με άλλα εργαλεία που συνδέονται με τη λίμνη δεδομένων στο κέντρο του συστήματος, γεγονός που προσθέτει προβλήματα.
Επιπλέον, μπορεί να είναι δύσκολο να παρέχετε αναλυτικά στοιχεία 24/7, ενώ εκτελείτε κρίσιμους φόρτους εργασίας για τις επιχειρήσεις, κάτι που απαιτεί υποδομή με οικονομική επεκτασιμότητα.
Συμπέρασμα
Η νεότερη ποικιλία κέντρων δεδομένων τα τελευταία χρόνια είναι το data lakehouse. Ενσωματώνει ποικίλα πεδία, όπως τεχνολογία πληροφοριών, λογισμικό ανοιχτού κώδικα, cloud computingκαι κατανεμημένα πρωτόκολλα αποθήκευσης.
Επιτρέπει στις επιχειρήσεις να αποθηκεύουν κεντρικά όλα τα είδη δεδομένων από οποιαδήποτε τοποθεσία, απλοποιώντας τη διαχείριση και την ανάλυση. Το Data Lakehouse είναι μια αρκετά ενδιαφέρουσα ιδέα.
Οποιαδήποτε εταιρεία θα είχε ένα σημαντικό ανταγωνιστικό πλεονέκτημα εάν είχε πρόσβαση σε μια πλατφόρμα δεδομένων all-in-one που ήταν τόσο γρήγορη και αποτελεσματική όσο μια αποθήκη δεδομένων, ενώ ταυτόχρονα θα ήταν τόσο ευέλικτη όσο μια λίμνη δεδομένων.
Η ιδέα εξακολουθεί να αναπτύσσεται και παραμένει σχετικά νέα. Ως αποτέλεσμα, μπορεί να χρειαστεί λίγος χρόνος για να καθοριστεί εάν κάτι μπορεί να γίνει ευρέως διαδεδομένο ή όχι.
Όλοι θα πρέπει να είμαστε περίεργοι για την κατεύθυνση που οδεύει η αρχιτεκτονική του Lakehouse.
Αφήστε μια απάντηση