טיש פון קאָנטענץ[באַהאַלטן][ווייַזן]
עס קען זיין אַ ביסל שווער צו באַטראַכטן אַלע די בנימצא באַדינונגס און אַרקאַטעקטשעראַל אָפּציעס ווען איר טראַכטן וועגן דאַטן פּלאַטפאָרמס.
אַ פאַרנעמונג דאַטן פּלאַטפאָרמע אָפט באשטייט פון דאַטן ווערכאַוזיז, דאַטן מאָדעלס, דאַטן לאַקעס און ריפּאָרץ, יעדער מיט אַ ספּעציפיש ציל און גאַנג פון סקילז דארף. אין קאַנטראַסט, אַ נייַע פּלאַן גערופן די דאַטן לאַקעהאָוסע איז ימערדזשד אין די לעצטע ביסל יאָרן.
די ווערסאַטילאַטי פון דאַטן לאַקעס און דאַטן ווערכאַוס דאַטן פאַרוואַלטונג זענען קאַמביינד אין אַ רעוואלוציאנער דאַטן סטאָרידזש אַרקאַטעקטשער דאַבד אַ "דאַטאַ לאַקעהאָוסע."
מיר וועלן ונטערזוכן דאַטן לאַקעהאָוסע אין-טיפקייַט אין דעם פּאָסטן, אַרייַנגערעכנט זייַן קאַמפּאָונאַנץ, פֿעיִקייטן, אַרקאַטעקטשער און אנדערע אַספּעקץ.
וואָס איז Data Lakehouse?
ווי דער נאָמען ימפּלייז, אַ דאַטן לאַקעהאָוסע איז אַ נייַע טיפּ פון דאַטן אַרקאַטעקטשער וואָס קאַמביינז אַ דאַטן אָזערע מיט אַ דאַטן ווערכאַוס צו סאָלווע די כיסאָרן פון יעדער סעפּעראַטלי.
אין עסאַנס, די לאַקכאַוס סיסטעם ניצט ביליק סטאָרידזש צו האַלטן מאַסיוו אַמאַונץ פון דאַטן אין זייער אָריגינעל פארמען, פיל ווי דאַטן לאַקעס. אַדינג די מעטאַדאַטאַ שיכטע אויף שפּיץ פון די קראָם אויך גיט דאַטן סטרוקטור און ימפּאַוערז דאַטן פאַרוואַלטונג מכשירים ווי די געפֿונען אין דאַטן ווערכאַוזיז.
עס סטאָרז די ריזיק וואַליומז פון אָרגאַניזירט, האַלב-סטראַקטשערד און אַנסטראַקטשערד דאַטן וואָס זיי באַקומען פֿון די פאַרשידענע געשעפט אַפּלאַקיישאַנז, סיסטעמען און גאַדזשאַץ געניצט איבער זייער אָרגאַניזאַציע.
די מערהייט פון די צייט, דאַטן לאַקעס נוצן נידעריק-פּרייַז סטאָרידזש ינפראַסטראַקטשער מיט אַ טעקע אַפּלאַקיישאַן פּראָגראַממינג צובינד (API) צו קראָם דאַטן אין אָפֿן דזשאַנעריק טעקע פֿאָרמאַטירונגען.
דאָס מאכט עס מעגלעך פֿאַר פילע טימז צו אַקסעס אַלע די פירמע דאַטן דורך אַ איין סיסטעם פֿאַר אַ פאַרשיידנקייַט פון ינישאַטיווז, אַזאַ ווי דאַטן וויסנשאַפֿט, מאַשין וויסן, און געשעפט סייכל.
איינריכטונגען
- נידעריק-פּרייַז סטאָרידזש. א דאַטן לאַקעהאָוסע מוזן זיין ביכולת צו קראָם דאַטן אין ביליק אַבדזשעקץ סטאָרידזש, אַזאַ ווי Google Cloud סטאָרידזש, Azure Blob Storage, Amazon Simple Storage Service, אָדער נייטיוולי ניצן אָרק אָדער פּאַרקיי.
- פיייקייט פֿאַר דאַטן אַפּטאַמאַזיישאַן: דאַטאַ אויסלייג אַפּטאַמאַזיישאַן, קאַטשינג און ינדעקסינג זענען עטלעכע ביישפילן פון ווי אַ דאַטן לאַקעהאָוסע מוזן זיין ביכולת צו אַפּטאַמייז די דאַטן און האַלטן די אָריגינעל פֿאָרמאַט פון דאַטן.
- א שיכטע פון טראַנסאַקטיאָנאַל מעטאַדאַטאַ: אויף שפּיץ פון די יקערדיק נידעריק-קאָסטן סטאָרידזש, דאָס ינייבאַלז דאַטן פאַרוואַלטונג קייפּאַבילאַטיז קריטיש פֿאַר דאַטן ווערכאַוס פאָרשטעלונג.
- שטיצן פֿאַר די דעקלאַראַטיווע דאַטאַפראַמע אַפּי: די מערהייַט פון אַי מכשירים קענען נוצן דאַטאַפראַמעס צו צוריקקריגן רוי אַבדזשעקץ קראָם דאַטן. שטיצן פֿאַר דעקלאַראַטיווע דאַטאַפראַמע אַפּי ינקריסאַז די פיייקייט צו דינאַמיקאַללי פֿאַרבעסערן די פּרעזענטירונג און סטרוקטור פון די דאַטן אין ענטפער צו באַזונדער דאַטן וויסנשאַפֿט אָדער אַי אַרבעט.
- שטיצן פֿאַר אַסיד טראַנזאַקשאַנז: די אַקראַנים ACID, וואָס שטייט פֿאַר אַטאָמיסיטי, קאָנסיסטענסי, אפגעזונדערטקייט און געווער, איז אַ קריטיש קאָמפּאָנענט אין דיפיינינג אַ טראַנסאַקטיאָן און ינשורינג די קאָנסיסטענסי און פאַרלאָזלעך פון דאַטן. אַזאַ טראַנזאַקשאַנז זענען ביז אַהער בלויז מעגלעך אין דאַטן ווערכאַוזיז, אָבער די lakehouse אָפפערס די אָפּציע צו נוצן זיי מיט דאַטן לאַקעס אויך. מיט עטלעכע דאַטן פּייפּליינז אַרייַנגערעכנט קאַנקעראַנט דאַטן לייענט און שרייבט, דאָס ריזאַלווז די פּראָבלעם פון נידעריק דאַטן קוואַליטעט פון די יענער.
עלעמענטן פון דאַטאַ לאַקעהאָוסע
די אַרקאַטעקטשער פון די דאַטן לאַקעהאָוסע איז צעטיילט אין צוויי הויפּט טיערס אויף אַ הויך מדרגה. די דאַטן ינטייק פון די סטאָרידזש שיכטע איז קאַנטראָולד דורך די Lakehouse פּלאַטפאָרמע (ד"ה די דאַטן אָזערע).
אָן נויטיק צו לאָדן די דאַטן אין אַ דאַטן ווערכאַוס אָדער גער עס אין אַ פּראַפּרייאַטערי פֿאָרמאַט, די פּראַסעסינג שיכטע איז ביכולת צו אָנפֿרעג די דאַטן אין די סטאָרידזש שיכטע גלייַך מיט אַ קייט פון מכשירים.
דערנאָך, BI אַפּפּס, ווי געזונט ווי AI און ML טעקנאַלאַדזשיז, קענען נוצן די דאַטן. די עקאָנאָמיק פון אַ דאַטן אָזערע איז צוגעשטעלט דורך דעם פּלאַן, אָבער ווייַל קיין פּראַסעסינג מאָטאָר קענען לייענען די דאַטן, געשעפטן האָבן די פרייהייט צו מאַכן די צוגעגרייט דאַטן צוטריטלעך פֿאַר אַנאַליסיס דורך אַ קייט פון סיסטעמען. פּראַסעסער פאָרשטעלונג און פּרייַז קענען זיין ימפּרוווד דורך ניצן דעם אופֿן פֿאַר פּראַסעסינג און אַנאַליסיס.
רעכט צו זיין שטיצן פֿאַר דאַטאַבייס טראַנזאַקשאַנז וואָס אַדכיר צו די פאלגענדע קרייטיריאַ (אַטאָמיסיטי, קאָנסיסטענסי, אפגעזונדערטקייט און געווער) קרייטיריאַ, די אַרקאַטעקטשער אויך ינייבאַלז פילע פּאַרטיעס צו אַקסעס און שרייַבן דאַטן סיימאַלטייניאַסלי אין די סיסטעם:
- אַטאָמיסיטי רעפערס צו די פאַקט אַז אָדער די פול טראַנסאַקטיאָן אָדער גאָרניט פון עס, סאַקסידז בשעת קאַמפּליטינג אַ טראַנסאַקטיאָן. אין דער געשעעניש אַז אַ פּראָצעס איז ינטעראַפּטיד, דאָס העלפּס ויסמיידן דאַטן אָנווער אָדער קאָרופּציע.
- קאָנסיסטענסי געראַנטיז טראַנזאַקשאַנז פאַלן אין אַ פּרידיקטאַבאַל, קאָנסיסטענט שטייגער. עס מיינטיינז די אָרנטלעכקייַט פון די דאַטן דורך ינשורינג אַז יעדער דאַטן איז לאַדזשיטאַמאַט אין לויט מיט פּרידיטערמינד כּללים.
- אפגעזונדערטקייט ינשורז אַז ביז עס איז פאַרטיק, קיין טראַנסאַקטיאָן קענען זיין ימפּאַקטיד דורך קיין אנדערע טראַנסאַקטיאָן אין די סיסטעם. דאָס אַלאַוז פילע פּאַרטיעס צו לייענען און שרייַבן פון דער זעלביקער סיסטעם סיימאַלטייניאַסלי אָן ינטערפירינג מיט יעדער אנדערער.
- געווער געראַנטיז אַז ענדערונגען צו די דאַטן אין אַ סיסטעם פאָרזעצן צו עקסיסטירן נאָך אַ טראַנסאַקטיאָן איז פאַרטיק, אפילו אין די געשעעניש פון אַ סיסטעם דורכפאַל. קיין אָלטעריישאַנז געפֿירט דורך אַ טראַנסאַקטיאָן זענען געהאלטן אויף טעקע אויף אייביק.
Data Lakehouse Architecture
Databricks (די ינאָוווייטער און דיזיינער פון זייער דעלטאַ לייק באַגריף) און AWS זענען די צוויי הויפּט אַדוואַקאַץ פֿאַר דער באַגריף פון אַ דאַטן לאַקעהאָוסע. מיר וועלן דעריבער פאַרלאָזנ אויף זייער וויסן און ינסייט צו באַשרייַבן די אַרקאַטעקטשעראַל אויסלייג פון לאַכאַוסיז.
א דאַטן לאַקעהאָוסע סיסטעם וועט טיפּיקלי האָבן פינף לייַערס:
- ינדזשעסטשאַן שיכטע
- סטאָרידזש שיכטע
- מעטאַדאַטאַ שיכטע
- אַפּי שיכטע
- קאַנסאַמשאַן שיכטע
ינדזשעסטשאַן שיכטע
דער ערשטער שיכטע פון די סיסטעם איז אין באַשולדיקונג פון קאַלעקטינג דאַטן פון פאַרשידן קוואלן און שיקן עס צו די סטאָרידזש שיכטע. די שיכטע קענען נוצן עטלעכע פּראָטאָקאָלס צו פאַרבינדן צו פילע ינערלעך און פונדרויסנדיק קוואלן, אַרייַנגערעכנט קאַמביינינג פּעקל און סטרימינג דאַטן פּראַסעסינג קייפּאַבילאַטיז, אַזאַ ווי
- NoSQL דאַטאַבייסיז,
- טעקע שאַרעס
- CRM אַפּלאַקיישאַנז,
- וועבסיטעס,
- IoT סענסאָרס,
- social media,
- ווייכווארג ווי אַ סערוויס (SaaS) אַפּלאַקיישאַנז, און
- ריליישאַנאַל דאַטאַבייס פאַרוואַלטונג סיסטעמען, עטק.
אין דעם פונט, קאַמפּאָונאַנץ ווי Apache Kafka פֿאַר דאַטן סטרימינג און Amazon Data Migration Service (Amazon DMS) פֿאַר ימפּאָרטינג דאַטן פֿון RDBMSs און NoSQL דאַטאַבייסיז קענען זיין געוויינט.
סטאָרידזש שיכטע
די לאַקעהאָוסע אַרקאַטעקטשער איז מענט צו געבן די סטאָרידזש פון פאַרשידן טייפּס פון דאַטן ווי אַבדזשעקץ אין ביליק אַבדזשעקץ סטאָרז, אַזאַ ווי AWS S3. ניצן אָפֿן טעקע פֿאָרמאַטירונגען, דער קליענט מכשירים קענען לייענען די זאכן גלייך פֿון די קראָם.
דאָס מאכט עס מעגלעך פֿאַר פילע אַפּיס און קאַנסאַמשאַן שיכטע קאַמפּאָונאַנץ צו אַקסעס און נוצן די זעלבע דאַטן. די מעטאַדאַטאַ שיכטע סטאָרז די סטשעמאַס פֿאַר סטראַקטשערד און האַלב-סטראַקטשערד דאַטאַסעץ אַזוי אַז די קאַמפּאָונאַנץ קענען צולייגן זיי צו די דאַטן ווען זיי לייענען עס.
די Hadoop Distributed File System (HDFS) פּלאַטפאָרמע, פֿאַר בייַשפּיל, קענען זיין געוויינט צו בויען וואָלקן ריפּאַזאַטאָרי באַדינונגס וואָס שפּאַלטן קאַמפּיוטינג און סטאָרידזש אין לאָקאַל. Lakehouse איז יידילי פּאַסיק פֿאַר די סערוויסעס.
מעטאַדאַטאַ שיכטע
די מעטאַדאַטאַ שיכטע איז די פונדאַמענטאַל קאָמפּאָנענט פון אַ דאַטן לאַקעהאָוסע וואָס דיסטינגגווישיז דעם פּלאַן. עס איז אַ איין קאַטאַלאָג וואָס אָפפערס מעטאַדאַטאַ (אינפֿאָרמאַציע וועגן אנדערע דאַטן ברעקלעך) פֿאַר אַלע זאכן סטאָרד אין דער אָזערע און אַלאַוז ניצערס צו נוצן אַדמיניסטראַציע קייפּאַבילאַטיז ווי:
- א קאָנסיסטענט ווערסיע פון די דאַטאַבייס איז געזען דורך קאַנקעראַנט טראַנזאַקשאַנז דאַנק צו אַסיד טראַנזאַקשאַנז;
- קאַטשינג צו ראַטעווען וואָלקן כייפעץ קראָם טעקעס;
- אַדינג דאַטן סטרוקטור ינדעקסיז ניצן ינדעקסינג צו פאַרגיכערן אָנפֿרעג פּראַסעסינג;
- ניצן נול-קאָפּיע קלאָונינג צו דופּליקאַט דאַטן אַבדזשעקץ; און
- צו קראָם זיכער ווערסיעס פון די דאַטן, אאז"ו ו, נוצן דאַטן ווערסיע.
אַדדיטיאָנאַללי, די מעטאַדאַטאַ שיכטע ינייבאַלז די ימפּלאַמענטיישאַן פון סטשעמאַ פאַרוואַלטונג, די נוצן פון DW סטשעמאַ טאַפּאַלאַדזשיז ווי שטערן / שנייעלע סטשעמאַס, און די צושטעלן פון דאַטן גאַווערנאַנס און אַדאַטינג פיייקייט גלייך אויף די דאַטן אָזערע, ימפּרוווינג די אָרנטלעכקייַט פון די גאנצע דאַטן רערנ - ליניע.
פֿעיִקייטן פֿאַר סטשעמאַ עוואָלוציע און ענפאָרסמאַנט זענען אַרייַנגערעכנט אין סטשעמאַ פאַרוואַלטונג. דורך רידזשעקטינג קיין שרייבט וואָס טאָן ניט טרעפן די סכעמע פון די טיש, סטשעמאַ ענפאָרסמאַנט ינייבאַלז ניצערס צו האַלטן דאַטן אָרנטלעכקייַט און קוואַליטעט.
סטשעמאַ עוואַלושאַן אַלאַוז די טיש ס פאָרשטעלן סטשעמאַ צו זיין מאַדאַפייד צו אַקאַמאַדייט טשאַנגינג דאַטן. רעכט צו אַ איין אַדמיניסטראַציע צובינד אויף שפּיץ פון די דאַטן אָזערע, עס זענען אויך אַקסעס קאָנטראָל און אַדאַטינג פּאַסאַבילאַטיז.
אַפּי שיכטע
אן אנדער קריטיש שיכטע פון דער אַרקאַטעקטשער איז איצט פאָרשטעלן, האָסטינג אַ נומער פון אַפּיס וואָס אַלע סוף ניצערס קענען נוצן צו דורכפירן דזשאָבס מער געשווינד און באַקומען מער סאַפיסטאַקייטיד סטאַטיסטיק.
די נוצן פון מעטאַדאַטאַ אַפּיס מאכט עס גרינגער צו ידענטיפיצירן און אַקסעס די דאַטן ייטאַמז דארף פֿאַר אַ געגעבן אַפּלאַקיישאַן.
אין טערמינען פון מאַשין לערנען לייברעריז, עטלעכע פון זיי, אַזאַ ווי TensorFlow און Spark MLlib, קענען לייענען אָפֿן טעקע פֿאָרמאַטירונגען ווי פּאַרקוועט און גלייך אַקסעס די מעטאַדאַטאַ שיכטע.
אין דער זעלביקער צייט, DataFrame APIs פאָרשלאָגן גרעסערע גיכער פֿאַר אַפּטאַמאַזיישאַן, וואָס אַלאַוז פּראָוגראַמערז צו אָרגאַניזירן און טוישן דיספּערסט דאַטן.
קאַנסאַמשאַן שיכטע
Power BI, Tableau און אנדערע מכשירים און אַפּפּס זענען כאָוסטיד אונטער די קאַנסאַמשאַן שיכטע. מיט די לאַקעהאָוסע פּלאַן, אַלע מעטאַדאַטאַ און אַלע דאַטן וואָס זענען געהאלטן אין אַ אָזערע זענען צוטריטלעך צו די קליענט אַפּפּס.
די לאַקעהאָוסע קענען ווערן גענוצט דורך אַלע ניצערס אין אַ פירמע צו דורכפירן אַלע מינים פון אַנאַליטיקס אַפּעריישאַנז, אַרייַנגערעכנט קריייטינג געשעפט סייכל דאַשבאָרדז און פליסנדיק סקל קוויריז און מאַשין לערנען טאַסקס.
אַדוואַנטאַגעס פון Data Lakehouse
אָרגאַנאַזיישאַנז קענען מאַכן אַ דאַטן לייקכאַוס צו פאַרייניקן זייער קראַנט דאַטן פּלאַטפאָרמע און אַפּטאַמייז זייער גאַנץ דאַטן פאַרוואַלטונג פּראָצעס. דורך דיסמאַנאַלינג די סילאָ באַריערז קאַנעקטינג פאַרשידן קוואלן, אַ דאַטן לאַקער קענען פאַרבייַטן די נויט פֿאַר בוילעט סאַלושאַנז.
קאַמפּערד מיט קוראַטעד דאַטן קוואלן, דעם ינאַגריישאַן טראגט אַ באטייטיק מער עפעקטיוו סוף-צו-סוף פּראָצעדור. דאָס האט עטלעכע אַדוואַנטידזשיז:
- ווייניקער אַדמיניסטראַציע: אלא ווי עקסטראַקט דאַטן פון רוי דאַטן און פּריפּערינג עס פֿאַר נוצן אין אַ דאַטן ווערכאַוס, אַ דאַטן לאַקעהאָוסע אַלאַוז קיין קוואלן לינגקט צו עס צו האָבן זייער דאַטן בנימצא און אָרגאַניזירט פֿאַר יוטאַלאַזיישאַן.
- געוואקסן פּרייַז-יפעקטיוונאַס: דאַטאַ לאַקכאַוסיז זענען קאַנסטראַקטאַד ניצן הייַנטצייַטיק ינפראַסטראַקטשער וואָס דיוויידז קאַמפּיאַטיישאַן און סטאָרידזש, מאכן עס פּשוט צו יקספּאַנד סטאָרידזש אָן ינקריסינג קאַמפּיוט מאַכט. נאָר די נוצן פון ביליק דאַטן סטאָרידזש רעזולטאַטן אין סקאַלאַביליטי וואָס איז קאָס-עפעקטיוו.
- בעסער דאַטן גאַווערנאַנס: דאַטאַ לאַכאַוסיז זענען קאַנסטראַקטאַד מיט סטאַנדערדייזד עפענען אַרקאַטעקטשער, אַלאַוינג מער קאָנטראָל איבער זיכערהייט, מעטריקס, ראָלע-באזירט אַקסעס און אנדערע וויכטיק פאַרוואַלטונג קאַמפּאָונאַנץ. דורך יונאַפייינג רעסורסן און דאַטן קוואלן, זיי פאַרפּאָשעטערן און פאַרבעסערן גאַווערנאַנס.
- סימפּלאַפייד סטאַנדאַרדס: זינט די פֿאַרבינדונג איז געווען העכסט לימיטעד אין די 1980 ס, ווען דאַטן ווערכאַוזיז זענען געווען ערשטער דעוועלאָפּעד, לאָוקאַלייזד סטשעמאַ סטאַנדאַרדס זענען אָפט דעוועלאָפּעד אין געשעפטן, אפילו דיפּאַרטמאַנץ. דאַטאַ לאַקעהאָוסעס נוצן די פאַקט אַז פילע טייפּס פון דאַטן איצט האָבן אָפֿן סטאַנדאַרדס פֿאַר סטשעמאַ דורך ינדזשעסטינג פילע דאַטן קוואלן מיט די אָוווערלאַפּינג מונדיר סטשעמאַ צו סטרימליין פּראָוסידזשערז.
דיסאַדוואַנטידזשיז פון Data Lakehouse
טראָץ אַלע די האָאָפּלאַ אַרומיק דאַטן לאַקעכאַוסיז, עס איז וויכטיק צו האַלטן אין זינען אַז דער געדאַנק איז נאָך זייער נייַ. זייט זיכער צו וועגן די דיסאַדוואַנטידזשיז איידער קאַמיטינג גאָר צו דעם נייַע פּלאַן.
- מאָנאָליטהיק סטרוקטור: די אַלע-ינקלוסיוו פּלאַן פון אַ לאַקעהאָוסע אָפפערס עטלעכע אַדוואַנטידזשיז, אָבער עס אויך רייזאַז עטלעכע פראבלעמען. מאָנאָליטהיק אַרקאַטעקטשער אָפט פירט צו נעבעך דינסט פֿאַר אַלע ניצערס און קענען זיין שטרענג און שווער צו טייַנען. טיפּיקאַללי, אַרקאַטעקץ און דיזיינערז ווי אַ מער מאַדזשאַלער אַרקאַטעקטשער אַז זיי קענען קאַסטאַמייז פֿאַר פאַרשידן נוצן קאַסעס.
- די טעכנאָלאָגיע איז נישט גאַנץ דאָרט נאָך: די לעצט ציל ינקלודז אַ באַטייטיק סומע פון מאַשין לערנען און קינסטלעך סייכל. איידער לאַקכאַוסיז קענען דורכפירן ווי ענוויזשאַנד, די טעקנאַלאַדזשיז מוזן אַנטוויקלען ווייַטער.
- ניט אַ באַטייטיק העכערונג איבער יגזיסטינג סטראַקטשערז: עס איז נאָך היפּש סקעפּטיסיזאַם וועגן ווי פיל מער ווערט לאַכאַוסיז וועט אַקשלי ביישטייערן. עטלעכע דיטראַקערז טענהן אַז אַ אָזערע ווערכאַוס פּלאַן פּערד מיט די צונעמען אָטאַמייטיד ויסריכט קענען דערגרייכן פאַרגלייַכלעך עפעקטיווקייַט.
טשאַלאַנדזשיז פון Data Lakehouse
עס קען זיין שווער צו אַדאַפּט די דאַטן לאַקעהאָוסע טעכניק. רעכט צו דער ינטראַקאַסי פון זייַן קאָמפּאָנענט ברעקלעך, עס איז פאַלש צו זען די דאַטן לאַקעהאָוסע ווי אַן אַלע-ענקאַמפּאַסינג ידעאַל סטרוקטור אָדער "איין פּלאַטפאָרמע פֿאַר אַלץ," פֿאַר איין.
אַדדיטיאָנאַללי, רעכט צו דער ינקריסינג אַדאַפּשאַן פון דאַטן לאַקעס, געשעפטן וועלן האָבן צו אַריבערפירן זייער קראַנט דאַטן ווערכאַוזיז צו זיי, בלויז פאַרלאָזנ אויף אַ צוזאָג פון הצלחה אָן דעמאַנסטראַבאַל עקאָנאָמיש נוץ.
אויב עס זענען לייטאַנסי פּראָבלעמס אָדער אַוטידזשיז איבער די אַריבערפירן פּראָצעס, דאָס קען זיין טייַער, צייט-קאַנסומינג און טאָמער אַנסייף.
ביזנעס יוזערז מוזן אַרומנעמען העכסט ספּעשאַלייזד טעקנאַלאַדזשיז, לויט צו זיכער ווענדאָרס וואָס עקספּרעסלי אָדער ימפּליסאַטלי מאַרק סאַלושאַנז ווי דאַטן לאַקעכאַוסיז. די קען נישט שטענדיק אַרבעטן מיט אנדערע מכשירים לינגקט צו די דאַטן אָזערע אין דעם צענטער פון די סיסטעם, אַדינג צו די ישוז.
אין דערצו, עס קען זיין שווער צו צושטעלן 24/7 אַנאַליטיקס בשעת פליסנדיק געשעפט-קריטיש ווערקלאָודז, וואָס רופט פֿאַר ינפראַסטראַקטשער מיט קאָס-עפעקטיוו סקאַלאַביליטי.
סאָף
די נואַסט פאַרשיידנקייַט פון דאַטן סענטערס אין די לעצטע יאָרן איז די דאַטן לאַקעהאָוסע. עס ינטאַגרייץ אַ פאַרשיידנקייַט פון פעלדער, אַזאַ ווי אינפֿאָרמאַציע טעכנאָלאָגיע, אָפֿן-מקור ווייכווארג, וואָלקן קאָמפּוטינג, און פונאנדערגעטיילט סטאָרידזש פּראָטאָקאָלס.
עס ינייבאַלז געשעפטן צו צענטראל קראָם אַלע דאַטן מינים פֿון קיין אָרט, סימפּלאַפייינג פאַרוואַלטונג און אַנאַליסיס. Data Lakehouse איז אַ שיין ינטריגינג באַגריף.
יעדער פירמע וואָלט האָבן אַ באַטייטיק קאַמפּעטיטיוו מייַלע אויב עס האט אַקסעס צו אַן אַלע-אין-איין דאַטן פּלאַטפאָרמע וואָס איז געווען ווי שנעל און עפעקטיוו ווי אַ דאַטן ווערכאַוס און איז אויך פלעקסאַבאַל ווי אַ דאַטן אָזערע.
דער געדאַנק איז נאָך דעוועלאָפּינג און בלייבט לעפיערעך נייַ. ווי אַ רעזולטאַט, עס קען נעמען עטלעכע מאָל צו באַשליסן צי עפּעס קען זיין וויידספּרעד אָדער נישט.
מיר אַלע זאָל זיין טשיקאַווע וועגן די ריכטונג וואָס Lakehouse אַרקאַטעקטשער איז כעדינג.
לאָזן אַ ענטפֿערן