טיש פון קאָנטענץ[באַהאַלטן][ווייַזן]
קאָמפּאַניעס כאַפּן מער דאַטן ווי אלץ, ווייַל זיי ינקריסינגלי פאַרלאָזנ אויף עס צו מיטטיילן וויכטיק געשעפט דיסיזשאַנז, פאַרבעסערן פּראָדוקט אָפרינגז און צושטעלן בעסער קונה דינסט.
מיט די קוואַנטיטי פון דאַטן באשאפן אין אַ עקספּאָונענשאַל קורס, די וואָלקן אָפפערס עטלעכע אַדוואַנטידזשיז פֿאַר דאַטן פּראַסעסינג און אַנאַליטיקס, אַרייַנגערעכנט סקאַלאַביליטי, פאַרלאָזלעך און אַוויילאַבילאַטי.
אין די וואָלקן יקאָוסיסטאַם, עס זענען אויך עטלעכע מכשירים און טעקנאַלאַדזשיז פֿאַר דאַטן פּראַסעסינג און אַנאַליטיקס. די צוויי טייפּס פון גרויס דאַטן סטאָרידזש סטראַקטשערז וואָס זענען מערסט אָפט געניצט זענען דאַטן ווערכאַוזיז און דאַטן לאַקעס.
כאָטש די נוצן פון אַ דאַטן אָזערע איז ווייניקער אַפּילינג ווייַל איר קענען נישט פרעגן די מאָדעל און דאַטן בשעת עס איז נאָך באַטייַטיק, די נוצן פון אַ דאַטן ווערכאַוס פֿאַר סטרימינג דאַטן סטאָרידזש איז וויסטפאַל.
Wוואָס טיפּ פון וואָלקן אַרקאַטעקטשער טאָן מיר קלייַבן?
זאָל מיר באַטראַכטן נייַער קאַנסעפּס פֿאַר די דאַטן לאַקכאַוס, אָדער זאָל מיר זיין צופרידן מיט די ווערכאַוס ס קאַנסטריינץ אָדער די ריסטריקשאַנז פון די אָזערע?
א ראָמאַן דאַטן סטאָרידזש אַרקאַטעקטשער גערופֿן אַ "דאַטאַ לאַקעהאָוסע" קאַמביינז די אַדאַפּטאַבילאַטי פון דאַטן לאַקעס מיט די דאַטן פאַרוואַלטונג פון דאַטן ווערכאַוזיז.
פארשטאנד פון די פאַרשידן גרויס דאַטן סטאָרידזש מעטהאָדס איז יקערדיק פֿאַר בויען אַ פאַרלאָזלעך דאַטן סטאָרידזש רערנ - ליניע פֿאַר געשעפט סייכל (BI), דאַטן אַנאַליטיקס און מאַשין וויסן (ML) ווערקלאָודז, דיפּענדינג אויף דיין פירמע 'ס פאדערונגען.
אין דעם פּאָסטן, מיר וועלן ענג קוקן אין דאַטאַ וואַרעהאָוסע, דאַטאַ לייק און דאַטאַ לייקאָוסע, מיט בענעפיץ, לימיטיישאַנז און פּראָס און קאָנס פון זיי. לאמיר אנהייבן.
וואָס איז דאַטאַ וואַרעהאָוסע?
א דאַטן ווערכאַוס איז אַ סענטראַלייזד דאַטן ריפּאַזאַטאָרי געניצט דורך אַן אָרגאַניזאַציע צו האַלטן ריזיק וואַליומז פון דאַטן פֿון פילע קוואלן. א דאַטן ווערכאַוס אקטן ווי אַן אָרגאַניזאַציע ס איין מקור פון "דאַטן אמת" און איז יקערדיק פֿאַר ריפּאָרטינג און געשעפט אַנאַליטיקס.
טיפּיקאַללי, דאַטן ווערכאַוזיז פאַרבינדן ריליישאַנאַל דאַטן שטעלט פון עטלעכע קוואלן, אַזאַ ווי אַפּלאַקיישאַן, געשעפט און טראַנסאַקטיאָנאַל דאַטן, צו קראָם היסטארישע דאַטן. איידער זיי לאָודיד אין די ווערכאַוזינג סיסטעם, דאַטן זענען פארוואנדלען און קלינד אין דאַטן ווערכאַוזיז אַזוי אַז עס קענען זיין געוויינט ווי אַ איין מקור פון דאַטן אמת.
רעכט צו זייער פיייקייט צו געשווינד פאָרשלאָגן געשעפט ינסייץ פון אַלע געביטן פון דער פירמע, געשעפטן ינוועסטירן אין דאַטן ווערכאַוזיז. מיט די נוצן פון BI מכשירים, SQL קלייאַנץ און אנדערע ווייניקער סאַפיסטאַקייטיד (ד"ה ניט-דאַטע וויסנשאַפֿט) אַנאַליטיקס סאַלושאַנז, געשעפט אַנאַליס, דאַטן ענדזשאַנירז און באַשלוס-מייקערז קענען אַקסעס דאַטן פֿון דאַטן ווערכאַוסיז.
עס איז טייַער צו האַלטן אַ ווערכאַוס מיט די טאָמיד-ינקריסינג באַנד פון דאַטן, און אַ דאַטן ווערכאַוס קען נישט שעפּן רוי אָדער אַנסטראַקטשערד דאַטן. דערצו, עס איז נישט די ידעאַל אָפּציע פֿאַר סאַפיסטאַקייטיד דאַטן אַנאַליסיס טעקניקס ווי מאַשין לערנען אָדער פּרידיקטיוו מאָדעלינג.
א דאַטן ווערכאַוס, דעריבער, גיט פאַסטער אָנפֿרעג רעספּאָנסעס און דאַטן פון אַ העכער קוואַליטעט. Google Big Query, Amazon Redshift, Azure SQL Data Warehouse און Snowflake זענען וואָלקן באַדינונגס בנימצא פֿאַר דאַטן ווערכאַוסיז.
בענעפיץ פון דאַטאַ וואַרעהאָוסע
- ינקרעאַסינג די עפעקטיווקייַט און גיכקייַט פון געשעפט סייכל און דאַטן אַנאַליטיקס ווערקלאָודז: דאַטאַ ווערכאַוזיז פאַרקירצן די צייט דארף פֿאַר דאַטן צוגרייטונג און אַנאַליסיס. זיי קענען לייכט פֿאַרבינדונג צו דאַטן אַנאַליטיקס און געשעפט סייכל מכשירים זינט די דאַטן פון די דאַטן ווערכאַוס זענען פאַרלאָזלעך און קאָנסיסטענט. אַדדיטיאָנאַללי, דאַטן ווערכאַוזיז שפּאָרן די צייט פֿאַר דאַטן זאַמלונג און צושטעלן טימז די פיייקייט צו נוצן דאַטן פֿאַר ריפּאָרץ, דאַשבאָרדז און אנדערע אַנאַליטיקס רעקווירעמענץ.
- ינקרעאַסינג די קאָנסיסטענסי, קוואַליטעט און סטאַנדערדיזיישאַן פון דאַטן: אָרגאַנאַזיישאַנז קלייַבן דאַטן פון אַ פאַרשיידנקייַט פון קוואלן, אַרייַנגערעכנט באַניצער, פארקויפונג און טראַנסאַקטיאָנאַל דאַטן. די פירמע קענען צוטרוי די דאַטן פֿאַר געשעפט באדערפענישן ווייַל דאַטן ווערכאַוזינג קאַמפּיילז פֿירמע דאַטן אין אַ מונדיר, סטאַנדערדייזד פֿאָרמאַט וואָס קענען שפּילן ווי אַ איין מקור פון דאַטן אמת.
- ענכאַנסינג באַשלוס-מאכן אין אַלגעמיין: דאַטאַ ווערכאַוזינג פאַסילאַטייץ בעסער באַשלוס-מאכן דורך פאָרשלאָגן אַ סענטראַלייזד קראָם פֿאַר ביידע פריש און אַלט דאַטן. דורך פּראַסעסינג דאַטן אין דאַטן ווערכאַוסיז פֿאַר גענוי ינסייץ, באַשלוס-מייקערז קענען אַססעסס ריסקס, באַגרייַפן קליענט וויל און פאַרבעסערן סכוירע און באַדינונגס.
- פּראַוויידינג בעסער געשעפט סייכל: דאַטאַ ווערכאַוזינג בריקן די ריס צווישן מאַסיוו רוי דאַטן, וואָס איז אָפט געזאמלט רוטינלי ווי אַ ענין פון קורס, און די קוראַטעד דאַטן וואָס גיט ינסייץ. זיי אַקט ווי דער יסוד פֿאַר אַן אָרגאַניזאַציע ס דאַטן סטאָרידזש, וואָס אַלאַוז עס צו ענטפֿערן קאָמפּליצירט פֿראגן וועגן זיין דאַטן און נוצן די רעספּאָנסעס צו מאַכן דיפענסאַבאַל געשעפט דיסיזשאַנז.
לימיטיישאַנז פון דאַטאַ וואַרעהאָוסע
- פעלן פון דאַטן בייגיקייט: בשעת דאַטן ווערכאַוזיז יקסעליד אין האַנדלינג סטראַקטשערד דאַטן, האַלב-סטראַקטשערד און אַנסטראַקטשערד דאַטן פֿאָרמאַטירונגען ווי קלאָץ אַנאַליטיקס, סטרימינג און געזעלשאַפטלעך מידיאַ דאַטן קענען זיין טשאַלאַנדזשינג פֿאַר זיי. דאָס מאכט רעקאַמענדיד דאַטן ווערכאַוסיז פֿאַר נוצן קאַסעס מיט מאַשין לערנען און קינסטלעך סייכל שווער.
- טייַער צו ינסטאַלירן און טייַנען: דאַטאַ ווערכאַוזיז קענען זיין טייַער צו ינסטאַלירן און טייַנען. דערצו, די דאַטן ווערכאַוס איז אָפט נישט סטאַטיק; עס עלטער און דאַרף אָפט וישאַלט, וואָס איז טייַער.
פּראָס
- דאַטן איז פּשוט צו געפֿינען, צוריקקריגן און אָנפֿרעג.
- ווי לאַנג ווי די דאַטן זענען שוין ריין, די צוגרייטונג פון SQL דאַטן איז פּשוט.
קאָנס
- איר זענט געצווונגען צו נוצן בלויז איין אַנאַליטיקס פאַרקויפער.
- אַנאַלייזינג און סטאָרינג אַנסטראַקטשערד אָדער פלאָוינג דאַטן איז גאַנץ טייַער.
וואָס איז דאַטאַ לייק?
יעדער טיפּ פון דאַטן איז צוגעזאגט און געמאכט מעגלעך דורך דאַטן לאַקעס. עס איז וווילטויק צו האָבן דאַטן אין אַ צוטריטלעך שטייגער סענטראַלי ליגן און בנימצא פֿאַר לייענען.
א דאַטן אָזערע איז אַ סענטראַלייזד, גאָר אַדאַפּטאַבאַל סטאָרידזש פּלאַץ ווו מאַסיוו וואַליומז פון אָרגאַניזירט און אַנסטראַקטשערד דאַטן זענען געהאלטן אין זייער אַנפּראַסעסט, אַנאָלטערד און אַנפאָרמאַטטעד פארמען.
א דאַטן אָזערע ניצט אַ פלאַך אַרקאַטעקטשער און אַבדזשעקץ סטאָרד אין זיין אַנפּראַסעסט שטאַט צו קראָם דאַטן, ווי קעגן צו דאַטן ווערכאַוזיז, וואָס ראַטעווען ריליישאַנאַל דאַטן וואָס זענען ביז אַהער "רייניקד."
דאַטן לאַקעס, ווי קעגן צו דאַטן ווערכאַוזיז, וואָס האָבן שוועריקייט צו האַנדלען מיט דאַטן אין דעם פֿאָרמאַט, זענען אַדאַפּטאַבאַל, פאַרלאָזלעך און אַפאָרדאַבאַל און לאָזן ענטערפּריסעס צו באַקומען ימפּרוווד ינסייט פון אַנסטראַקטשערד דאַטן.
אין דאַטן לאַקעס, דאַטן זענען יקסטראַקטיד, לאָודיד און פארוואנדלען (ELT) פֿאַר אַנאַליטיקאַל צוועקן אלא ווי די סטשעמאַ אָדער דאַטן געגרינדעט אין דער צייט פון דאַטן זאַמלונג.
ניצן טעקנאַלאַדזשיז פֿאַר פילע דאַטן מינים פֿון IoT דעוויסעס, געזעלשאַפטלעך מעדיע, און סטרימינג דאַטן, דאַטן לאַקעס געבן מאַשין לערנען און פּרידיקטיוו אַנאַליטיקס.
אַדדיטיאָנאַללי, אַ דאַטן געלערנטער וואָס קענען פּראָצעס רוי דאַטן קענען נוצן די דאַטן אָזערע. א דאַטן ווערכאַוס, אויף די אנדערע האַנט, איז גרינגער פֿאַר געשעפטן צו נוצן. עס איז גאנץ פֿאַר באַניצער פּראָפילינג, פּרידיקטיוו אַנאַליטיקס, מאַשין לערנען און אנדערע טאַסקס.
כאָטש דאַטן לאַקעס אַדרעס עטלעכע ישוז מיט דאַטן ווערכאַוזיז, זייער דאַטן קוואַליטעט איז נעבעך און זייער אָנפֿרעג גיכקייַט איז ניט גענוגיק. אַדדיטיאָנאַללי, עס נעמט עקסטרע מכשירים פֿאַר געשעפט יוזערז צו אָנפירן SQL קוויריז. א דאַטן אָזערע וואָס איז שוואַך סטראַקטשערד קען דערפאַרונג אַ פּראָבלעם מיט דאַטן סטאַגניישאַן.
בענעפיץ פון דאַטאַ לייק
- שטיצן פֿאַר אַ ברייט קייט פון אַפּלאַקיישאַן קאַסעס פון מאַשין לערנען און דאַטן וויסנשאַפֿט. עס איז סימפּלער צו נוצן אַ אַנדערש מאַשין און טיף לערנען אַלגערידאַמז צו שעפּן די דאַטן אין דאַטן לאַקעס, ווייַל די דאַטן זענען אָפן, רוי.
- די ווערסאַטילאַטי פון דאַטן לאַקעס, וואָס אַלאַוז איר צו קראָם דאַטן אין קיין פֿאָרמאַט אָדער מידיאַ אָן די פאָדערונג פֿאַר אַ פּריסעט סטשעמאַ, איז אַ גרויס מייַלע. צוקונפֿט דאַטן נוצן קאַסעס קענען זיין געשטיצט, און מער דאַטן קענען זיין אַנאַלייזד אויב די דאַטן זענען לינקס אין זיין אָריגינעל שטאַט.
- אין סדר צו ויסמיידן צו קראָם ביידע טייפּס פון דאַטן אין פאַרשידן קאַנטעקסץ, דאַטן לאַקעס קענען אַנטהאַלטן ביידע סטראַקטשערד און אַנסטראַקטשערד דאַטן. פֿאַר די סטאָרידזש פון פאַרשידן אָרגאַנאַזיישאַנאַל דאַטן, זיי פאָרשלאָגן אַ איין אָרט.
- קאַמפּערד מיט טראדיציאנעלן דאַטן ווערכאַוזיז, דאַטן לאַקעס זענען ווייניקער טייַער ווייַל זיי זענען געבויט צו זיין געהאלטן אויף ביליק סכוירע ייַזנוואַרג, אַזאַ ווי אַבדזשעקץ סטאָרידזש, וואָס איז אָפט גרייט פֿאַר אַ נידעריקער פּרייַז פּער גיגאבייט סטאָרד.
לימיטיישאַנז פון דאַטאַ לייק
- דאַטאַ אַנאַליטיקס און געשעפט סייכל נוצן קאַסעס כעזשבן שוואַך: דאַטן לאַקעס קענען ווערן אַנאָרגאַנייזד אויב זיי זענען נישט אַדאַקוואַטלי מיינטיינד, וואָס מאכט עס שווער צו פאַרבינדן זיי צו געשעפט סייכל און אַנאַליטיקס מכשירים. אַדדיטיאָנאַללי, ווען נייטיק פֿאַר ריפּאָרטינג און אַנאַליטיקס נוצן קאַסעס, אַ פעלן פון קאָנסיסטענט דאַטן סטראַקטשערז און אַסיד (אַטאָמיסיטי, קאָנסיסטענסי, אפגעזונדערטקייט, און געווער) טראַנסאַקטיאָנאַל שטיצן קענען פירן צו סובאָפּטימאַל אָנפֿרעג פאָרשטעלונג.
- די ינקאַנסיסטאַנס פון דאַטן לאַקעס מאכט עס אוממעגלעך צו דורכפירן דאַטן פאַרלאָזלעך און זיכערהייט, וואָס ריזאַלטיד אין אַ פעלן פון ביידע. עס קען זיין שווער צו אַנטוויקלען צונעמען דאַטן זיכערהייט און גאַווערנאַנס סטאַנדאַרדס צו באַזאָרגן צו שפּירעוודיק דאַטן טייפּס, ווייַל דאַטן לאַקעס קענען שעפּן קיין דאַטן פאָרעם.
פּראָס
- סאַלושאַנז וואָס זענען אַפאָרדאַבאַל פֿאַר אַלע טייפּס פון דאַטן.
- קענען צו שעפּן דאַטן וואָס איז ביידע אָרגאַניזירט און האַלב-סטראַקטשערד.
- ידעאַל פֿאַר קאָמפּליצירט דאַטן פּראַסעסינג און סטרימינג.
קאָנס
- דאַרף אַ סאַפיסטאַקייטיד רערנ - ליניע צו זיין געבויט.
- געבן דאַטן עטלעכע מאָל צו ווערן קוועריאַבלע.
- עס נעמט צייט צו גאַראַנטירן דאַטן פאַרלאָזלעך און קוואַליטעט.
וואָס איז Data Lakehouse?
א ראָמאַן גרויס-דאַטן סטאָרידזש אַרקאַטעקטשער גערופֿן אַ "דאַטאַ לאַקעהאָוסע" קאַמביינז די גרעסטע אַספּעקץ פון דאַטן לאַקעס און דאַטן ווערכאַוסיז. אַלע דיין דאַטן, צי סטראַקטשערד, האַלב-סטראַקטשערד אָדער אַנסטראַקטשערד, קענען זיין סטאָרד אין איין אָרט מיט די פיינאַסט קייפּאַבילאַטיז פון מאַשין לערנען, געשעפט סייכל און סטרימינג מעגלעך דאַנק צו אַ דאַטן לייק.
דאַטאַ לאַקעס פון אַלע סאָרץ זענען אָפט די סטאַרטינג פונט פֿאַר דאַטן לאַקעכאַוסיז; נאָך דעם, די דאַטן זענען פארוואנדלען אין דעלטאַ לייק פֿאָרמאַט (אַן אָפֿן-מקור סטאָרידזש שיכטע וואָס ברענגט רילייאַבילאַטי צו דאַטן לאַקעס).
דאַטן לאַקעס מיט דעלטע לאַקעס געבן אַסיד טראַנסאַקטיאָנאַל פּראָוסידזשערז פֿון קאַנווענשאַנאַל דאַטן ווערכאַוזיז. אין עסאַנס, די לאַקכאַוס סיסטעם ניצט ביליק סטאָרידזש צו האַלטן מאַסיוו אַמאַונץ פון דאַטן אין זייער אָריגינעל פארמען, פיל ווי דאַטן לאַקעס.
אַדינג די מעטאַדאַטאַ שיכטע אויף שפּיץ פון די קראָם אויך גיט דאַטן סטרוקטור און ימפּאַוערז דאַטן פאַרוואַלטונג מכשירים ווי די געפֿונען אין דאַטן ווערכאַוזיז.
דאָס מאכט עס מעגלעך פֿאַר פילע טימז צו אַקסעס אַלע די פירמע דאַטן דורך אַ איין סיסטעם פֿאַר פאַרשידן ינישאַטיווז, אַזאַ ווי דאַטן וויסנשאַפֿט, מאַשין לערנען און געשעפט סייכל.
Benefits פון Data Lakehouse
- שטיצן פֿאַר אַ גרעסערע קייט פון ווערקלאָודז: צו פאַסילאַטייט סאַפיסטאַקייטיד אַנאַליזעס, דאַטן לאַקעכאַוסיז געבן יוזערז דירעקט אַקסעס צו עטלעכע פון די מערסט פאָלקס געשעפט סייכל מכשירים (טאַבלעאַו, פּאָווערבי). אַדדיטיאָנאַללי, דאַטן סייאַנטיס און מאַשין לערנען ענדזשאַנירז קענען לייכט נוצן די דאַטן זינט דאַטן לאַקעכאַוסיז נוצן אָפֿן-דאַטן פֿאָרמאַטירונגען (אַזאַ ווי פּאַרקוועט) צוזאַמען מיט אַפּיס און מאַשין לערנען פראַמעוואָרקס, אַזאַ ווי Python / R.
- קאָס-עפעקטיוונאַס: דאַטאַ לאַקעכאַוסיז נוצן ביליק אַבדזשעקץ סטאָרידזש סאַלושאַנז צו ינסטרומענט די קאָס-עפעקטיוו סטאָרידזש קעראַקטעריסטיקס פון דאַטן לאַקעס. דורך פאָרשלאָגן אַ איין לייזונג, דאַטן לאַקכאַוסיז אויך ויסמיידן די הוצאות און צייט וואָס זענען פארבונדן מיט אָנפירונג פאַרשידן דאַטן סטאָרידזש סיסטעמען.
- דאַטאַ לאַקעהאָוסע פּלאַן ינשורז סטשעמאַ און דאַטן אָרנטלעכקייַט, מאכן עס סימפּלער צו בויען עפעקטיוו דאַטן זיכערהייט און גאַווערנאַנס סיסטעמען. יז פון דאַטע ווערסיע, גאַווערנאַנס און זיכערהייט.
- דאַטאַ לאַקעהאָוסעס פאָרשלאָגן אַ איין, מאַלטיפּערפּאַס דאַטן סטאָרידזש פּלאַטפאָרמע וואָס קענען אַקאַמאַדייט אַלע פירמע דאַטן פאדערונגען, וואָס ראַדוסאַז דאַטן דופּליקיישאַן. די מערהייַט פון געשעפטן קלייַבן אַ כייבריד לייזונג רעכט צו דער בענעפיץ פון ביידע די דאַטן ווערכאַוס און די דאַטן אָזערע. דער סטראַטעגיע, דערווייַל, קען רעזולטאַט אין טייַער דאַטן דופּליקיישאַן.
- די שטיצן פון עפענען פֿאָרמאַטירונגען. עפֿענען פֿאָרמאַטירונגען זענען טעקע טייפּס וואָס קענען ווערן גענוצט דורך פילע ווייכווארג אַפּלאַקיישאַנז און וועמענס ספּעסאַפאַקיישאַנז זענען עפנטלעך בנימצא. לויט ריפּאָרץ, Lakehouses זענען טויגעוודיק פון סטאָרינג דאַטן אין פּראָסט טעקע פֿאָרמאַטירונגען ווי Apache Parquet און ORC (Optimized Row Columnar).
לימיטיישאַנז פון Data Lakehouse
די ביגאַסט שטערונג פון אַ דאַטן לאַקעהאָוסע איז אַז עס איז נאָך אַ יונג און דעוועלאָפּינג טעכנאָלאָגיע. עס איז ומזיכער אויב עס וועט מקיים זיין קאַמיטמאַנץ ווי אַ רעזולטאַט. איידער דאַטן לאַקערכאַוסיז קענען קאָנקורירן מיט געגרינדעט גרויס דאַטן סטאָרידזש סיסטעמען, עס קען נעמען יאָרן.
אָבער, געגעבן די קורס אין וואָס מאָדערן כידעש איז געשעעניש, עס איז שווער צו זאָגן אויב אַ אַנדערש דאַטן סטאָרידזש סיסטעם וועט ניט לעסאָף פאַרבייַטן עס.
פּראָס
- איין פּלאַטפאָרמע האט אַלע די דאַטן, וואָס מיטל אַז עס זענען ווייניקערע האָסטנאַמעס צו טייַנען.
- אַטאָמיסיטי, קאָנסיסטענסי, אפגעזונדערטקייט און טאַפנאַס זענען אַנאַפעקטיד.
- עס איז באטייטיק מער אַפאָרדאַבאַל.
- איין פּלאַטפאָרמע האט אַלע די דאַטן, וואָס מיטל אַז עס זענען ווייניקערע האָסטנאַמעס צו טייַנען.
- פּשוט צו פירן, און שנעל צו סגולע קיין ישוז
- מאַכן עס גרינגער צו בויען אַ רערנ - ליניע
קאָנס
- באַשטעטיקן אַרויף קען נעמען עטלעכע מאָל.
- עס איז צו יונג און צו ווייַט אַוועק צו באַגרענעצן זיך ווי אַ געגרינדעט סטאָרידזש סיסטעם.
דאַטאַ וואַרעהאָוסע ווס דאַטאַ לייק ווס דאַטאַ לייקכאַוס
די דאַטן ווערכאַוס האט אַ לאַנג געשיכטע אין פֿירמע סייכל, ריפּאָרטינג און אַנאַליטיקס אַפּלאַקיישאַנז און איז דער ערשטער גרויס-דאַטן סטאָרידזש טעכנאָלאָגיע.
דאַטן ווערכאַוזיז, אויף די אנדערע האַנט, זענען פּרייסי און האָבן קאָנפליקט מיט דייווערס און אַנסטראַקטשערד דאַטן, אַזאַ ווי סטרימינג דאַטן. פֿאַר מאַשין לערנען און דאַטן וויסנשאַפֿט ווערקלאָודז, דאַטן לאַקעס זענען דעוועלאָפּעד צו פירן רוי דאַטן אין פאַרשידן פארמען אויף אַפאָרדאַבאַל סטאָרידזש.
כאָטש דאַטן לאַקעס זענען עפעקטיוו מיט אַנסטראַקטשערד דאַטן, זיי פעלן די אַסיד טראַנסאַקטיאָנאַל קייפּאַבילאַטיז פון דאַטן ווערכאַוזיז, וואָס מאכט עס טשאַלאַנדזשינג צו גאַראַנטירן דאַטן קאָנסיסטענסי און פאַרלאָזלעך.
די נואַסט דאַטן סטאָרידזש אַרקאַטעקטשער, באקאנט ווי די "דאַטאַ לאַקעהאָוסע," קאַמביינז די פאַרלאָזלעך און קאָנסיסטענסי פון דאַטן ווערכאַוזיז מיט די אַפאָרדאַבילאַטי און אַדאַפּטאַבילאַטי פון דאַטן לאַקעס.
סאָף
אין מסקנא, צו בויען אַ דאַטן לאַקעהאָוסע פֿון קראַצן קען זיין שווער. דערצו, איר וועט כּמעט זיכער נוצן אַ פּלאַטפאָרמע דיזיינד צו געבן אָפֿן דאַטן לאַקעהאָוסע אַרקאַטעקטשער.
דעריבער, מאַכן אָפּגעהיט צו פאָרשן די פילע פֿעיִקייטן און ימפּלאַמאַנץ פון יעדער פּלאַטפאָרמע איידער איר קויפן. קאָמפּאַניעס וואָס זוכן אַ דערוואַקסן, סטראַקטשערד דאַטן לייזונג מיט אַ פאָקוס אויף געשעפט סייכל און דאַטן אַנאַליטיקס נוצן קאַסעס קענען באַטראַכטן אַ דאַטן ווערכאַוס.
אָבער, ענטערפּריסעס קוקן פֿאַר אַ סקאַלאַבלע, אַפאָרדאַבאַל גרויס דאַטן לייזונג צו מאַכט ווערקלאָודז פֿאַר דאַטן וויסנשאַפֿט און מאַשין לערנען אויף אַנסטראַקטשערד דאַטן זאָל באַטראַכטן דאַטן לאַקעס.
באַטראַכטן אַז דיין געשעפט דאַרף מער דאַטן ווי די דאַטן ווערכאַוס און דאַטן אָזערע טעקנאַלאַדזשיז קענען צושטעלן, אָדער אַז איר זוכט פֿאַר אַ לייזונג צו ויסשטימען סאַפיסטאַקייטיד אַנאַליטיקס און מאַשין לערנען אַפּעריישאַנז אויף דיין דאַטן. א דאַטן לאַקעהאָוסע איז אַ פיליק אָפּציע אין די סיטואַציע.
לאָזן אַ ענטפֿערן