Data lakehouses များသည် လုပ်ငန်းများအတွက် data warehouse နှင့် data lake concepts များကို ပေါင်းစပ်ထားပါသည်။
ဤကိရိယာများသည် ဒေတာသိုလှောင်ရုံများရှိ ဒေတာသိုလှောင်ရုံများရှိ ဒေတာဗိသုကာလက်ရာများနှင့် ဒေတာအိုင်များ၏ စီမံခန့်ခွဲမှုစွမ်းရည်များကို ပေါင်းစပ်ခြင်းဖြင့် ကုန်ကျစရိတ်သက်သာသော ဒေတာသိုလှောင်မှုဖြေရှင်းချက်ကို တည်ဆောက်နိုင်စေပါသည်။
ထို့အပြင်၊ ဒေတာရွှေ့ပြောင်းခြင်းနှင့် ထပ်လောင်းခြင်းတို့ကို လျှော့ချခြင်း၊ စီမံခန့်ခွဲရန် အချိန်နည်းပြီး တိုတောင်းသော အစီအစဉ်နှင့် ဒေတာ စီမံခန့်ခွဲရေးဆိုင်ရာ လုပ်ထုံးလုပ်နည်းများသည် အမှန်တကယ် လက်တွေ့ဖြစ်လာပါသည်။
Data lakehouse တစ်ခုတွင် ဖြေရှင်းချက်များစွာပါရှိသော သိုလှောင်မှုစနစ်နှင့် နှိုင်းယှဉ်ပါက အားသာချက်များစွာရှိသည်။
စီးပွားရေးဆိုင်ရာ ဉာဏ်ရည်ဥာဏ်သွေးနှင့် စက်သင်ယူမှုဆိုင်ရာ လုပ်ထုံးလုပ်နည်းများကို နားလည်တိုးတက်စေရန် ဒေတာသိပ္ပံပညာရှင်များက ဤကိရိယာများကို အသုံးပြုနေဆဲဖြစ်သည်။
ဤဆောင်းပါးသည် data lakehouse၊ ၎င်း၏စွမ်းဆောင်ရည်များနှင့် ရရှိနိုင်သောကိရိယာများကို အမြန်ကြည့်ရှုပါမည်။
Data Lakehouse မိတ်ဆက်
ဒေတာဗိသုကာပုံစံသစ်တစ်မျိုးကို “ဒေတာရေကန်” တစ်ခုချင်းစီ၏ အားနည်းချက်များကို လွတ်လပ်စွာဖြေရှင်းရန် data lake နှင့် data warehouse တို့ကို ပေါင်းစပ်ထားသည်။
ဒေတာရေကန်များကဲ့သို့ ရေကန်စနစ်သည် ဒေတာအများအပြားကို မူရင်းပုံစံအတိုင်း ထိန်းသိမ်းထားရန် ကုန်ကျစရိတ်သက်သာသော သိုလှောင်မှုကို အသုံးပြုသည်။
စတိုး၏အပေါ်ရှိ မက်တာဒေတာအလွှာကို ပေါင်းထည့်ခြင်းသည် ဒေတာဖွဲ့စည်းပုံကိုလည်း ပံ့ပိုးပေးပြီး ဒေတာသိုလှောင်ရုံများတွင် တွေ့ရှိရသည့် အလားတူ ဒေတာစီမံခန့်ခွဲမှုကိရိယာများကို အားကောင်းစေသည်။
၎င်းတွင် လုပ်ငန်းခွင်တစ်လျှောက် အသုံးပြုနေသော လုပ်ငန်းဆိုင်ရာ အသုံးချပရိုဂရမ်များ၊ စနစ်များနှင့် စက်ပစ္စည်းအမျိုးမျိုးမှ ရရှိသော ဖွဲ့စည်းတည်ဆောက်ပုံ၊ တစ်ပိုင်းနှင့် ဖွဲ့စည်းတည်ဆောက်ပုံမဟုတ်သော ဒေတာများစွာ ပါဝင်ပါသည်။
ရလဒ်အနေဖြင့် data lake များနှင့်မတူဘဲ lakehouse စနစ်သည် SQL စွမ်းဆောင်ရည်အတွက် ထိုဒေတာကို စီမံခန့်ခွဲပြီး ပိုမိုကောင်းမွန်အောင်လုပ်ဆောင်နိုင်သည်။
၎င်းသည် ဒေတာသိုလှောင်ရုံများထက် စျေးနှုန်းသက်သာစွာဖြင့် များပြားလှသော ဒေတာအများအပြားကို သိမ်းဆည်းပြီး စီမံဆောင်ရွက်နိုင်စွမ်းလည်း ရှိပါသည်။
ဒေတာဝင်ရောက်ခွင့် သို့မဟုတ် ခွဲခြမ်းစိတ်ဖြာမှုများကို လုပ်ဆောင်ရန် လိုအပ်သော်လည်း ဒေတာ သို့မဟုတ် အကြံပြုထားသော ခွဲခြမ်းစိတ်ဖြာမှုများကို မသေချာပါက ဒေတာ lakehouse သည် အသုံးဝင်ပါသည်။
စွမ်းဆောင်ရည်သည် အဓိကပြဿနာမဟုတ်ပါက ရေကန်ဗိသုကာလက်ရာသည် ကောင်းမွန်စွာလုပ်ဆောင်နိုင်မည်ဖြစ်သည်။
သင့်ဖွဲ့စည်းပုံတစ်ခုလုံးကို ရေကန်အိမ်တစ်ခုပေါ်တွင် အခြေခံထားသင့်သည်ဟု ဆိုလိုခြင်းမဟုတ်ပါ။
ဒေတာအိုင်၊ ရေကန်၊ ဒေတာသိုလှောင်ရုံ သို့မဟုတ် အသုံးပြုမှုကိစ္စတစ်ခုစီအတွက် အထူးပြုခွဲခြမ်းစိတ်ဖြာမှုဒေတာဘေ့စ်ကို မည်သို့ရွေးချယ်ရမည်ကို နောက်ထပ်အချက်အလက်များကို ရှာတွေ့နိုင်သည် ဒီမှာ.
Data Lakehouse ၏အင်္ဂါရပ်များ
- တစ်ပြိုင်နက်တည်း ဒေတာဖတ်ရှုခြင်းနှင့် ရေးသားခြင်း။
- လိုက်လျောညီထွေရှိမှုနှင့် ကျွမ်းကျင်ပိုင်နိုင်မှု
- ဒေတာအုပ်ချုပ်ရေးကိရိယာများနှင့်အတူ Schema အကူအညီ
- တစ်ပြိုင်နက်တည်း ဒေတာဖတ်ရှုခြင်းနှင့် ရေးသားခြင်း။
- တတ်နိုင်တဲ့ သိုလှောင်မှု
- ဒေတာအမျိုးအစားများနှင့် ဖိုင်ဖော်မတ်အားလုံးကို ပံ့ပိုးထားသည်။
- ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ထားသည့် ဒေတာသိပ္ပံနှင့် စက်သင်ယူမှုကိရိယာများကို အသုံးပြုခွင့်
- သင့်ဒေတာအဖွဲ့များသည် ၎င်းမှတဆင့် အလုပ်တာဝန်များကို ပိုမိုမြန်ဆန်တိကျစွာ လွှဲပြောင်းပေးရန်အတွက် စနစ်တစ်ခုတည်းသို့ ဝင်ရောက်ခွင့်ရရှိခြင်းမှ အကျိုးကျေးဇူးရရှိမည်ဖြစ်သည်။
- ဒေတာသိပ္ပံ၊ စက်သင်ယူမှု၊ နှင့် ခွဲခြမ်းစိတ်ဖြာမှုဆိုင်ရာ အစပျိုးမှုများအတွက် အချိန်နှင့်တပြေးညီ လုပ်ဆောင်နိုင်မှု
ထိပ်တန်း Data Lakehouse ကိရိယာ ၅ ခု
ဒေတာအုတ်များ
Apache Spark ကို ပထမဆုံးတီထွင်ပြီး ဖန်တီးခဲ့သူက တည်ထောင်ခဲ့တဲ့ Databricks ဖြစ်ပါတယ်။ open source ဖြစ်ပြီး၊ စီမံထားသော Apache Spark ဝန်ဆောင်မှုကို ထောက်ပံ့ပေးပြီး ဒေတာအိုင်များအတွက် ပလပ်ဖောင်းတစ်ခုအဖြစ် နေရာချထားပါသည်။
Databricks lakehouse ဗိသုကာ၏ ဒေတာရေကန်၊ မြစ်ဝကျွန်းပေါ်ရေကန်နှင့် မြစ်ဝကျွန်းပေါ်ဒေသ အင်ဂျင်အစိတ်အပိုင်းများသည် စီးပွားရေးဆိုင်ရာ ဉာဏ်ရည်ဉာဏ်သွေး၊ ဒေတာသိပ္ပံနှင့် စက်သင်ယူမှုဆိုင်ရာ ကိစ္စရပ်များကို အသုံးပြုနိုင်မည်ဖြစ်သည်။
ဒေတာရေကန်သည် အများသူငှာ cloud သိုလှောင်မှု သိုလှောင်ရာနေရာဖြစ်သည်။
မက်တာဒေတာစီမံခန့်ခွဲမှုအတွက် ပံ့ပိုးမှုဖြင့်၊ အစုလိုက်အစည်းလိုက်နှင့် ရေစီးကြောင်းဒေတာ လုပ်ငန်းစဉ်များစွာအတွက် ဒေတာအတွဲများ၊ ဒေတာရှာဖွေတွေ့ရှိမှု၊ ဘေးကင်းသောဝင်ရောက်ခွင့်ထိန်းချုပ်မှုများနှင့် SQL ခွဲခြမ်းစိတ်ဖြာချက်တို့ဖြစ်သည်။
Databricks သည် data lakehouse platform တွင်မြင်နိုင်ဖွယ်ရှိသော data warehouseing functions အများစုကိုပေးဆောင်သည်။
Databricks သည် မကြာသေးမီက ထုတ်ဖော်ပြသခဲ့ပြီး ETL နှင့် ဒေတာထည့်သွင်းမှုကို အလိုအလျောက်လုပ်ဆောင်ပြီး data lake သိုလှောင်မှုဗျူဟာ၏ မရှိမဖြစ်အစိတ်အပိုင်းများကို ပေးပို့နိုင်ရန် ဒေတာအမျိုးအစားအမျိုးမျိုးအတွက် ဒေတာနမူနာပုံစံကို စံနမူနာပြုကာ ဒေတာနမူနာကို မြှင့်တင်ပေးပါသည်။
တနည်းအားဖြင့် သုံးစွဲသူများသည် Delta Live Tables ကို အသုံးပြု၍ ၎င်းတို့၏ အများသူငှာ cloud data lake နှင့် Delta Lake အကြား ETL ပိုက်လိုင်းများကို တည်ဆောက်နိုင်သည်။
စာရွက်ပေါ်တွင်၊ Databricks တွင် အားသာချက်များ အားလုံးရှိပုံပေါ်သော်လည်း ဖြေရှင်းချက်တည်ဆောက်ခြင်းနှင့် ၎င်း၏ဒေတာပိုက်လိုင်းများဖန်တီးရာတွင် ကျွမ်းကျင်သော developer များမှ လူသားလုပ်သားများစွာ လိုအပ်ပါသည်။
အတိုင်းအတာအရ အဖြေက ပိုရှုပ်ထွေးလာသည်။ ထင်တာထက် ပိုရှုပ်ထွေးပါတယ်။
အာဟန
Data lake သည် တစ်ခုတည်းသော အချက်အချာကျသော တည်နေရာဖြစ်ပြီး သင်ရွေးချယ်သည့် အတိုင်းအတာဖြင့် မည်သည့်ဒေတာအမျိုးအစားကိုမဆို သိမ်းဆည်းထားနိုင်ပြီး ဖွဲ့စည်းတည်ဆောက်ပုံမပြီးသော ဒေတာများ အပါအဝင်ဖြစ်သည်။ AWS S3၊ Microsoft Azure နှင့် Google Cloud Storage သည် ဘုံဒေတာအိုင်သုံးခုဖြစ်သည်။
Data lake များသည် အလွန်စျေးသက်သာပြီး အသုံးပြုရလွယ်ကူသောကြောင့် မယုံနိုင်လောက်အောင် ကောင်းမွန်ပါသည်။ ငွေကြေးအနည်းငယ်ဖြင့် သင်နှစ်သက်သလောက် ဒေတာအမျိုးအစားများစွာကို အခြေခံအားဖြင့် သိမ်းဆည်းနိုင်သည်။
သို့သော် data lake သည် ခွဲခြမ်းစိတ်ဖြာမှု၊ query စသည်တို့ကဲ့သို့ built-in tools များကိုမပေးပါ။
သင့်ဒေတာကို စုံစမ်းမေးမြန်းပြီး အသုံးပြုရန် (Ahana Cloud ဝင်လာသည့်) ဒေတာအိုင်ထိပ်ရှိ query engine နှင့် data catalog တစ်ခု လိုအပ်ပါသည်။
Data Warehouse နှင့် Data Lake နှစ်ခုလုံး၏ အကောင်းဆုံးနှင့်အတူ၊ data lakehouse ဒီဇိုင်းအသစ်ကို တီထွင်ခဲ့သည်။
၎င်းသည် ပွင့်လင်းမြင်သာမှု၊ လိုက်လျောညီထွေရှိမှု၊ ကောင်းသောစျေးနှုန်း/စွမ်းဆောင်ရည် ရှိကြောင်း၊ data lake ကဲ့သို့ စကေးများသည် ငွေပေးငွေယူများကို ပံ့ပိုးပေးကာ ဒေတာသိုလှောင်ရုံနှင့် နှိုင်းယှဉ်နိုင်သော လုံခြုံရေးအဆင့်မြင့်မားကြောင်း ညွှန်ပြသည်။
သင်၏စွမ်းဆောင်ရည်မြင့် SQL query engine သည် Data Lakehouse နောက်ကွယ်ရှိ ဦးနှောက်များဖြစ်သည်။ ထို့အတွက်ကြောင့် သင်သည် သင်၏ဒေတာရေကန်ဒေတာတွင် စွမ်းဆောင်ရည်မြင့် ခွဲခြမ်းစိတ်ဖြာမှုများကို လုပ်ဆောင်နိုင်သည်။
Presto အတွက် Ahana Cloud သည် AWS ရှိ Presto အတွက် SaaS ဖြစ်ပြီး cloud တွင် Presto ကို စတင်အသုံးပြုရန် မယုံနိုင်လောက်အောင် ရိုးရှင်းပါသည်။
သင်၏ S3 အခြေခံဒေတာအိုင်အတွက်၊ Ahana တွင် ပါ၀င်သည့်ဒေတာကတ်တလောက်နှင့် ကက်ရှ်တစ်ခု ရှိပြီးဖြစ်သည်။ Ahana သည် သင့်အား အတွင်းပိုင်း၌ လုပ်ဆောင်သောကြောင့် ၎င်းကို အတွင်းပိုင်းမှ လုပ်ဆောင်ပေးသောကြောင့် သင့်အား ကိုင်တွယ်ရန် မလိုအပ်ဘဲ Presto ၏ အင်္ဂါရပ်များကို ပေးသည်။
AWS Lake Formation၊ Apache Hudi နှင့် Delta Lake တို့သည် stack ၏တစ်စိတ်တစ်ပိုင်းဖြစ်ပြီး ၎င်းနှင့်ပေါင်းစပ်ထားသော ငွေပေးငွေယူမန်နေဂျာများထဲမှ အနည်းငယ်မျှသာဖြစ်သည်။
ဒရီမီယို
အဖွဲ့အစည်းများသည် လျင်မြန်စွာမြင့်တက်လာသော ဒေတာအများအပြားကို လျင်မြန်စွာ၊ ရိုးရှင်းစွာနှင့် ထိထိရောက်ရောက် အကဲဖြတ်ရန် ကြိုးပမ်းကြသည်။
Open data lakehouse သည် open data lakes နှင့် data warehouses တို့၏ အကျိုးကျေးဇူးများကို ပွင့်လင်းသောအခြေခံဖြင့် ပေါင်းစပ်ထားခြင်းသည် ၎င်းကို ပြီးမြောက်စေရန် အကောင်းဆုံးနည်းလမ်းဖြစ်သည်ဟု Dremio မှယုံကြည်သည်။
Dremio ၏ lakehouse platform သည် အသုံးပြုသူများအား အချိန်အပိုင်းအခြားတစ်ခုအတွင်း ခွဲခြမ်းစိတ်ဖြာမှုများကို အပြီးသတ်နိုင်စေမည့် လွယ်ကူသော UI ဖြင့် လူတိုင်းအတွက် အဆင်ပြေသော အတွေ့အကြုံကို ပေးဆောင်ပါသည်။
အပြည့်အဝစီမံခန့်ခွဲထားသောဒေတာရေကန်ပလပ်ဖောင်းဖြစ်သော Dremio Cloud၊ နှင့် ဝန်ဆောင်မှုအသစ်နှစ်ခုကို လွှင့်တင်ခြင်း- Dremio Sonar၊ lakehouse query engine နှင့် lakehouse အတွက် ထူးခြားသော Git-like အတွေ့အကြုံကို ပေးဆောင်သည့် Apache Iceberg အတွက် အသိဉာဏ်ရှိသော megastore ဖြစ်သော Dremio Arctic၊
အဖွဲ့အစည်းတစ်ခု၏ SQL workloads အားလုံးကို ဒေတာစီမံခန့်ခွဲမှုလုပ်ဆောင်မှုများကို အလိုအလျောက်လုပ်ဆောင်ပေးသည့် ပွတ်တိုက်မှုကင်းသော၊ အဆုံးမရှိ အတိုင်းအတာအထိ ချဲ့ထွင်နိုင်သော Dremio Cloud ပလပ်ဖောင်းပေါ်တွင် လုပ်ဆောင်နိုင်ပါသည်။
၎င်းကို SQL အတွက်တည်ဆောက်ထားပြီး၊ Git-like အတွေ့အကြုံကိုပေးဆောင်သည်၊ open source ဖြစ်ပြီး၊ အမြဲတမ်းအခမဲ့ဖြစ်သည်။
ဒေတာအဖွဲ့များက သဘောကျနှစ်သက်သည့် ရေကန်အိမ်ပလပ်ဖောင်းအဖြစ် ၎င်းတို့က ၎င်းကို ဖန်တီးခဲ့သည်။
Apache Iceberg နှင့် Apache Parquet ကဲ့သို့သော open source ဇယားနှင့် ဖိုင်ဖော်မတ်များကို အသုံးပြု၍ Dremio Cloud ကိုအသုံးပြုသည့်အခါ သင့်ဒေတာသည် သင့်ကိုယ်ပိုင်ဒေတာသိုလှောင်မှုတွင် အမြဲရှိနေပါသည်။
အနာဂတ်ဆန်းသစ်တီထွင်မှုများကို အလွယ်တကူလက်ခံနိုင်ပြီး သင့်လုပ်ငန်းတာဝန်အပေါ်အခြေခံ၍ သင့်လျော်သောအင်ဂျင်ကို ရွေးချယ်နိုင်ပါသည်။
မိုးစ
Snowflake သည် data lakes နှင့် warehouses များ၏ လိုအပ်ချက်များကို ဖြည့်ဆည်းပေးနိုင်သော cloud data နှင့် analytics platform တစ်ခုဖြစ်သည်။
၎င်းသည် cloud အခြေခံအဆောက်အအုံပေါ်တွင်တည်ဆောက်ထားသောဒေတာသိုလှောင်ရုံစနစ်တစ်ခုအနေဖြင့်စတင်ခဲ့သည်။
ပလပ်ဖောင်းတွင် AWS၊ Microsoft Azure သို့မဟုတ် Google Cloud Platform (GCP) မှ အများသူငှာ cloud သိုလှောင်မှု၏ထိပ်တွင် တည်ရှိသော ဗဟိုချုပ်ကိုင်ထားသော သိုလှောင်သိမ်းဆည်းမှု သိုလှောင်မှုတစ်ခု ပါဝင်ပါသည်။
၎င်းနောက်တွင် အသုံးပြုသူများသည် virtual data warehouse ကိုဖွင့်ပြီး ၎င်းတို့၏ data storage ကိုဆန့်ကျင်သည့် SQL queries များလုပ်ဆောင်နိုင်သည့် multi-cluster computation layer တစ်ခုဖြစ်သည်။
ဗိသုကာလက်ရာသည် သိုလှောင်မှုနှင့် တွက်ချက်မှုအရင်းအမြစ်များကို ခွဲထုတ်ရန် ခွင့်ပြုထားပြီး အဖွဲ့အစည်းနှစ်ခုကို လိုအပ်သလို လွတ်လပ်စွာ အတိုင်းအတာကို ခွင့်ပြုသည်။
နောက်ဆုံးတွင်၊ Snowflake သည် မက်တာဒေတာအမျိုးအစားခွဲခြင်း၊ အရင်းအမြစ်စီမံခန့်ခွဲမှု၊ ဒေတာအုပ်ချုပ်မှု၊ ငွေပေးငွေယူများနှင့် အခြားအင်္ဂါရပ်များဖြင့် ဝန်ဆောင်မှုအလွှာကို ပံ့ပိုးပေးပါသည်။
BI ကိရိယာချိတ်ဆက်ကိရိယာများ၊ မက်တာဒေတာစီမံခန့်ခွဲမှု၊ ဝင်ရောက်ထိန်းချုပ်မှုများနှင့် SQL စုံစမ်းမေးမြန်းမှုများသည် ပလပ်ဖောင်းတွင် ထူးချွန်ထက်မြက်သည့် ဒေတာသိုလှောင်ရုံလုပ်ဆောင်နိုင်စွမ်းအချို့မျှသာဖြစ်သည်။
Snowflake သည် ဆက်စပ် SQL-based query engine တစ်ခုတည်းအတွက် ကန့်သတ်ထားသည်။
ရလဒ်အနေဖြင့်၊ စီမံအုပ်ချုပ်ရန် ပိုမိုလွယ်ကူသော်လည်း လိုက်လျောညီထွေဖြစ်မှုနည်းလာပြီး မော်ဒယ်လ်ဒေတာအိုင်အမြင်ကို အကောင်အထည်မဖော်နိုင်ပါ။
ထို့အပြင်၊ cloud သိုလှောင်မှုမှ ဒေတာများကို ရှာဖွေခြင်း သို့မဟုတ် ခွဲခြမ်းစိတ်ဖြာခြင်းမပြုမီ၊ Snowflake သည် ၎င်းအား ဗဟိုချုပ်ကိုင်ထားသော သိုလှောင်မှုအလွှာသို့ တင်ရန် လုပ်ငန်းများကို လိုအပ်ပါသည်။
လူကိုယ်တိုင် ဒေတာ ပိုက်လိုင်း သွယ်တန်းခြင်း လုပ်ထုံးလုပ်နည်းသည် ၎င်းကို မစစ်ဆေးမီတွင် ကြိုတင် ETL၊ စီမံဆောင်ရွက်ပေးခြင်းနှင့် ဒေတာဖော်မတ်ပြုလုပ်ခြင်းတို့ကို လိုအပ်ပါသည်။ ဤလက်စွဲလုပ်ငန်းစဉ်များကို ချဲ့ထွင်ခြင်းသည် ၎င်းတို့အား စိတ်ပျက်စေသည်။
စာရွက်ပေါ်တွင် အံဝင်ခွင်ကျဖြစ်ပုံရသော်လည်း အမှန်တကယ်တွင် ရိုးရှင်းသောဒေတာထည့်သွင်းခြင်း၏ data lake နိယာမမှ သွေဖည်သွားသော နောက်ထပ်ရွေးချယ်စရာတစ်ခုမှာ Snowflake ၏ data lakehouse ဖြစ်သည်။
Oracle က
"ဒေတာကန်တော်ကြီး" ဟုလူသိများသော ခေတ်မီပွင့်လင်းသောဗိသုကာပညာသည် သင့်ဒေတာအားလုံးကို သိမ်းဆည်းရန်၊ နားလည်နိုင်စေရန်နှင့် ပိုင်းခြားစိတ်ဖြာနိုင်စေသည်။
လူကြိုက်အများဆုံး open source data lake solutions ၏ အနံနှင့် ပြောင်းလွယ်ပြင်လွယ်သည် ဒေတာသိုလှောင်ရုံများ၏ ခိုင်ခံ့မှုနှင့် အတိမ်အနက်ကို ပေါင်းစပ်ထားသည်။
နောက်ဆုံးပေါ် AI မူဘောင်များနှင့် ကြိုတင်တည်ဆောက်ထားသော AI ဝန်ဆောင်မှုများကို Oracle Cloud Infrastructure (OCI) ရှိ data lakehouse တွင်အသုံးပြုနိုင်ပါသည်။
open-source data lake ကိုအသုံးပြုနေစဉ် အပိုဒေတာအမျိုးအစားများနှင့် အလုပ်လုပ်ရန် ဖြစ်နိုင်သည်။ သို့သော် ၎င်းကို စီမံခန့်ခွဲရန် လိုအပ်သော အချိန်နှင့် ကြိုးစားအားထုတ်မှုသည် အမြဲတစေ အားနည်းချက်တစ်ခု ဖြစ်နိုင်သည်။
OCI သည် အပြည့်အဝ စီမံခန့်ခွဲနိုင်သော open source lakehouse ဝန်ဆောင်မှုများကို သက်သာသောနှုန်းထားဖြင့် စီမံခန့်ခွဲပေးကာ နည်းပါးသော လုပ်ငန်းလည်ပတ်မှုကုန်ကျစရိတ်၊ ပိုမိုကောင်းမွန်သော အရွယ်အစားနှင့် လုံခြုံရေးတို့ကို မျှော်မှန်းနိုင်စေရန်နှင့် သင့်လက်ရှိဒေတာအားလုံးကို တစ်နေရာတည်းတွင် စုစည်းနိုင်သည့် စွမ်းရည်ကို ပံ့ပိုးပေးပါသည်။
Data lakehouse သည် အောင်မြင်သောလုပ်ငန်းများအတွက် မရှိမဖြစ်လိုအပ်သော data warehouses နှင့် marts များ၏တန်ဖိုးကို တိုးစေမည်ဖြစ်ပါသည်။
SQL query တစ်ခုတည်းဖြင့် နေရာများစွာမှ lakehouse ကို အသုံးပြု၍ ဒေတာကို ထုတ်ယူနိုင်သည်။
လက်ရှိပရိုဂရမ်များနှင့် ကိရိယာများသည် ချိန်ညှိမှုများပြုလုပ်ရန် သို့မဟုတ် ကျွမ်းကျင်မှုအသစ်များရယူရန်မလိုအပ်ဘဲ ဒေတာအားလုံးထံ ပွင့်လင်းမြင်သာစွာဝင်ရောက်ခွင့်ကို ရရှိသည်။
ကောက်ချက်
data lakehouse ဖြေရှင်းချက်များအား နိဒါန်းပျိုးခြင်းသည် အချိန်၊ ကုန်ကျစရိတ်နှင့် တန်ဖိုးထုတ်ယူခြင်း၏ ရှုပ်ထွေးမှုတို့ကို လျှော့ချနေစဉ် အချိန်၊ ကုန်ကျစရိတ်နှင့် တန်ဖိုးထုတ်ယူမှု၏ ရှုပ်ထွေးမှုတို့ကို လျှော့ချနေစဉ် ဒေတာမှလုပ်ငန်းတန်ဖိုးကို အများဆုံးမြှင့်တင်ရန်အတွက် ပေါင်းစပ်ဒေတာပလပ်ဖောင်းများတွင် ခွဲခြမ်းစိတ်ဖြာမှုနှင့် ဒေတာသိုလှောင်မှုပေါင်းစပ်ခြင်းပေါင်းစပ်ခြင်းဖြစ်သည့် ဒေတာကြီးကြီးမားမားလမ်းကြောင်းကို ရောင်ပြန်ဟပ်ခြင်းဖြစ်သည်။
Databricks၊ Snowflake၊ Ahana၊ Dremio နှင့် Oracle အပါအဝင် ပလပ်ဖောင်းအားလုံးကို "data lakehouse" ၏စိတ်ကူးနှင့် ချိတ်ဆက်ထားသော်လည်း ၎င်းတို့တစ်ခုစီတွင် ထူးခြားသောအင်္ဂါရပ်များရှိပြီး စစ်မှန်သောဒေတာအိုင်ထက် ဒေတာဂိုဒေါင်ကဲ့သို့ ပိုမိုလုပ်ဆောင်ရန် သဘောထားရှိသည်။ တစ်ခုလုံး။
ဖြေရှင်းချက်တစ်ခုကို "ဒေတာကန်တော်ကြီး" အဖြစ် စျေးကွက်တင်သောအခါ၊ စီးပွားရေးလုပ်ငန်းများသည် အမှန်တကယ်ဆိုလိုသည်များကို သတိထားသင့်သည်။
လုပ်ငန်းများသည် “data lakehouse” ကဲ့သို့သော စျေးကွက်ချဲ့ထွင်မှုဆိုင်ရာ ဝေါဟာရများကို ကျော်လွန်ကြည့်ရှုရန် လိုအပ်ပြီး ၎င်းအစား အနာဂတ်တွင် ၎င်းတို့၏လုပ်ငန်းများနှင့် တိုးချဲ့မည့် အကောင်းဆုံးဒေတာပလပ်ဖောင်းကို ရွေးချယ်ရန်အတွက် ပလပ်ဖောင်းတစ်ခုစီ၏ အင်္ဂါရပ်များကို ကြည့်ပါ။
တစ်ဦးစာပြန်ရန် Leave