Data Fabric - 도시의 새로운 아키텍처

차례[숨다][보여 주다]

그렇다면 데이터 패브릭이란 무엇입니까?
데이터 패브릭을 사용해야 하는 이유는 무엇입니까?
데이터 패브릭의 핵심 구성 요소
장점+-
사용 사례
결론

IT 산업의 지속적인 확장과 매초 생성되는 수백만 개의 데이터 포인트로 인해 데이터 이동 및 저장의 중요성이 커졌습니다.

또한 이 데이터는 정확한 의사 결정을 지원하기 위해 명확하고 이해하기 쉬워야 합니다.

경쟁력을 유지하고 장기적인 성공을 달성하려면 회사에서 사용 가능한 가장 효율적인 솔루션을 사용하여 데이터를 저장하고 이동해야 합니다.

이 때문에 더 많은 기업에서 데이터 패브릭을 활용하고 있습니다. 시간, 비용 및 리소스를 절약하는 가장 좋은 방법 중 하나는 데이터 패브릭을 사용하여 데이터를 처리하고 AI 기계 학습을 활성화하는 것입니다.

이 기사에서는 용도, 주요 구성 요소, 장점 및 기타 중요한 세부 정보를 포함하여 Data Fabric에 대해 자세히 살펴보겠습니다.

그렇다면 데이터 패브릭이란 무엇입니까?

위치에 관계없이 데이터와 앱을 관리하고 감시하세요. 핵심적으로 데이터 패브릭은 안전하고 다재다능하며 적응할 수 있는 통합 데이터 아키텍처입니다.

클라우드, 코어 및 에지의 장점을 결합한 데이터 패브릭은 여러 면에서 비즈니스 스토리지 운영에 대한 새로운 전략적 접근 방식입니다.

중앙에서 제어되는 동시에 온프레미스, 공용 및 사설 클라우드는 물론 에지 및 IoT 장치를 포함한 모든 곳에 도달할 수 있습니다.

데이터 사일로는 고층 빌딩의 크기와 다양하고 연결되지 않은 인프라는 과거의 일입니다. 데이터 패브릭은 연결된 환경 전체에서 일관성을 보장하는 포괄적인 데이터 관리 도구 모음을 기반으로 합니다.

자동화를 통해 시간 소모적인 관리를 간소화하고 개발, 테스트 및 배포를 가속화하고 XNUMX시간 내내 자산을 보호합니다.

데이터와 앱이 어디에 있든 단일 플랫폼에서 스토리지 비용, 성능 및 효율성을 추적할 수 있습니다.

오류 수정, 보안 및 규정 준수 문제 해결, 컴퓨팅 확장 및 축소와 같은 실행 가능한 지식이 있으면 하이브리드 클라우드 인프라를 신속하게(경우에 따라 자동으로) 변경할 수 있습니다.

간단히 말해서 Data Fabric은 인프라 배포 및 유지 관리 효율성을 개선하고 비용을 낮추며 성능을 향상시킵니다.

데이터 패브릭을 사용해야 하는 이유는 무엇입니까?

모든 데이터 중심 기업에는 시간, 공간, 다양한 소프트웨어 종류 및 데이터 위치와 같은 장애물을 극복하는 포괄적인 전략이 필요합니다. 데이터는 방화벽 뒤에 숨겨져 있거나 여러 장소에 분산되어서는 안 되며 필요한 사람들이 사용할 수 있어야 합니다.

기업이 성공하려면 미래 지향적인 데이터 솔루션과 안전하고 효과적인 통합 환경이 필요합니다. 이것은 데이터 패브릭으로 수행할 수 있습니다.

실시간 연결, 셀프 서비스, 자동화 및 보편적인 변화에 대한 현대 기업의 요구 사항은 기존 데이터 통합으로 충족할 수 없습니다.

많은 소스에서 데이터를 수집하는 것이 문제가 되지 않는 경우가 많지만 많은 기업에서는 데이터를 다른 소스의 데이터와 통합, 처리, 선별 및 변환하는 데 어려움을 겪고 있습니다.

소비자, 파트너 및 상품에 대한 심층적인 이해를 제공하려면 데이터 관리 프로세스에서 이 중요한 단계가 이루어져야 합니다. 시스템을 업그레이드하고 고객에게 더 나은 서비스를 제공할 수 있기 때문에 클라우드 컴퓨팅, 기업은 결과적으로 경쟁력을 얻습니다.

조직의 사용자가 어디에 있든 데이터 패브릭은 전 세계적으로 퍼져 있는 천으로 상상할 수 있습니다. 이 네트워크에서 사용자는 모든 위치에 있을 수 있으며 다른 위치에 있는 데이터에 제한 없이 실시간으로 액세스할 수 있습니다.

데이터 패브릭의 핵심 구성 요소

데이터 패브릭을 구성하는 핵심 구성 요소는 다양한 방법으로 선택하고 수집할 수 있습니다. 따라서 데이터 패브릭은 다양한 방식으로 구현될 수 있습니다. 데이터 패브릭의 기본 요소를 살펴보겠습니다.

증강 데이터 카탈로그
지속성 계층
지식 그래프
인사이트 및 추천 엔진
데이터 준비 및 데이터 전달 계층
오케스트레이션 및 데이터 운영

에 따라 Data Fabric 아키텍처의 핵심 기둥을 살펴볼 수 있습니다. 가트너.

데이터 패브릭의 Gartner 핵심 구성 요소

각각을 자세히 살펴보겠습니다.

증강 데이터 카탈로그 – 강력한 지식 그래프를 통해 사용자가 모든 종류의 메타데이터에 액세스할 수 있습니다. 또한 기존 정보 간의 고유한 연관성을 개발하고 이해할 수 있는 방식으로 시각적으로 보여줍니다. 사용하여 기계 학습 데이터 자산을 조직 용어와 연결하기 위해 향상된 데이터 카탈로그는 데이터 패브릭에 대한 비즈니스 의미 계층을 생성합니다.
지속성 계층 – 사용 사례에 따라 다양한 관계형 및 비관계형 모델을 사용하여 데이터를 동적으로 저장할 수 있습니다.
활성 메타데이터 – 데이터 패브릭의 독특한 부분. 데이터 패브릭에 다양한 종류의 메타데이터를 수집, 공유 및 분석할 수 있는 기능을 제공합니다. 패시브 메타데이터와 달리 액티브 메타데이터는 시스템과 사람의 지속적인 데이터 사용을 추적합니다(디자인 기반 및 런타임 메타데이터).
지식 그래프 – 데이터 패브릭의 또 다른 기본 단위. 표준 ID, 적응형 스키마 등을 사용하여 연결된 데이터 환경을 표시합니다. 지식 그래프는 데이터 패브릭을 검색 가능하게 만들고 이해를 돕습니다.
인사이트 및 추천 엔진 – 운영 및 분석 사용 사례 모두에 대해 신뢰할 수 있고 강력한 데이터 파이프라인을 구축합니다.
데이터 준비 및 데이터 전달 계층 – ETL(대량), 메시징, CDC, 가상화 및 API를 포함한 모든 메커니즘을 사용하여 모든 소스에서 데이터를 검색하고 모든 대상으로 보낼 수 있습니다.
오케스트레이션 및 데이터 운영 – 이 구성 요소는 데이터를 사용하여 종단 간 워크플로의 각 단계에서 모든 작업을 조정합니다. 이를 통해 파이프라인을 실행하는 시기와 빈도와 파이프라인이 생성하는 데이터를 관리하는 방법을 선택할 수 있습니다.

장점

분산 컨텍스트의 정상적인 데이터는 데이터 패브릭을 통해 액세스, 로드, 통합 및 공유됩니다. 이를 통해 기업은 디지털 전환을 앞당기고 데이터 가치를 극대화할 수 있습니다.

다음은 데이터 패브릭 모델의 주요 이점에 대한 개요입니다.

효율성 :

데이터 패브릭은 이전 쿼리의 결과를 컴파일할 수 있으므로 시스템이 백엔드의 원시 데이터가 아닌 집계된 테이블을 스캔할 수 있습니다.

개별 요청의 응답 시간이 더 빠르기 때문에 전체 저장소의 원시 데이터를 스캔하지 않고 요청이 더 작은 데이터 세트에 액세스할 수 있도록 하면 여러 동시 요청 문제도 해결됩니다.

데이터 패브릭이 쿼리 응답 시간을 크게 단축할 수 있기 때문에 기업은 긴급한 쿼리에 신속하게 응답할 수 있습니다.

스마트 통합

다양한 데이터 종류와 끝점에 걸쳐 데이터를 통합하기 위해 데이터 패브릭은 의미론적 지식 그래프, 메타데이터 관리 및 기계 학습을 사용합니다.

이를 통해 데이터 관리 팀은 관련 데이터 세트를 함께 그룹화하고 새로운 데이터 소스를 회사의 데이터 에코시스템에 통합할 수 있습니다.

이 기능은 데이터 작업 관리의 일부를 자동화하여 위에 표시된 생산성을 절감할 뿐만 아니라 데이터 시스템 사일로를 무너뜨리고 데이터 거버넌스 절차를 중앙 집중화하며 전반적인 데이터 품질을 향상시키는 데 도움이 됩니다.

보다 효과적인 데이터 보안

또한 데이터 액세스 확장을 위해 데이터 보안 및 개인 정보 보호를 희생한다는 의미도 아닙니다.

사실, 특정 역할이 주어진 데이터 세트에 액세스할 수 있는 유일한 역할을 하도록 보장하기 위해 액세스 제어 가드레일을 강화하고 더 많은 데이터 거버넌스 조치를 구현해야 합니다.

또한 데이터 패브릭 아키텍처는 기술 및 데이터 마스킹을 구현하는 보안 팀 기밀 및 민감한 정보 주변의 암호화를 통해 데이터 공유 및 시스템 해킹의 가능성을 줄입니다.

데이터의 민주화

셀프 서비스 애플리케이션은 데이터 패브릭 설계에 의해 촉진되어 데이터 엔지니어, 개발자 및 데이터 분석 팀과 같은 기술 인력을 넘어 데이터 액세스 범위를 확장합니다.

비즈니스 사용자가 더 빠른 비즈니스 선택을 할 수 있도록 하고 기술 사용자가 자신의 기술을 가장 잘 활용하는 활동의 우선 순위를 지정할 수 있도록 함으로써 데이터 병목 현상을 제거하면 생산성이 향상됩니다.

사용 사례

데이터 패브릭 아키텍처는 필요할 때 사용할 수 있도록 모든 형태의 저장된 정보를 처리하기 위한 중요한 구조를 제공하기 위한 것입니다.

이러한 종류의 데이터는 판매 예측에서 조직의 IT 인프라 또는 사용자 끝점 상태에 대한 보고서에 이르기까지 무엇이든 사용할 수 있습니다.

데이터 패브릭 아키텍처 사용 사례는 영업, 마케팅, IT, 사이버 보안 등을 포함하여 비즈니스의 다른 모든 종류의 데이터에 대한 사용 사례와 동일합니다.

그러나 조직의 데이터는 거의 모든 사용 사례에서 조직화, 반구조화 또는 비구조화되는 경우가 많습니다. 관계형 데이터베이스는 구조화된 데이터를 저장하고 데이터베이스 기록과 같이 즉시 활용할 수 있습니다.

정리되거나 분류되지 않은 데이터를 비정형 데이터라고 하며 필요할 때 사용할 수 있도록 준비해야 합니다.

많은 기업이 향후 사용을 위해 획득하고 저장할 수 있는 여러 형태의 비정형 데이터는 다음과 같습니다. 기계 학습, 분석, 센서 데이터, 클라우드 컴퓨팅 및 생산성 앱.

비정형 데이터(예: zip 파일, 웹 페이지 및 이메일)와 함께 저장된 인식된 종류의 데이터를 포함하는 반정형 데이터에는 두 가지 측면이 모두 존재합니다.

기업이 데이터에 보다 빠르고 효과적으로 액세스하고 사용하는 데 도움이 되는 데이터 패브릭의 용량을 기반으로 하는 수많은 사용 사례는 사용 연구를 통해 찾을 수 있습니다.

일반적인 예는 다음과 같습니다.

사기 감지
IoT 분석
공급망 물류
실시간 데이터 분석
고객 정보
운영 효율성 증가
예방정비 분석
또한 업무 복귀 위험 모델
신용 카드로 거래 보안
이탈 예측, 사기 탐지 및 신용 평가

결론

결론적으로, 데이터 사일로는 연결된 회사를 위한 공간을 확보하기 위해 데이터 사용 수준이 증가함에 따라 점진적으로 분해되어야 합니다.

데이터 패브릭의 배포는 1970년대 관계형 데이터베이스의 개발 이후 가장 획기적인 발견 중 하나로 순위를 매기는 이 경로의 상당한 발전을 나타냅니다.

데이터 패브릭은 기술이나 단일 항목 이상이기 때문입니다..

데이터와 비즈니스 운영은 아키텍처 설계, 체계적인 절차 및 사고 방식의 전환을 통해 복잡하게 얽혀 있습니다.

Data Fabric은 비용을 절감하고 성능을 향상시키며 보다 효과적인 인프라 배포 및 유지 관리를 용이하게 합니다. 이는 각 프로세스, 애플리케이션 및 비즈니스 의사 결정이 데이터 기반임을 확인하는 핵심 구성 요소가 될 수 있습니다.

데이터 패브릭 – 도시의 새로운 아키텍처

그렇다면 데이터 패브릭이란 무엇입니까?

데이터 패브릭을 사용해야 하는 이유는 무엇입니까?

데이터 패브릭의 핵심 구성 요소