본문 바로가기

Snowflake2

Star schema와 Snowflake schema 비교 star and snowflake schema는 데이터 웨어하우스에서 사용되는 가장 있기 있는 다차원 데이터 모델이다. 스타 스키마와 스노우 플레이크 스키마의 결정적인 차이점은 스타 스키마는 정규화를 사용하지 않는 반면, 스노우 플레이크 스키마는 데이터의 중복을 제거하기 위해 정규화를 사용한다는 것이다. 팩트 및 차원 테이블은 스키마를 만드는데 필수 요구사항이다. 관계형 데이터베이스의 설계는 엔티티-관계 데이터 모델을 사용한다. 이러한 모델에서 데이터베이스 스키마는 엔티티 집합과 엔티티 간의 관계로 구성된다. 이러한 종류의 데이터 모델은 온라인 거래 처리 등에 적합하다. 데이터 웨어하우스는 온라인 데이터 분석을 지원하는 간략한 주제 지향 스키마가 필요하다. 스키마는 전체 데이터베이스를 논리적으로 설명하는.. 2022. 8. 9.
DeltaLake(Databricks), Snowflake References Databricks Apache spark(빅데이터 프로세싱의 표준이 될 만큼 많이 쓰이는 오픈소스 빅데이터 프로젝트)를 만든 사람들이 모여서 창립했으며, DeltaLake, MLFlow 등 다양한 오픈소스 프로젝트를 만들고 이를 기반으로 모든 데이터/분석 AI 워크로드를 한꺼번에 통합해서 쓸 수 있는 통합 클라우드 분석 플랫폼을 제공하는 SaaS 회사이다. 그리고 그 플랫폼의 이름이 "Lakehouse" 이다. Lakehouse Platform 통한 클라우드 분석 플랫폼 (SaaS) 데이터 과학자, 데이터 엔지니어를 위해 설계된 빠르고 쉽게 협업이 가능한 Apache Spark 기반 빅 데이터 분석 서비스 데이터 웨어하우스, 데이터 레이크, 스트리밍 데이터 한 기업 내에서 데이터를 .. 2022. 8. 9.
반응형