본문 바로가기

Snowflake2

Star schema와 Snowflake schema 비교 26.04.17 업데이트Star Schema vs Snowflake Schema데이터 웨어하우스에서 사용되는 가장 인기 있는 다차원 데이터 모델링 패턴이다.(다차원 분석이란 "매출" 이라는 하나의 수치를 시간, 상품, 매장, 고객 같은 여러 차원(dimension)으로 쪼개서 보는 것을 의미한다.)관계형 DB의 ER 모델의 거래 처리(OLTP)에 최적화된 구조라면, 분석 쿼리(OLAP)를 위해 등장한 게 바로 이 두 스키마이다.두 스키마의 결정적인 차이점은 정규화(normalization)를 사용하는지 여부이다. 두 스키마 모두 fact 테이블과 dimension 테이블을 필수 구성요소로 사용한다.Fact 테이블 : 측정 가능한 수치 데이터(매출액, 수량, 클릭수 등)와 각 dimension의 FK를 가.. 2022. 8. 9.
DeltaLake(Databricks), Snowflake References Databricks Apache spark(빅데이터 프로세싱의 표준이 될 만큼 많이 쓰이는 오픈소스 빅데이터 프로젝트)를 만든 사람들이 모여서 창립했으며, DeltaLake, MLFlow 등 다양한 오픈소스 프로젝트를 만들고 이를 기반으로 모든 데이터/분석 AI 워크로드를 한꺼번에 통합해서 쓸 수 있는 통합 클라우드 분석 플랫폼을 제공하는 SaaS 회사이다. 그리고 그 플랫폼의 이름이 "Lakehouse" 이다. Lakehouse Platform 통한 클라우드 분석 플랫폼 (SaaS) 데이터 과학자, 데이터 엔지니어를 위해 설계된 빠르고 쉽게 협업이 가능한 Apache Spark 기반 빅 데이터 분석 서비스 데이터 웨어하우스, 데이터 레이크, 스트리밍 데이터 한 기업 내에서 데이터를 .. 2022. 8. 9.