Impala1 Impala의 Architecture와 Components에 대한 정리 Impala(임팔라) 란? 아파치 하둡을 실행하는 컴퓨터 클러스터에 저장된 데이터를 위한 오픈 소스 대규모 병렬 처리 SQL 쿼리 엔진이다. Apache Hadoop 파일 형식으로 저장된 데이터에 대해 low-latency 고성능 SQL 쿼리를 제공한다. 쿼리에 대한 빠른 응답으로 대화형 SQL 이라고도 한다. Impala는 Hive 메타 스토어(HMS)와 통합되어 두 구성 요소 간에 데이터베이스와 테이블을 공유한다. Hive와 높은 수준의 통합 및 HiveQL 구문과의 호환성을 통해 Impala 또는 Hive를 사용하여 테이블을 만들고 쿼리를 실행하고 데이터를 로드하는 등의 작업을 수행할 수 있다. - Map-reduce 대신 별도의 실행 엔진을 사용한다. - 다양한 파일 저장소(HDFS, Kudu,.. 2022. 7. 31. 이전 1 다음 반응형