Hive 데이터는 Databases > Tables > Partitions > Buckets (or Clusters) 로 조직화할 수 있습니다.

 

항상 테이블을 분할하거나 버킷화할 필요는 없지만, 이러한 추상화를 통해 시스템의 데이터 처리량을 제한하여 쿼리 실행 속도를 향상 시킬 수 있습니다. 처음에 방법만 잘 익혀둔다면 관리도 훨씬 편해집니다.

파티션 테이블 생성

+ Recent posts