ML Engineering/Hadoop and Hive
[Hive] 테이블 분할(partition) 과 버킷화(bucket)
KeepPersistStay
2021. 5. 23. 19:17
Hive 데이터는 Databases > Tables > Partitions > Buckets (or Clusters) 로 조직화할 수 있습니다.
항상 테이블을 분할하거나 버킷화할 필요는 없지만, 이러한 추상화를 통해 시스템의 데이터 처리량을 제한하여 쿼리 실행 속도를 향상 시킬 수 있습니다. 처음에 방법만 잘 익혀둔다면 관리도 훨씬 편해집니다.