Hive 데이터는 Databases > Tables > Partitions > Buckets (or Clusters) 로 조직화할 수 있습니다.
항상 테이블을 분할하거나 버킷화할 필요는 없지만, 이러한 추상화를 통해 시스템의 데이터 처리량을 제한하여 쿼리 실행 속도를 향상 시킬 수 있습니다. 처음에 방법만 잘 익혀둔다면 관리도 훨씬 편해집니다.
파티션 테이블 생성
'ML Engineering > Hadoop and Hive' 카테고리의 다른 글
[Hive] beeline 으로 테이블 데이터 조회 및 다운로드 하기 (0) | 2021.05.23 |
---|---|
[Hive] 로컬 CSV 데이터를 Hive 테이블에 Load하기 (2) | 2021.05.23 |
[Hive] 파일 포맷 (Storage Formats) (0) | 2021.05.23 |
[Hive] 관리형(Managed) 테이블과 외부(External) 테이블 (0) | 2021.05.23 |
[Hive] Hive DDL Commands (0) | 2021.05.23 |