Parquet

Материал из in.wiki
Версия от 23:05, 23 сентября 2024; Wikitraditio (комментарии | вклад) (Новая страница: «'''Apache Parquet''' — это бесплатный и открытый формат Колоночное хранение данных|хранения кол...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Apache Parquet — это бесплатный и открытый формат хранения колоночных данных в экосистеме Apache Hadoop. Он похож на RCFile и ORC, другие форматы файлов колоночного хранения в Hadoop, и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные схемы сжатия и кодирования данных с повышенной производительностью для обработки сложных данных в больших объемах.