Parquet: различия между версиями

Материал из in.wiki
Перейти к навигации Перейти к поиску
Строка 22: Строка 22:
 
}}
 
}}
 
'''Apache Parquet''' — это бесплатный и открытый [[формат хранения данных|формат]] [[Колоночное хранение данных|хранения колоночных данны]]<nowiki/>х в экосистеме [[Apache Hadoop]]. Он похож на [[RCFile]] и [[ORC]], другие форматы файлов колоночного хранения в [[Hadoop]], и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные [[Сжатие данных|схемы сжатия]] и [[Кодирование данных|кодирования данных]] с повышенной производительностью для обработки сложных данных в больших объемах.
 
'''Apache Parquet''' — это бесплатный и открытый [[формат хранения данных|формат]] [[Колоночное хранение данных|хранения колоночных данны]]<nowiki/>х в экосистеме [[Apache Hadoop]]. Он похож на [[RCFile]] и [[ORC]], другие форматы файлов колоночного хранения в [[Hadoop]], и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные [[Сжатие данных|схемы сжатия]] и [[Кодирование данных|кодирования данных]] с повышенной производительностью для обработки сложных данных в больших объемах.
 +
 +
== Примечания ==
 +
{{Примечания}}

Версия от 00:07, 24 сентября 2024

800px-T64 and pencil.jpg Это незавершённая статья.
Вы можете помочь проекту, исправив и дополнив её.
Apache Parquet logo.svg
Apache Parquet
Язык программирования:
Java (reference implementation)[1] и Java (reference implementation)[1]
Операционная система:
Cross-platform






Дата появления:
13 март 2013; 12 years ago (2013-03-13)
Текущая версия:
2.9.0
Дата выхода текущей версии:
6 октябрь 2021; 3 years ago (2021-10-06)[2]



Лицензия:
Apache License 2.0

Apache Parquet — это бесплатный и открытый формат хранения колоночных данных в экосистеме Apache Hadoop. Он похож на RCFile и ORC, другие форматы файлов колоночного хранения в Hadoop, и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные схемы сжатия и кодирования данных с повышенной производительностью для обработки сложных данных в больших объемах.

Примечания

  1. Parquet-MR source code. GitHub. Дата обращения: 2 июля 2019. Архивировано 11 июня 2018 года.
  2. Apache Parquet – Releases. Apache.org. Дата обращения: 22 февраля 2023. Архивировано 22 февраля 2023 года.