Parquet: различия между версиями
Перейти к навигации
Перейти к поиску
Строка 1: | Строка 1: | ||
{{Болванка}} | {{Болванка}} | ||
− | '''Apache Parquet''' — это бесплатный и открытый формат [[Колоночное хранение данных|хранения колоночных данны]]<nowiki/>х в экосистеме [[Apache Hadoop]]. Он похож на [[RCFile]] и [[ORC]], другие форматы файлов колоночного хранения в [[Hadoop]], и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные [[Сжатие данных|схемы сжатия]] и [[Кодирование данных|кодирования данных]] с повышенной производительностью для обработки сложных данных в больших объемах. | + | {{Infobox software |
+ | | name = Apache Parquet | ||
+ | | logo = Apache Parquet logo.svg | ||
+ | | screenshot = | ||
+ | | caption = Apache Parquet | ||
+ | | developer = | ||
+ | | released = {{Start date and age|2013|03|13|df=yes}} <!-- https://web.archive.org/web/20130504133255/http://blog.cloudera.com/blog/2013/03/introducing-parquet-columnar-storage-for-apache-hadoop/ --> | ||
+ | | latest release version = 2.9.0 | ||
+ | | latest release date = {{Start date and age|2021|10|06|df=yes}}<ref>{{cite web |url=https://parquet.apache.org/blog/ |title=Apache Parquet – Releases |website=Apache.org |access-date=22 February 2023 |archive-date=22 February 2023 |archive-url=https://web.archive.org/web/20230222213151/https://parquet.apache.org/blog/ |url-status=live }}</ref> | ||
+ | <!-- This is a comment block. | ||
+ | Before the version was referring to Parquet-MR, an implementation of the Parquet format: | ||
+ | | latest release version = 1.11.0<ref>{{cite web|title=Github releases|url=https://github.com/apache/parquet-mr/releases}}</ref> | ||
+ | | latest release date = {{Start date and age|2019|03|19|df=yes}} | ||
+ | -->| latest preview version = | ||
+ | | latest preview date = | ||
+ | | operating system = [[Cross-platform]] | ||
+ | | programming language = [[Java (programming language)|Java]] (reference implementation)<ref>{{cite web|url=https://github.com/apache/parquet-mr|title=Parquet-MR source code|website=[[GitHub]]|access-date=2 July 2019|archive-date=11 June 2018|archive-url=https://web.archive.org/web/20180611015409/https://github.com/apache/parquet-mr|url-status=live}}</ref> | ||
+ | | genre = [[Column-oriented DBMS]] | ||
+ | | license = [[Apache License 2.0]] | ||
+ | | website = {{URL|https://parquet.apache.org}} | ||
+ | }} | ||
+ | '''Apache Parquet''' — это бесплатный и открытый [[формат хранения данных|формат]] [[Колоночное хранение данных|хранения колоночных данны]]<nowiki/>х в экосистеме [[Apache Hadoop]]. Он похож на [[RCFile]] и [[ORC]], другие форматы файлов колоночного хранения в [[Hadoop]], и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные [[Сжатие данных|схемы сжатия]] и [[Кодирование данных|кодирования данных]] с повышенной производительностью для обработки сложных данных в больших объемах. |
Версия от 00:07, 24 сентября 2024
![]() |
Это незавершённая статья. Вы можете помочь проекту, исправив и дополнив её. |
Apache Parquet |
- Язык программирования:
- Java (reference implementation)[1] и Java (reference implementation)[1]
- Дата появления:
- 13 март 2013
- Текущая версия:
- 2.9.0
- Дата выхода текущей версии:
- 6 октябрь 2021[2]
Apache Parquet — это бесплатный и открытый формат хранения колоночных данных в экосистеме Apache Hadoop. Он похож на RCFile и ORC, другие форматы файлов колоночного хранения в Hadoop, и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные схемы сжатия и кодирования данных с повышенной производительностью для обработки сложных данных в больших объемах.
- ↑ Parquet-MR source code . GitHub. Дата обращения: 2 июля 2019. Архивировано 11 июня 2018 года.
- ↑ Apache Parquet – Releases . Apache.org. Дата обращения: 22 февраля 2023. Архивировано 22 февраля 2023 года.