Parquet: различия между версиями

Материал из in.wiki
Перейти к навигации Перейти к поиску
Строка 1: Строка 1:
 
{{Болванка}}
 
{{Болванка}}
'''Apache Parquet''' — это бесплатный и открытый формат [[Колоночное хранение данных|хранения колоночных данны]]<nowiki/>х в экосистеме [[Apache Hadoop]]. Он похож на [[RCFile]] и [[ORC]], другие форматы файлов колоночного хранения в [[Hadoop]], и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные [[Сжатие данных|схемы сжатия]] и [[Кодирование данных|кодирования данных]] с повышенной производительностью для обработки сложных данных в больших объемах.
+
{{Infobox software
 +
| name = Apache Parquet
 +
| logo = Apache Parquet logo.svg
 +
| screenshot =
 +
| caption = Apache Parquet
 +
| developer =
 +
| released = {{Start date and age|2013|03|13|df=yes}} <!-- https://web.archive.org/web/20130504133255/http://blog.cloudera.com/blog/2013/03/introducing-parquet-columnar-storage-for-apache-hadoop/ -->
 +
| latest release version = 2.9.0
 +
| latest release date = {{Start date and age|2021|10|06|df=yes}}<ref>{{cite web |url=https://parquet.apache.org/blog/ |title=Apache Parquet – Releases |website=Apache.org |access-date=22 February 2023 |archive-date=22 February 2023 |archive-url=https://web.archive.org/web/20230222213151/https://parquet.apache.org/blog/ |url-status=live }}</ref>
 +
<!-- This is a comment block.
 +
    Before the version was referring to Parquet-MR, an implementation of the Parquet format:
 +
| latest release version = 1.11.0<ref>{{cite web|title=Github releases|url=https://github.com/apache/parquet-mr/releases}}</ref>
 +
| latest release date = {{Start date and age|2019|03|19|df=yes}}
 +
-->| latest preview version =
 +
| latest preview date =
 +
| operating system = [[Cross-platform]]
 +
| programming language = [[Java (programming language)|Java]] (reference implementation)<ref>{{cite web|url=https://github.com/apache/parquet-mr|title=Parquet-MR source code|website=[[GitHub]]|access-date=2 July 2019|archive-date=11 June 2018|archive-url=https://web.archive.org/web/20180611015409/https://github.com/apache/parquet-mr|url-status=live}}</ref>
 +
| genre = [[Column-oriented DBMS]]
 +
| license = [[Apache License 2.0]]
 +
| website = {{URL|https://parquet.apache.org}}
 +
}}
 +
'''Apache Parquet''' — это бесплатный и открытый [[формат хранения данных|формат]] [[Колоночное хранение данных|хранения колоночных данны]]<nowiki/>х в экосистеме [[Apache Hadoop]]. Он похож на [[RCFile]] и [[ORC]], другие форматы файлов колоночного хранения в [[Hadoop]], и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные [[Сжатие данных|схемы сжатия]] и [[Кодирование данных|кодирования данных]] с повышенной производительностью для обработки сложных данных в больших объемах.

Версия от 00:07, 24 сентября 2024

800px-T64 and pencil.jpg Это незавершённая статья.
Вы можете помочь проекту, исправив и дополнив её.
Apache Parquet logo.svg
Apache Parquet
Язык программирования:
Java (reference implementation)[1] и Java (reference implementation)[1]
Операционная система:
Cross-platform






Дата появления:
13 март 2013; 12 years ago (2013-03-13)
Текущая версия:
2.9.0
Дата выхода текущей версии:
6 октябрь 2021; 3 years ago (2021-10-06)[2]



Лицензия:
Apache License 2.0

Apache Parquet — это бесплатный и открытый формат хранения колоночных данных в экосистеме Apache Hadoop. Он похож на RCFile и ORC, другие форматы файлов колоночного хранения в Hadoop, и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные схемы сжатия и кодирования данных с повышенной производительностью для обработки сложных данных в больших объемах.

  1. Parquet-MR source code. GitHub. Дата обращения: 2 июля 2019. Архивировано 11 июня 2018 года.
  2. Apache Parquet – Releases. Apache.org. Дата обращения: 22 февраля 2023. Архивировано 22 февраля 2023 года.