Parquet: различия между версиями
Строка 24: | Строка 24: | ||
== История == | == История == | ||
− | Проект с открытым исходным кодом по созданию Apache Parquet начался как совместный проект [[Twitter]] и Cloudera. | + | Проект с открытым исходным кодом по созданию Apache Parquet начался как совместный проект [[Twitter]]<ref>{{cite web|url=https://blog.twitter.com/2013/announcing-parquet-10-columnar-storage-for-hadoop|title=Release Date|access-date=2016-09-12|archive-date=2016-10-20|archive-url=https://web.archive.org/web/20161020154829/https://blog.twitter.com/2013/announcing-parquet-10-columnar-storage-for-hadoop|url-status=live}}</ref> и Cloudera<ref>{{Cite web|url=http://blog.cloudera.com/blog/2013/03/introducing-parquet-columnar-storage-for-apache-hadoop/|archive-url=https://web.archive.org/web/20130504133255/http://blog.cloudera.com/blog/2013/03/introducing-parquet-columnar-storage-for-apache-hadoop/|url-status=dead|archive-date=2013-05-04|title=Introducing Parquet: Efficient Columnar Storage for Apache Hadoop - Cloudera Engineering Blog|date=2013-03-13|language=en-US|access-date=2018-10-22}}</ref>. |
Parquet был разработан как улучшение колоночного формата хранения данных [[Trevni]], созданного [[Каттинг, Дуглас|Дугом Каттингом]], создателем Hadoop. | Parquet был разработан как улучшение колоночного формата хранения данных [[Trevni]], созданного [[Каттинг, Дуглас|Дугом Каттингом]], создателем Hadoop. | ||
− | Первая версия, Apache Parquet 1.0, была выпущена в июле 2013 года. С 27 апреля 2015 года Apache Parquet является [[Проекты верхнего уровня Apache Software Foundation|проектом верхнего уровня]], спонсируемым A[[pache Software Foundation]] (ASF). | + | Первая версия, Apache Parquet{{nbsp}}1.0, была выпущена в июле 2013 года. С 27 апреля 2015 года Apache Parquet является [[Проекты верхнего уровня Apache Software Foundation|проектом верхнего уровня]], спонсируемым A[[pache Software Foundation]] (ASF).<ref>{{Cite web|url = http://www.infoworld.com/article/2915565/big-data/apache-parquet-paves-the-way-towards-better-hadoop-data-storage.html|title = Apache Parquet paves the way for better Hadoop data storage|date = 28 April 2015|access-date = 21 May 2017|archive-date = 31 May 2017|archive-url = https://web.archive.org/web/20170531130443/http://www.infoworld.com/article/2915565/big-data/apache-parquet-paves-the-way-towards-better-hadoop-data-storage.html|url-status = live}}</ref><ref>{{Cite web|url=https://blogs.apache.org/foundation/entry/the_apache_software_foundation_announces75|title=The Apache Software Foundation Announces Apache™ Parquet™ as a Top-Level Project : The Apache Software Foundation Blog|date=27 April 2015|access-date=21 May 2017|archive-date=20 August 2017|archive-url=https://web.archive.org/web/20170820074502/https://blogs.apache.org/foundation/entry/the_apache_software_foundation_announces75|url-status=live}}</ref>. |
== Примечания == | == Примечания == | ||
{{Примечания}} | {{Примечания}} |
Версия от 01:18, 25 сентября 2024
![]() |
Это незавершённая статья. Вы можете помочь проекту, исправив и дополнив её. |
Apache Parquet |
- Язык программирования:
- Java (reference implementation)[1] и Java (reference implementation)[1]
- Дата появления:
- 13 март 2013
- Текущая версия:
- 2.9.0
- Дата выхода текущей версии:
- 6 октябрь 2021[2]
Apache Parquet — это бесплатный и открытый формат хранения колоночных данных в экосистеме Apache Hadoop. Он похож на RCFile и ORC, другие форматы файлов колоночного хранения в Hadoop, и совместим с большинством фреймворков обработки данных вокруг Hadoop. Он обеспечивает эффективные схемы сжатия и кодирования данных с повышенной производительностью для обработки сложных данных в больших объемах.
История
Проект с открытым исходным кодом по созданию Apache Parquet начался как совместный проект Twitter[3] и Cloudera[4].
Parquet был разработан как улучшение колоночного формата хранения данных Trevni, созданного Дугом Каттингом, создателем Hadoop.
Первая версия, Apache Parquet 1.0, была выпущена в июле 2013 года. С 27 апреля 2015 года Apache Parquet является проектом верхнего уровня, спонсируемым Apache Software Foundation (ASF).[5][6].
Примечания
- ↑ Parquet-MR source code . GitHub. Дата обращения: 2 июля 2019. Архивировано 11 июня 2018 года.
- ↑ Apache Parquet – Releases . Apache.org. Дата обращения: 22 февраля 2023. Архивировано 22 февраля 2023 года.
- ↑ Release Date . Дата обращения: 12 сентября 2016. Архивировано 20 октября 2016 года.
- ↑ Introducing Parquet: Efficient Columnar Storage for Apache Hadoop - Cloudera Engineering Blog (амер. англ.) (13 марта 2013). Дата обращения: 22 октября 2018. Архивировано из оригинала 4 мая 2013 года.
- ↑ Apache Parquet paves the way for better Hadoop data storage (28 апреля 2015). Дата обращения: 21 мая 2017. Архивировано 31 мая 2017 года.
- ↑ The Apache Software Foundation Announces Apache™ Parquet™ as a Top-Level Project : The Apache Software Foundation Blog (27 апреля 2015). Дата обращения: 21 мая 2017. Архивировано 20 августа 2017 года.