Apache Parquet

Page d’aide sur l’homonymie

Pour les articles homonymes, voir Parquet.

Apache Parquet
Description de l'image Apache Parquet logo.svg.

Informations
Développé par Apache Software FoundationVoir et modifier les données sur Wikidata
Première version [1]Voir et modifier les données sur Wikidata
Dépôt git-wip-us.apache.org/repos/asf/parquet-mr.gitVoir et modifier les données sur Wikidata
Écrit en JavaVoir et modifier les données sur Wikidata
Type Format de fichier (en)
Format de sérialisation de données (d)
Projet de la fondation Apache (d)Voir et modifier les données sur Wikidata
Licence Licence Apache version 2.0Voir et modifier les données sur Wikidata
Documentation parquet.apache.org/docsVoir et modifier les données sur Wikidata
Site web parquet.apache.orgVoir et modifier les données sur Wikidata

modifier - modifier le code - voir Wikidata (aide) Consultez la documentation du modèle

Apache Parquet
Caractéristiques
Extension
.parquetVoir et modifier les données sur Wikidata
Développé par
Apache Software FoundationVoir et modifier les données sur Wikidata
Version initiale
, Voir et modifier les données sur Wikidata
Site web
(en) parquet.apache.orgVoir et modifier les données sur Wikidata

modifier - modifier le code - modifier WikidataDocumentation du modèle

Apache Parquet est un format de fichiers orienté colonne, initialement développé pour l'écosystème de calcul distribué Apache Hadoop. Il est similaire aux autres formats de fichiers de stockage colonnaires disponibles dans Hadoop, à savoir RCFile et Optimized RCFile. Il est compatible avec la plupart des frameworks de traitement de données de l'environnement Hadoop. Il fournit des schémas efficaces de compression et de codage de données avec des performances améliorées pour gérer des données complexes en masse.

Historique

Le projet open source qui a abouti à Apache Parquet vient des efforts conjoints entre Twitter[2] et Cloudera[3]. La première version de Apache Parquet 1.0 sort en . Depuis le Apache Parquet devient un projet top-level de la Apache Software Foundation [4],[5]

Articles connexes

Notes et références

  1. « https://projects.apache.org/json/projects/parquet.json » (consulté le )
  2. « Announcing Parquet 1.0 : Columnar Storage for Hadoop », sur twitter.com (consulté le ).
  3. (en) « Cloudera Blog - », sur Cloudera Blog (consulté le ).
  4. (en) « Apache Parquet paves the way for better Hadoop data storage », sur InfoWorld (consulté le ).
  5. (en) « The Apache Software Foundation Announces Apache™ Parquet™ as a Top-Level Project », sur The Apache Software Foundation Blog, (consulté le ).
  • (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Apache Parquet » (voir la liste des auteurs).
v · m
Écosystème Hadoop
Distributions Hadoop
Base de données
Flux de données
Interrogation
Machine Learning
SQL
Gestionnaire de cluster
Format de fichier
Vrac
  • icône décorative Portail des logiciels libres
  • icône décorative Portail des données