parquet
-
揭开 Apache Parquet 文件格式的神秘面纱
你曾经使用过pandas的 pd.read_csv() 吗?如果你使用 parquet 而不是 CSV,那么该命令的运行速度可能会快约 50 倍[1]。 在这篇文章中我们将讨论 A…
-
基于Apache Parquet™的更细粒度的加密方法
本文翻译自uber文章:《One Stone, Three Birds: Finer-Grained Encryption @ Apache Parquet™》 数据访问限制、保留…
-
Flink与Spark读写parquet文件全解析
Parquet介绍 Parquet 是一种开源文件格式,用于处理扁平列式存储数据格式,可供 Hadoop 生态系统中的任何项目使用。 Parquet 可以很好地处理大量复杂数据。它…