开源数据编排软件开发商Alluxio宣布正式发布数据编排2.7版本,新版本立即可用。
2.7版本通过并行数据加载、数据预处理和训练工作流,可将机器学训练的I/O效率提高5倍,从而显著降低成本。
新版本还提供了更强的分析,并能更好地支持Apache Hudi和Iceberg等开放表格格式,使得对数据湖的访问更易于扩展,从而实现了Presto和Spark的分析提速。
“Alluxio 2.7版本进一步巩固了Alluxio在云上人工智能(AI)、机器学和深度学方面的重要地位,”Alluxio创始人兼首席执行官李浩源表示。
“随着数据集的增长以及CPU和GPU计算能力的增强,机器学和深度学已成为AI主流技术。这些技术的兴起推动了AI的发展,但也凸显了数据和存储系统访问中存在的一些挑战。”