亚马逊AWS官方博客
Tag: Apache Arrow
使用 Spark 与 Apache Arrow 同时训练多个机器学习模型
Spark是一套分布式计算框架,通过PyArrow实现了Pandas UDF等多项新功能。我们可以使用Spark的分布式与高级机器学习模型生命周期功能构建起具有大批量生产模型的规模化产品。
Spark是一套分布式计算框架,通过PyArrow实现了Pandas UDF等多项新功能。我们可以使用Spark的分布式与高级机器学习模型生命周期功能构建起具有大批量生产模型的规模化产品。