分享内容包括bilibili机器学习架构介绍, 引入数据缓存层的意义,数据缓存层的创新 – severless fuse,以及数据缓存的降本增效实例。
介绍网易大数据平台在特定场景下的需求痛点,分享网易大数据团队目前对于Alluxio的使用场景,以及网易大数据团队对Alluxio作出的优化和未来计划。
此白皮书详细介绍了如何利用公有云(如Amazon AWS、 Google GCP或Microsoft Azure)直接在本地数据上扩展分 析工作负载,而无需通过人工干预将数据复制和同步到 云中。
介绍大数据架构演进,Alluxio研发进展,典型案例分享以及未来工作。
本文重点介绍两大流行开源项目Alluxio 和 Presto之间的协同作用,并展示如何利用两者实现跨云自助服务数据架构。
Alluxio支持使用Apache Ranger来管理和控制目录和文件访问。在Alluxio中使用Ranger有以下两种方法
Alluxio 和 Presto 的核心团队合作实现了客户端嵌入式缓存库 Alluxio Local Cache,来进一步减少数据分析引擎和 Alluxio 之间的通信开销。
此教程,将由Alluxio开源布道师傅正佳博士手把手带你完成新手贡献者任务(new-contributor task)并成为Alluxio开源项目的贡献者(contributor)
本白皮书详细介绍了如何利用公有云(AWS、Google Cloud Platform 或 Microsoft Azure等)通过将分析任务直接应用于本地数据(无需将数据拷贝和同步到云上),进行计算负载的扩展。我们会演示如何在公有云上按需运行Starburst Presto、Spark 和 Hive 等计算分析任务,并通过Alluxio对本地HDFS中的数据进行访问。
在本文中,我们将介绍 Alluxio 的 AI/M模型训练解决方案。
分享作者:王北南 Alluxio 技术负责人 Iceberg概览 Iceberg是一种开放式的ta
元数据同步(metadata sync)是Alluxio的一个核心功能,它能使文件和目录与底层存储系统中的数据源保持一致,便于用户通过Alluxio获取最新数据。