Alluxio位于计算和存储之间,为企业提供统一的视图,
使其能够轻松地跨多个基础架构环境管理数据和AI工作负载。
Alluxio 数据平台有两种产品 – Alluxio Enterprise Data 和 Alluxio Enterprise AI。
您可根据工作负载需求选择相应的产品,
享受Alluxio带来的巨大优势:卓越的性能、无缝数据访问、简化数据工程并节约成本。
可将模型训练速度提高 20 倍
将模型服务速度提高 10 倍
搭建在现有数据湖之上
90% + GPU 利用率
消除数据副本
随时随地无缝访问数据
数据往往远离应用程序,导致性能低下。复制数据会进一步增加数据工程复杂性和成本。
每当引入新的存储时,应用开发人员都可能需要重写应用程序,来匹配新的存储协议。大量存储选项需要太多的人力来维护和操作。用户体验差,导致用户对数据平台团队的不满增加。
每当数据从一个存储复制到另一个存储时,都会产生成本。API 成本和流量成本会随着时间的推移而增加,而且难以预估。
数据基础设施的构建不能满足AI工作负载的要求。数据平台团队需要升级数据基础设施,并引入昂贵的硬件,如高性能计算或专用存储。
GPU 供不应求,训练通常在GPU可用时进行。当训练数据集远离 GPU 集群时,数据加载速度会非常慢,从而浪费 GPU周期。而复制数据会导致数据工程复杂性的问题。
模型通常需要根据不同的协议从多个数据源获取数据。因此,数据往往离模型较远,造成 I/O 瓶颈。对海量小文件进行元数据操作也会导致性能低下,进而使训练流程停滞不前。
热衷于走在技术前沿并构建创新产品
“随着越来越多的大数据和AI应用容器化, Alluxio正在成为大型企业和机构的首选,作为加速数据分析和模型训练的中间层。我们在1000个节点的集群中部署了Alluxio,用来加速我们游戏A平台上模型训练的数据预处理。事实证明 Alluxio稳定、可扩展且易于管理。”
“日本乐天株式会社日常会处理各种海量的数据集,以帮助发展公司涉及70多种业务的生态系统,从而为我们的商家和合作伙伴赋能,并通过有效的商业洞察、产品和市场情报、客户激励等举措为我们的客户提供最佳旳服务体验。Alluxio能够跨越多个数据中心和云,以更有效的方式冋我们的内部用戶提供数据可用性和访问,我们最近将数据利用率提高了一倍,收益显著。”
— Sandipan Chakraborty
乐天全球数据办公室工程总监兼数据和
AI平台首席架构师
“在Uber,我们通过运行Alluxio加速大规模分析査询,支撑重要的业务决策, Alluxio帮助我们在大数据处理场景下实现了稳定的性能。在大数据的容器化、存算分离的趋势下,我们相信像 Alluxio这样的连接计算和存储的统一层会持续发挥关键作用。”
— 梁晨 Uber交互式分析团队高级软件工程师
与超过300+知名机构共同成长