主要从技术的角度,对跨地域的数据联邦,或者说总公司和分公司不同数据域的互联互通进行讨论,研究相关技术可行性与分享整个研究过程。
英特尔公布 AI 百佳创新激励计划第七期创新团队名单,Alluxio凭借在AI模型训练优化方面高效的数据平台架构,成为17家AI智慧创新型入选企业之一。
NetApp® StorageGRID®作为全球已大规模部署的可靠对象存储,与Alluxio数据编排平台实现相互兼容,共同支持各类数据驱动型应用程序。
近日,全球首创的开源数据编排软件开发商 Alluxio 宣布斩获 2022 年首届 IEEE 开源软件服务奖。
Alluxio与Spark联合部署实现一个可扩展、敏捷和经济有效的方案,打造现代化的数据平台。 本文提供了Spark + Alluxio这个技术栈/解决方案的概述,你将会了解到系统架构、实践案例和性能及成本基准测试的结果。
Alluxio 与 Spark 是来自加州大学伯克利分校 AMP 实验室的姊妹项目。为了提升性能和简化数据管理,许多企业如中国联通、BOSS直聘、WeRide文远知行、去哪儿等将Alluxio 与 Spark 部署在一起。
随着我们在Iceberg的一些改造,元数据文件也逐渐增大。同时为了降低新增索引文件的读取开销以及Hadoop集群抖动等因素对文件读取的影响,我们引入了Alluxio。
通过这篇文章,我们希望可以对经济化数据存储策略做一个初步探索,首先我们将具象化两个关键特性,然后通过几组实验对技术可行性进行一个讨论。
Shuttle 是OPPO大数据团队开源的高可用高性能的 Spark Remote Shuffle Service,文中详细介绍了Shuttle的架构和设计理念。
人工智能(AI)和机器学习工作负载依赖大型数据集,并且对数据吞吐量有较高的要求,两者都可以通过优化数
Raft是一套基于多副本状态机(Replicated State Machine)实现高可用(HA)和容错的算法。本文介绍了Alluxio的日志系统如何从Zookeeper演进到内置Raft算法来实现高可用(HA)的过程。
介绍如何解决金融场景落地腾讯 Alluxio (DOP=Data Orchestration Platform 数据编排平台过程中遇到的各种问题。