010-82449668

EN 中文

为财富50强科技巨头赋能下一代数据平台

随着企业规模的扩大,在数据领域面临着越来越多的挑战,数据量的爆发式增长、多样数据渠道的统一管理问题,以及由此而产生的的各种数据处理成本高、效率低等问题日益凸显。为了更好挖掘企业具体需求痛点,提供更具适用性的解决方案,我们分享一家财富50强科技巨头在 Alluxio 的加持下如何应对挑战,实现数据平台技术栈的标准化,能够在任何环境中访问无处不在的数据。

 

在部署 Alluxio 之前,该公司无法实现跨本地数据中心和公有云之间的数据访问,与此同时,在解决数据访问的问题时还遇到诸多挑战:

巨大的S3流量成本

数据科学家经常需要访问S3 存储桶中的数据,因而产生高昂的流量成本,显著增加了数据平台的长期总拥有成本(TCO)。

终端用户体验差,数据分析时间长

手动拷贝数据意味着数据不能立即可用。数据可能会有数小时或数天的延迟,继而导致用户体验差和用户投诉。数据不可用大大拖慢了数据分析的速度。

因缺乏应用可移植性,云化之路受阻

当数据同时存放于 HDFS 和 S3 中时,除非对数据进行拷贝,否则必须修改应用才能进行数据访问。由于应用程序不能在本地和云环境之间移植,因此阻碍了混合云和多云部署。

通过部署 Alluxio,该财富50强科技公司实现了混合云策略,并具备了多云部署的条件。将 Alluxio 作为全新的数据层后,数据平台团队无需再进行数据拷贝,因而提升了敏捷性,降低了 TCO,并缩短了数据分析所需的时间。

作为一家服务全球10 亿多用户的科技巨头,为何会选择 Alluxio,以及 Alluxio 提供了怎样的“解决方案”。

立即下载案例研究,了解更多精彩内容!

Alluxio在数据索引和模型分发中的核心价值与应用

在当前的技术环境下,搜索、推荐、广告、大模型、自动驾驶等领域的业务依赖于海量数据的处理和复杂模型的训练。这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息,进行模型训练和推理。这一过程需要强大的数据分发能力,尤其是在多个服务器同时拉取同一份数据时,更是考验基础设施的性能。

南方科技大学分享:大数据技术如何赋能大模型训练及开发

南方科技大学是深圳在中国高等教育改革发展的时代背景下创建的一所高起点、高定位的公办新型研究型大学。2022年2月14日,教育部等三部委公布第二轮“双一流”建设高校及建设学科名单,南方科技大学及数学学科入选“双一流”建设高校及建设学科名单。

Shopee 在 Alluxio 加速 AI 训练的实践与探索

Shopee是东南亚领航电商平台,覆盖新加坡、马来西亚、菲律宾、泰国、越南、巴西等十余个市场,同时在中国深圳、上海和香港设立跨境业务办公室。2023年Shopee总订单量达82亿,2024年第二季度总订单量同比增长40%,增势强劲。