010-82449668

EN 中文

《Trino优化宝典》

数据驱动决策的时代,拥有高性能的数据查询平台对于高效数据分析、快速得出分析结果并作出明智的决策至关重要。

Trino作为一款流行的开源分布式SQL查询引擎,目前已成为跨数据源分析作业不可或缺的工具。然而,许多Trino用户和开发人员仍然面临着查询性能不稳定所带来的挑战。

为了助力企业和机构应对这些挑战,了解Trino的复杂性和性能优化技术,最大程度地获取数据价值,我们推出《Trino优化宝典》。该书提供了实现Trino查询性能最大化的必要知识和最佳实践。内容涵盖数据格式(Parquet、ORC)、表格格式(列式布局)、数据源(S3等)以及与Trino性能相关的数据平台架构。 

核心要点:

  • Trino在后台如何运行查询;
  • 在查询执行过程中会发生什么以及可能影响查询性能的因素;
  • 如何优化Trino 获得最佳查询性能;
  • 将Trino查询效率最大化的调优步骤和七个最佳实践,包括配置设定、会话属性、SQL语句和实用建议等;
  • 使用缓存进行Trino优化的真实案例。

面向人群:数据平台工程师、大数据工程师、Trino管理员、开发人员、资深用户等。

立即下载《Trino优化宝典》。

MLPerf基准测试冲出黑马,Alluxio新范式引爆AI存储

为了较好地展示 Alluxio 的缓存性能,我们采用了全球首个且唯一的 AI/ML 存储基准测试——MLPerf® Storage 进行验证。MLPerf™ 是影响力最广的国际 AI 性能基准评测,由图灵奖得主大卫•帕特森(David Patterson)联合顶尖学术机构发起成立,并于2023年推出 MLPerf™ Storage 基准性能测试,旨在以架构中立、具有代表性和可重复的方式衡量 AI 工作负载的存储系统性能。

Alluxio在数据索引和模型分发中的核心价值与应用

在当前的技术环境下,搜索、推荐、广告、大模型、自动驾驶等领域的业务依赖于海量数据的处理和复杂模型的训练。这些任务通常涉及从用户行为数据和社交网络数据中提取大量信息,进行模型训练和推理。这一过程需要强大的数据分发能力,尤其是在多个服务器同时拉取同一份数据时,更是考验基础设施的性能。

南方科技大学分享:大数据技术如何赋能大模型训练及开发

南方科技大学是深圳在中国高等教育改革发展的时代背景下创建的一所高起点、高定位的公办新型研究型大学。2022年2月14日,教育部等三部委公布第二轮“双一流”建设高校及建设学科名单,南方科技大学及数学学科入选“双一流”建设高校及建设学科名单。