全球视野

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

数聚存储,聪惠将来:海浪信息散布式存储在东谈主工智能时期的创新与应用


发布日期:2024-11-24 23:03    点击次数:70


起首:Citreport科技频谈

【科技快报网讯】跟着 AI 时期从机器学习演进至深度学习, 并进一步迈向生成式 AI 的新阶段, 算法、算力及数据需求呈现出爆炸式增长态势。大模子爆发初期, 广阔企业布局, 条目存储提供高带宽、高 IOPS 和低时延, 以确保模子大概快速灵验地进行测验。而在模子的内容部署与应用经由中, 又需要达成数据的跨域、跨介质纯真调度, 以及高质料数据集的高效管制, 这对存储系统的纯真性、安全性及数据的可握续走访才能组成了新的挑战。

在近期举办的中国数据与存储峰会 AI+存储协同发展论坛上, 海浪信息散布式存储居品总监张业兴发表了题为「数聚存储, 聪惠将来」的演讲。演讲中, 张业兴不仅转头了往日一年东谈主工智能界限的迅猛发展态势, 还深入推崇了海浪信息在这一布景下若何全心布局新址品、新时期和新决策。

AI时期:存储的转型与重塑

东谈主工智能已被培育至国度策略的高度, 成为驱动新质分娩力发展的要道力量。张业兴指出, 数据行动一种新式分娩身分, 不仅是事业用具, 还能创造经济价值。跟着数据的迅猛增长和摩尔定律的握续鼓励, 东谈主工智能正步入一个爆发式增长的阶段, 相等是在 GPU 商场范围及智能算力界限, 展现出了惊东谈主的增长后劲。据预测, 至 2028 年, 专家 GPU 商场范围有望达到 2461.5 亿好意思元, 而中国商场的范围也将攀升至 459 亿好意思元, 年复合增长率高达 32.8%。这一趋势明晰地标明, 东谈主工智能正引颈着第四次工业翻新, 对经济社会产生着平庸而深切的影响。

在东谈主工智能时期的大布景下, 存储系统的变装已悄然迂曲, 它不再是单纯的数据存储容器, 而是成为了鼓励东谈主工智能发展的中枢组件。跟着大模子时期的茁壮发展, 存储系统正面对着前所未有的挑战。在大模子商场的初期布局中, 已有率先 400 家厂商争相涌入, 模子测验的「速率」成为了竞争的要道。为了提高 GPU 的利用成果, 存储系统必须大概提供 TB 级的高带宽和百万级的高 IOPS, 以确保模子测验的高效出手。

此外, 跟着模子在各行业的落地, 数据的跨域和跨介质调治变得至关蹙迫, 存储系统需要达周至局定名空间的管制, 以援手大范围数据的高效汇集和利用。同期, 在大模子的行业化落地经由中, 为了培育通用模子的专科化才能, 高质料且可重叠利用的数据集成为了不行或缺的资源。数据的安全存储与可握续性走访才能成为了存储系统必须得志的蹙迫条目。

AS13000G7:解锁存储潜能, 赋能 AI将来

针对上述挑战, 海浪信息推出了散布式和会存储平台 AS13000G7, 在性能优化、和会互通、韧性保险等多个维度进行了时期创新。

在性能优化方面,AS13000G7 通过数控分离架构, 减少了数据在转发和拷贝经由中的延长, 单流带宽可达 15GB/s, 单节点带宽率先 100GB/s, 比较传统数控一体架构性能培育 60% 以上。此外,AS13000G7 大概智能识别大 IO 和小 IO, 通过切片处理和团员处理, 将不同范围的数据变成调和的数据团, 并存入全局缓存中, 达成小 IO 性能培育 5 倍。同期, 数据缓存预读功能大概在测验经由中提前加载热门数据, 进一步培育数据加载速率。另外,AS13000G7 还缱绻了全用户态的轻量级 IO 站, 利用多任务并行和无锁 IO 处理时期, 达成了延长斥责 40%, 测验数据加载时期减少 30%。

在近期发布的 MLPerf™ Storage v1.0 AI 存储基准测试中,AS13000G7 参与了八项测试并赢得了五项专家第一的收成, 如 3D-UNet 测试中, 援手 264 个模拟加快器,GPU 利用率超 90% 时提供 360GB 每秒带宽, 单节点带宽超 120GB 每秒;在 CosmoFlow 模子测试中, 样本读取时期极短, 单客户端和多客户端辨认提供了 18GB/s 和 52GB/s 的带宽。

在和会互通方面,AS13000G7 援手多种接入条约, 如 NFS 和 S3 等, 并通过还原数据管制达成文献和对象数据的条约互通、语义无损以及性能一致, 幸免了数据步地转念和多份存储的问题, 为用户从简了高达 50% 的存储空间。同期,AS13000G7 还确立了全局调和定名空间, 纳管所稀有据, 达成跨域、跨介质和跨条约的纯真调治, 提供调和数据视图, 并援手 10 亿级文献秒级检索, 灵验科罚了数据孤岛问题, 通俗用户数据走访与管制。

在韧性保险方面,AS13000G7 如期进行亚健康检测, 并通过里面冗余保护机制达成免迁徙快速重构, 将 TB 级重构时期降至 5 分钟内, 每次故障回复时期斥责 90%。此外,AS13000G7 利用 AIOps 算法预测磁盘故障、容量趋势、性能趋势和 SSD 寿命, 其中磁盘故障预测准确率达 98% 以上, 误报率仅 0.007%。在数据安全层面,AS13000G7 成立了五层系统着重, 给与快筛机器学习和深筛深度学习算法来检测坏心软件, 漏报率仅为 0.029%, 误报率为 0.33%。

面向大模子应用, 基于 AS13000G7 的 AI 存储科罚决策, 整合不同盘位存储开荒变成调和资源池, 提供高性能、高利用率和高韧性, 得志数据全人命周期需求。都集 AI 资源调度平台, 培育数据预读加载成果 30%, 已服务广阔 AIGC 客户。

在上海某高校的应用案例中, 由于该校领有多个与 AI 相干的学科, 数据导入呈现出多元多态的特色, 业务需求也涵盖了数据的汇集、处理、测验和推理等多个步骤。海浪信息为其提供 32 节点 GPU 服务器行动计较援手, 并成立 20 个节点的 AS13000G7 24 盘位全闪节点行动存储资源池, 达成对象文献和会存储, 斥责总体领有资本 (TCO) 达 30%, 大带宽高 IOPS 的脾气援手了模子毫秒级读写, 进一步缩小测验恭候时期 40%。

从商场明白来看, 海浪信息在存储界限取得了权臣的成就。2024 年上半年, 海浪信息存储装机容量位列专家前三, 企业级存储销售额在中国商场名顺次二, 全闪存储销售额相似在中国商场名顺次二。

算计将来, 海浪信息将延续凭借其先进的时期和科罚决策, 在专家和国内存储商场中保握蹙迫地位, 并握续鼓励数据存储行业的发展。同期, 海浪信息也将悉力于助力各行业在东谈主工智能时期达成数字化转型和智能化升级, 有望在时期创新和商场拓展方面取得更大的冲破。