近日,电商及云计算巨头亚马逊高管首次公开将近期旗下电商平台、AWS云服务出现的多起运营异常,与公司急速扩张的生成式AI业务直接关联。目前亚马逊跨部门工程团队已启动专项排查,试图在保障大模型训练算力供给的前提下,最小化平台运行波动,相关优化方案预计将于未来3个月内逐步落地。
今年第二季度以来,亚马逊北美电商站点先后出现3次时长超过20分钟的访问故障,AWS面向中小企业的部分云服务实例也多次出现响应延迟升高的问题,此前外界普遍将故障原因归咎于亚马逊老旧的骨干网络架构,直到近期亚马逊内部沟通文档流出,才给出了完全不同的解释。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录