半导体芯片

Annapurna实验室:云中的快速芯片设计

license优先的调度方法增强了资源管理


关于Annapurna实验室

安纳普尔纳峰实验室成立于2011年,是一家无晶圆厂芯片初创企业, 专注于为快速增长的云基础设施带来创新. 成立四年后,安纳普尔纳峰实验室被亚马逊网络服务(AWS)收购。. 从此,安娜普纳 Labs加速了其创新,并开发了许多使云客户受益的产品, 包括AWS Nitro技术, inentia定制机器学习芯片, 和AWS gravon2处理器, 基于64位Arm Neoverse架构 专用云服务器.

他们面临的挑战

作为一家芯片设计公司, 上市时间和工程效率是需要关注的最关键和最昂贵的指标. 记住这一点, Annapurna实验室的团队选择了Altair Accelerator™作业调度器作为他们的前端 以及后端工作流. 该团队在许多专用的Amazon Elastic Compute 云 (EC2)实例上管理工作负载,他们偶尔可以通过手动添加新的按需实例进行扩展. 然而,这个过程并不是自动化的 导致高触感, 效率低下, 忘记使用的计算资源, 不管是规模过小还是过大. 作为加速器的一个特性, 快速扩展未使用的计算资源与Annapurna实验室开发,以增加结构和效率 扩展AWS计算资源, 缩短取得成果的时间, 将开发模式改为持续集成.



Altair的许可优先调度方法使Annapurna实验室能够加强其资源管理. 它不仅使我们能够更好地控制资源使用和成本, 我们极大地提高了生产力,缩短了产品交付时间 持续集成开发流程.”

——Annapurna实验室的Nafea Bshara


我们的解决方案

除了在有需求时自动启动新实例之外, 快速扩展着眼于处理需求的速度,如果速度足够好,就停止扩展. 这意味着需求可以在10分钟内得到满足. 的 许可证优先的调度方法允许Accelerator有效地区分等待许可证的工作负载与等待硬件的工作负载. 只有当工作负载正在等待硬件时,请求AWS实例才有意义. 所有 资源闲置一分钟后被释放.

许多功能是与Annapurna实验室合作添加的, 包括实例类型的可配置选择, Spot实例支持, 防止各种错误,如实例类型饱和, /tmp的大小, 精细控制作业数量 可以在每个新实例和许多其他实例上执行.

电子设计自动化(EDA)作业可能很短,并且实例的启动时间与这些作业的运行时相当. 了解工作负载速度和启动成本的能力使快速扩展能够避免超调. 亚马逊EC2提供 最广泛和最深刻的实例选择, 建立在最新的计算, 存储, 和网络技术,并设计为高性能和安全性. 快速缩放允许将作业资源请求映射到最合适的实例.

虽然AWS在某些情况下具有高弹性,但特定的实例类型可能不可用. Rapid Scaling了解如何在第一种选择不可用时选择备份实例类型. 工作负载激增过去后,空闲实例 终止. 这种灵活性很好地映射到AWS的Reserved、On-demand和Spot实例概念

结果

随着快速缩放的安装,Annapurna实验室已经降低了至少50%的成本. 另外, 现在是Annapurna实验室芯片开发持续集成流程的一部分, 他们看到了更快的增量发展 和连续回归. 安纳普尔纳峰实验室通过项目和用户对资源使用情况的详细视图,对成本和收益进行更严格的控制.

友情链接: 1 2 3 4 5 6 7 8 9 10