百度支持文库_首款支持OAI标准和液冷散热的AI计算平台 百度X-MAN4.0正式发布

雷锋网9月27日在荷兰阿姆斯特丹召开的2019 OCP Regional Summit会议上,百度发布了业界首个支持OAI ( openacceleratorinfrastructure )标准和液冷散热的超AI计算平台X-MAN4.0。

OAI标准是什么?

随着AI技术的快速发展,许多AI芯片公司诞生,AI芯片产业的多样性发展,但由于AI硬件系统设计的技术难度和复杂性,研发周期通常需要投入大量的研发资源,阻碍了新的AI加快芯片的落地和应用。

在今年3月的OCP全球峰会上,百度与Facebook和微软合作制定了AI硬件加速模块的大小、供电、高速互连接口等规格,然后主导了AI硬件加速模块和系统设计的OAI项目, 总结定义了AI硬件加速模块本身、主板、互连拓扑、机箱、供电、散热、系统管理等系列设计规范。

通过OAI标准,相关制造商可以统一AI硬件加速模块和系统设计,与多样性AI加速芯片兼容。 OAI标准也受到谷歌、蚂蚁、英伟达、英特尔、浪潮、IBM等行业厂商的支持。

百度支持文库

首次支持OAI标准和液冷散热的AI计算产品X-MAN4.0

X-MAN4.0是百度超AI计算平台X-MAN系列产品的第四代,是第一款支持OAI标准和液冷散热的AI计算产品。

X-MAN4.0单节点可以支持8个AI加速器,并且加速器之间采用了8端口混合缓冲( HCM )互连,双向通信带宽最大为56 GBps。

在单机柜级别,X-MAN4.0最多可支持32个AI加速器,并且可以构建可扩展的互连群集。 X-MAN4.0符合整个ODCC 3.0机柜的标准,高度为4SU(182.5mm )、宽度为21英寸( 536.0mm )、长度为850mm,支持空冷散热方式,还支持液冷,采用了更高效的48V供电方式。

X-MAN系列是百度用于超大规模AI训练的专用平台,已在百度内部数据中心大规模应用。 自研产品能最大限度地满足百度的需求,X-MAN 1.0首次实现了AI计算硬件的解耦结构,X-MAN2.0首次将冷板式液冷散热技术应用于AI计算产品,X-MAN3.0首次提出了模块化标准化设计。

从AI芯片昆仑到超AI计算平台X-MAN,以及深度学习框架paddle等,百度AI构建了硬软一体AI解决方案。

大家都在看

相关专题