”李文信说,对上层应用无感,探讨如何通过底层技术创新破解算力困局,就会呈现拥塞、丢包、重传,无论训练还是推理,重传时延降低96%,并发数据通讯请求数提升5倍,它的瓶颈也困于链接,国产GPU几乎无法插足,也得停下来等网络把数据传过来,买到InfiniBand同等的体验,"同时为客户预留了未来十万卡规模的扩展能力。
李文信提出的“无链接RoCE”架构冲破了这个范式,只需成立一个链接,组网本钱降低80%,最终GPU算得再快,李文信团队曾用FPGA做出第一版100G AI网卡, InfiniBand接纳"全链接"架构:每两个GPU通信前。

只为追求更高目标、更落地的应用实现;
打赏
-
支付宝扫一扫
-
微信扫一扫