编辑/郑远方
特斯拉首次披露了自研AI芯片及Dojo系统更多细节。
日前,硅谷芯片技术研讨会HOT CHIPS上,特斯拉硬件工程师Emil Talpes公开了特斯拉Dojo超算指令集结构细节,并展示了Dojo的数据格式、系统网络、软件系统绕行死节点能力等。
所谓 Dojo,是特斯拉自研的超级计算机,可利用海量视频数据,完成“无人监管”的标注和训练。
在去年的AI Day上,特斯拉就已发布Dojo超级计算机,但当时其“羽翼未丰”,尚只有第一个芯片及训练块,公司仍在推动构建完整的Dojo Exapod。
而特斯拉也表示,理论上,Dojo ExaPod将是世界上最快的AI训练超级计算机。
如今,Dojo Exapod也终于揭开面纱——从本次研讨会上Talpes的展示来看,每个Dojo ExaPod集成120个训练模块,内置3000个D1芯片,拥有超过100万个训练节点,算力达到1.1EFLOP*(每秒千万亿次浮点运算)。
微架构方面,每个Dojo节点都有一个内核,是一台具有CPU专用内存和I/O接口的成熟计算机。
Dojo Exapod的核心,便是特斯拉自研的D1芯片。该芯片由台积电制造,采用7nm工艺,拥有500亿个晶体管,芯片面积为645mm²,小于英伟达的A100(826 mm²)和AMD Arcturus(750 mm²)。
值得注意的是,有望在下个月现身的特斯拉人形机器人“擎天柱”大脑所使用的,便是Dojo D1超级计算芯片,每个D1芯片之间无缝连接,相邻芯片之间的延迟极低,训练模块最大程度上实现了带宽的保留。
特斯拉之前已透露,Tesla Bot“擎天柱”头部将配备与自家汽车相同的智能驾驶摄像头,并与汽车共用AI系统——换言之,特斯拉人形机器人延续了以视觉为主的传感技术路线。
得益于庞大数据库的支撑、AI预测能力与算法,特斯拉认为,纯视觉方案也能较好地弥补深度传感器缺失所带来的不足。目前,其基于视觉的神经网络技术已在汽车FSD上获得实战验证,华安证券27日报告指出,该技术有望借助Dojo超算加速训练升级。