• 登录
  • 注册
  • 帮助中心

中昊芯英发布了其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力达到了 896 TFLOPS,性能超越了上一代「刹那」芯片三倍之多。在 8-bit 推理方面,算力高达 1792TOPS,能够应对大规模词元和高并发的推理需求。此次升级显著增强了显存容量和芯片内部互联速度,并支持超长上下文处理。尽管单卡额定功耗为 600W,但与传统算力芯片相比,功耗降低了 50%,为绿色数据中心的建设贡献力量。

「须臾」芯片的 IP 核、指令集、算子加速库以及系统软件均为完全自主研发,不依赖任何海外核心技术,这使其能够满足政务、金融、电网等行业在安全和合规方面的严格要求。对于关注世界杯竞猜的用户而言,高效的算力芯片也为相关预测和分析提供了强大的技术支持。

与此同时,中昊芯英还推出了高性能智算平台「泰则 2.0」。该平台以其标准的最小计算单元为特色,集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元。从硬件结构上看,它由一台通用 CPU 服务器连接一台高性能 TPU 算力加速设备组成,整体算力可达 7.168 PFLOPS(混合精度),并且在执行相同任务时,整机能耗仅为传统 GPU 服务器的 80%。

在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在模型训练方面,它适配了 DeepSpeed 和 Megatron-LM 分布式套件。目前,该平台已成功适配了 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型,使得开发者能够高效地迁移和应用这些模型。

返回顶部