公司描述

CambridgeNexus 是一家以 AI 為原生的計算基礎設施公司,專注於 GPU 驅動的數據中心。我們的高密度、低延遲基礎設施旨在支持現代機器學習、大規模模型訓練和推理。

角色描述

職責包括設計、監控和維護高性能的 GPU 數據中心基礎設施。您將負責 GPU 系統的故障排除,提升網絡效率,實施網絡安全解決方案,並確保已部署系統的可靠性和可擴展性。

您將擁有的內容

  • GPU 集群部署 (GB300, NVLink, InfiniBand)。

  • 電力與冷卻最佳化 (150kW+/架)。

  • 事件響應與根本原因分析。

  • 容量規劃及擴展。


要求

  • 8 年以上數據中心 / HPC / GPU 基礎設施經驗。

  • 熟悉 NVIDIA 技術堆疊 (CUDA, 驅動程式, 網路)。* 對可靠性和性能的癡迷

公司描述

CambridgeNexus 是一家以 AI 為原生的計算基礎設施公司,專注於 GPU 驅動的數據中心。我們的高密度、低延遲基礎設施旨在支持現代機器學習、大規模模型訓練和推理。

角色描述

職責包括設計、監控和維護高性能的 GPU 數據中心基礎設施。您將負責 GPU 系統的故障排除,提升網絡效率,實施網絡安全解決方案,並確保已部署系統的可靠性和可擴展性。

您將擁有的內容

  • GPU 集群部署 (GB300, NVLink, InfiniBand)。

  • 電力與冷卻最佳化 (150kW+/架)。

  • 事件響應與根本原因分析。

  • 容量規劃及擴展。


要求

  • 8 年以上數據中心 / HPC / GPU 基礎設施經驗。

  • 熟悉 NVIDIA 技術堆疊 (CUDA, 驅動程式, 網路)。* 對可靠性和性能的癡迷

核心架構

NVIDIA

H100 / 布萊克威爾級

Kubernetes

管弦樂層

PyTorch

機器學習框架

Rust / Go

高性能系統