

資深人工智能基礎設施工程師
工程
波士頓 / 現場
部署和優化高密度 GPU 集群(GB300)。管理電力、冷卻和 InfiniBand 網絡。對可靠性充滿熱情。


資深人工智能基礎設施工程師
工程
波士頓 / 現場
部署和優化高密度 GPU 集群(GB300)。管理電力、冷卻和 InfiniBand 網絡。對可靠性充滿熱情。


資深人工智能基礎設施工程師
工程
波士頓 / 現場
部署和優化高密度 GPU 集群(GB300)。管理電力、冷卻和 InfiniBand 網絡。對可靠性充滿熱情。


資深人工智能基礎設施工程師
工程
波士頓 / 現場
部署和優化高密度 GPU 集群(GB300)。管理電力、冷卻和 InfiniBand 網絡。對可靠性充滿熱情。
公司描述
CambridgeNexus 是一家以 AI 為原生的計算基礎設施公司,專注於 GPU 驅動的數據中心。我們的高密度、低延遲基礎設施旨在支持現代機器學習、大規模模型訓練和推理。
角色描述
職責包括設計、監控和維護高性能的 GPU 數據中心基礎設施。您將負責 GPU 系統的故障排除,提升網絡效率,實施網絡安全解決方案,並確保已部署系統的可靠性和可擴展性。
您將擁有的內容
GPU 集群部署 (GB300, NVLink, InfiniBand)。
電力與冷卻最佳化 (150kW+/架)。
事件響應與根本原因分析。
容量規劃及擴展。
要求
8 年以上數據中心 / HPC / GPU 基礎設施經驗。
熟悉 NVIDIA 技術堆疊 (CUDA, 驅動程式, 網路)。* 對可靠性和性能的癡迷
公司描述
CambridgeNexus 是一家以 AI 為原生的計算基礎設施公司,專注於 GPU 驅動的數據中心。我們的高密度、低延遲基礎設施旨在支持現代機器學習、大規模模型訓練和推理。
角色描述
職責包括設計、監控和維護高性能的 GPU 數據中心基礎設施。您將負責 GPU 系統的故障排除,提升網絡效率,實施網絡安全解決方案,並確保已部署系統的可靠性和可擴展性。
您將擁有的內容
GPU 集群部署 (GB300, NVLink, InfiniBand)。
電力與冷卻最佳化 (150kW+/架)。
事件響應與根本原因分析。
容量規劃及擴展。
要求
8 年以上數據中心 / HPC / GPU 基礎設施經驗。
熟悉 NVIDIA 技術堆疊 (CUDA, 驅動程式, 網路)。* 對可靠性和性能的癡迷
信號:異常值
我們不斷尋找10倍的工程師。如果您不符合標準職位描述,但能夠優化GB300叢集或設計低延遲的架構,請立即聯繫我們。
信號:異常值
我們不斷尋找10倍的工程師。如果您不符合標準職位描述,但能夠優化GB300叢集或設計低延遲的架構,請立即聯繫我們。
信號:異常值
我們不斷尋找10倍的工程師。如果您不符合標準職位描述,但能夠優化GB300叢集或設計低延遲的架構,請立即聯繫我們。
核心架構

NVIDIA
H100 / 布萊克威爾級

Kubernetes
管弦樂層

PyTorch
機器學習框架

Rust / Go
高性能系統