회사 설명

CambridgeNexus는 GPU 기반 데이터 센터를 전문으로 하는 AI 네이티브 컴퓨트 인프라 회사입니다. 우리의 고밀도 저지연 인프라는 현대 기계 학습, 대규모 모델 훈련 및 추론을 지원하도록 설계되었습니다.

역할 설명

책임에는 고성능 GPU 데이터 센터 인프라 설계, 모니터링 및 유지 관리가 포함됩니다. GPU 시스템 문제 해결을 감독하고, 네트워크 효율성을 향상시키며, 네트워크 보안 솔루션을 구현하고, 배포된 시스템의 신뢰성 및 확장성을 보장합니다.

당신이 맡게 될 것

  • GPU 클러스터 배포 (GB300, NVLink, InfiniBand).

  • 전력 및 냉각 최적화 (150kW+/랙).

  • 사고 대응 및 근본 원인 분석.

  • 용량 계획 및 확장.


요구 사항

  • 데이터 센터 / HPC / GPU 인프라에서 8년 이상의 경력.

  • NVIDIA 스택(CUDA, 드라이버, 패브릭)에 대한 실무 경험. * 신뢰성과 성능에 집착

회사 설명

CambridgeNexus는 GPU 기반 데이터 센터를 전문으로 하는 AI 네이티브 컴퓨트 인프라 회사입니다. 우리의 고밀도 저지연 인프라는 현대 기계 학습, 대규모 모델 훈련 및 추론을 지원하도록 설계되었습니다.

역할 설명

책임에는 고성능 GPU 데이터 센터 인프라 설계, 모니터링 및 유지 관리가 포함됩니다. GPU 시스템 문제 해결을 감독하고, 네트워크 효율성을 향상시키며, 네트워크 보안 솔루션을 구현하고, 배포된 시스템의 신뢰성 및 확장성을 보장합니다.

당신이 맡게 될 것

  • GPU 클러스터 배포 (GB300, NVLink, InfiniBand).

  • 전력 및 냉각 최적화 (150kW+/랙).

  • 사고 대응 및 근본 원인 분석.

  • 용량 계획 및 확장.


요구 사항

  • 데이터 센터 / HPC / GPU 인프라에서 8년 이상의 경력.

  • NVIDIA 스택(CUDA, 드라이버, 패브릭)에 대한 실무 경험. * 신뢰성과 성능에 집착

핵심 아키텍처

NVIDIA GB200 및 H100

블랙웰 / 호퍼 건축

쿠버네티스

오케스트레이션 계층

파이토치

ML 프레임워크

러스트 / 고

고성능 시스템