🔧 Engineering/📁 GPU & Hardware

BMC란 무엇인가

만두개 2026. 3. 3. 17:58
반응형
SMALL

— 서버 외부 관리 인터페이스 기본 정리


DGX H100시스템의 네트워크 포트

1. BMC 개요

BMC(Baseboard Management Controller)는 서버 메인보드에 내장된 독립적인 관리 컨트롤러다.

운영체제(OS)와 별도로 동작하며, 서버 전원 및 하드웨어 상태를 원격으로 관리할 수 있다.

OS가 내려간 상태에서도 접근 가능하다는 점이 가장 큰 특징이다.


2. 왜 필요한가

일반적인 SSH 접속은 OS가 정상 동작해야 가능하다.

하지만 다음과 같은 상황에서는 SSH가 불가능하다.

  • 커널 패닉
  • OS 부팅 실패
  • 네트워크 설정 오류
  • 시스템 다운

이때 BMC를 통해:

  • 전원 제어
  • 콘솔 접속
  • 하드웨어 상태 확인
  • 이벤트 로그 확인

이 가능하다.


DGX H100 시스템의 BMC 대시보드


3. BMC에서 가능한 주요 기능

1) 전원 제어

  • Power On
  • Power Off
  • Power Cycle
  • Reset

OS와 무관하게 수행 가능하다.


2) 원격 콘솔 (KVM)

  • BIOS 화면 접근
  • 부팅 로그 확인
  • OS 설치 작업

그래픽 기반 콘솔 제공.


3) 센서 모니터링

  • CPU 온도
  • 팬 속도
  • 전압 상태
  • GPU 온도 (플랫폼에 따라 다름)

하드웨어 레벨 상태 확인 가능.


4) SEL(System Event Log)

하드웨어 이벤트 로그 저장 영역.

예:

  • 온도 초과
  • 전원 장애
  • 팬 오류

ipmitool로 확인 가능:

ipmitool sel elist

4. 접근 방식

웹 인터페이스

  • BMC IP로 브라우저 접속
  • 별도 관리 네트워크 사용

CLI (ipmitool)

ipmitool lan print 1
 

네트워크 설정 확인 가능.


5. BMC와 OS의 차이

구분BMCOS
동작 위치 메인보드 컨트롤러 서버 시스템
OS 의존성 없음 필요
전원 제어 가능 불가능
하드웨어 로그 직접 확인 일부만 확인

6. 정리

BMC는 서버 내부 시스템이 아니라 서버 외부에서 제어하는 관리 인터페이스다.

OS 문제가 발생해도 서버를 직접 제어할 수 있는 마지막 접근 경로다.

반응형
LIST