반응형
SMALL
환경: Bright Cluster Manager (BCM)
목적: 노드 재부팅 시 이미지 전체 재설치 (FULL install)
auto vs full 차이
모드 동작 데이터
| auto | 변경된 파일만 rsync 동기화 | 유지 |
| full | 디스크 전체 포맷 후 이미지 재설치 | 전부 소실 |
⚠ full install은 하드드라이브 전체를 초기화합니다. 반드시 필요한 경우에만 사용하세요.
현재 설정 확인
cmsh
device use <노드명>
show | grep -i autoinstall
auto → full 변경 후 재부팅
cmsh
device use dgxh100-02
set autoinstall full
commit
# 재부팅
device reboot dgxh100-02
재부팅 시 아래 화면이 뜨면 Proceed with FULL install 선택
[ Confirm FULL install ]
This node is configured not to proceed with a FULL install without confirmation.
Should the installer proceed with a FULL install?
Proceed with FULL install ← 선택
Abort and enter maintenance mode
Cancel

작업 완료 후 auto로 복구 (필수)
cmsh
device use dgxh100-02
set autoinstall auto
commit
⚠ full로 두면 다음 재부팅 시에도 전체 재설치가 됩니다. 작업 후 반드시 auto로 되돌리세요.
주의사항
| 데이터 백업 | FULL install 전 필요한 데이터 반드시 백업 |
| autoinstall 복구 | 작업 후 반드시 auto로 되돌릴 것 |
| 소프트웨어 이미지 | 노드에 반영할 이미지가 헤드노드에 최신 상태인지 확인 |
| 시간 소요 | auto 대비 FULL install은 시간이 훨씬 오래 걸림 |
반응형
LIST
'🔧 Engineering > 📁 Study Notes' 카테고리의 다른 글
| NVSwitch 유무에 따른 NVIDIA 패키지 설치 가이드 (0) | 2026.04.03 |
|---|---|
| LVM 생성 및 마운트 가이드 (0) | 2026.04.02 |
| SW RAID0 → RAID5 변경 가이드 (0) | 2026.04.01 |
| NVIDIA AI 정리 (NeMo / Nemotron / NIM / Agentic AI / Token) (0) | 2026.03.24 |
| 서버 문제를 계층으로 나눠서 보는 법 (0) | 2026.03.03 |