반응형
SMALL
0. 나는 아직 잘 모른다
나는 인프라 엔지니어 신입이다.
DGX, BMC, InfiniBand, GPU health check…
단어는 많이 듣는데,
정확히 이해하고 있다고 말하긴 아직 어렵다.
명령어는 외워서 치지만,
왜 이걸 치는지 완벽히 설명하라고 하면
잠깐 멈칫한다.
그래서 블로그를 시작했다.
1. 왜 기록하려고 하는가
요즘 이런 생각이 들었다.
- 공부는 하는데 체계가 없다.
- 배운 게 머릿속에서 흩어진다.
- 문제를 보면 어디부터 봐야 할지 아직 감이 부족하다.
그렇다면 답은 하나다.
흩어진 걸 모으자.
이 블로그는
“정답을 아는 사람이 쓰는 공간”이 아니라
“이해해가는 과정을 남기는 공간”이다.
2. 내가 공부하려는 것들
앞으로 이런 것들을 정리해보려고 한다.
Infra & System
- 리눅스 계층 이해하기
- 리소스 / 스토리지 / 네트워크 구분하기
- 기본 점검 루틴 만들기
GPU & Hardware
- nvidia-smi 제대로 보기
- GPU 이슈 확인 순서
- BMC와 ipmitool 이해하기
Troubleshooting
- 알람 발생 시 접근 순서
- 로그 보는 습관 만들기
- “감”이 아니라 “구조”로 생각하기
3. 신입의 목표
나는 빠르게 잘하는 사람이 되고 싶다.
그런데 요즘 깨닫는다.
속도보다 중요한 건 방향이라는 걸.
- 문제를 계층별로 나누는 힘
- 원인을 추적하는 사고력
- 당황하지 않는 구조적 접근
이걸 기르는 게 목표다.
4. 이 블로그의 규칙
- 아는 척하지 않는다.
- 이해 안 되면 이해될 때까지 파본다.
- 배운 건 반드시 구조화한다.
- “왜?”를 최소 3번은 묻는다.
5. 첫 공부 주제
다음 글은
“서버 문제를 계층으로 나누는 방법”
을 정리해보려고 한다.
리소스 / 스토리지 / 네트워크 / GPU
이 네 가지를 어떻게 구분해야 하는지부터.
반응형
LIST
'🔧 Engineering > 📁 Study Notes' 카테고리의 다른 글
| LVM 생성 및 마운트 가이드 (0) | 2026.04.02 |
|---|---|
| BCM 노드 재설치 — autoinstall auto → full 변경 가이드 (0) | 2026.04.01 |
| SW RAID0 → RAID5 변경 가이드 (0) | 2026.04.01 |
| NVIDIA AI 정리 (NeMo / Nemotron / NIM / Agentic AI / Token) (0) | 2026.03.24 |
| 서버 문제를 계층으로 나눠서 보는 법 (0) | 2026.03.03 |