반응형
SMALL
2026.04.07 - [🔧 Engineering/📁 Study Notes] - 오늘 시험 문제 정리 — 명령어 핵심 정리
각 명령어별 주요 옵션 의미 정리
오늘 시험 문제 정리 — 명령어 핵심 정리
1. NVLink 확인# GPU 간 NVLink 연결 토폴로지 확인nvidia-smi topo -m# NVLink 상태 (링크별 활성 여부)nvidia-smi nvlink -s# NVLink 통계 (에러 카운트 등)nvidia-smi nvlink -eNV# : NVLink 연결 정상SYS : NVLink 끊김, PCIe+CPU 경
mandoog.tistory.com
nvidia-smi
| 옵션 | 의미 | 예시 |
| (없음) | GPU 전체 상태 요약 출력 | nvidia-smi |
| -L | GPU 목록 + UUID 출력 | nvidia-smi -L |
| -i <idx> | 특정 GPU 인덱스 지정 | nvidia-smi -i 0 |
| -q | 상세 정보 전체 출력 | nvidia-smi -q |
| -l <sec> | 지정 초마다 갱신 (실시간) | nvidia-smi -l 1 |
| topo -m | GPU 간 연결 토폴로지 matrix | nvidia-smi topo -m |
| nvlink -s | NVLink 링크별 상태 (Active/Inactive) | nvidia-smi nvlink -s |
| nvlink -e | NVLink 에러 카운트 | nvidia-smi nvlink -e |
| nvlink -t | NVLink 대역폭(throughput) | nvidia-smi nvlink -t |
| nvlink -i <idx> | 특정 GPU NVLink 정보 | nvidia-smi nvlink -s -i 0 |
dcgmi
| 옵션 | 의미 | 예시 |
| diag -r 1 | GPU 진단 기본 레벨 (빠름) | dcgmi diag -r 1 |
| diag -r 2 | GPU 진단 중간 레벨 | dcgmi diag -r 2 |
| diag -r 3 | GPU 진단 풀 레벨 (오래 걸림) | dcgmi diag -r 3 |
| group -l | 그룹 ID 먼저 확인 | dcgmi group -l |
| health -g <그룹> -c | 특정 그룹 헬스 체크 | dcgmi health -g 0 -c |
mlxfwmanager
| 옵션 | 의미 | 예시 |
| (없음) | 현재 펌웨어 버전 확인 | mlxfwmanager |
| --query | 현재 펌웨어 버전 확인 (명시적) | mlxfwmanager --query |
| --update | 펌웨어 최신 버전으로 업데이트 | mlxfwmanager --update |
mst
| 옵션 | 의미 | 예시 |
| start | MST 서비스 시작 | mst start |
| status | 인식된 Mellanox 디바이스 목록 | mst status |
| stop | MST 서비스 중지 | mst stop |
ip
| 옵션 | 의미 | 예시 |
| a / addr | 인터페이스 + IP 주소 목록 | ip a |
| link show | 인터페이스 상태 (UP/DOWN) | ip link show |
| route | 라우팅 테이블 | ip route |
| route show table all | 모든 라우팅 테이블 (policy routing) | ip route show table all |
| rule show | 라우팅 정책 목록 | ip rule show |
| -s link show <인터페이스> | 인터페이스 TX/RX 통계 | ip -s link show ens6f0 |
ss
| 옵션 | 의미 | 예시 |
| -t | TCP 소켓만 | ss -t |
| -u | UDP 소켓만 | ss -u |
| -l | LISTEN 상태만 | ss -l |
| -n | 숫자로 출력 (포트/IP 이름 변환 안 함) | ss -n |
| -p | PID / 프로세스명 함께 출력 | ss -p |
| -tulnp | TCP+UDP LISTEN 전체 (가장 많이 씀) | ss -tulnp |
dmesg
| 옵션 | 의미 | 예시 |
| (없음) | 커널 링 버퍼 전체 출력 | dmesg |
| -T | 타임스탬프를 사람이 읽기 쉬운 형식으로 | dmesg -T |
| --level=err,warn | 에러/경고만 필터링 | dmesg --level=err,warn |
journalctl
| 옵션 | 의미 | 예시 |
| -u <서비스> | 특정 서비스 로그만 | journalctl -u sshd |
| -f | 실시간 follow | journalctl -f |
| -b | 현재 부팅 이후 로그 | journalctl -b |
| -k | 커널 메시지만 | journalctl -k |
| --since "시간" | 특정 시간 이후 로그 | journalctl --since "2026-04-07 09:00:00" |
| --until "시간" | 특정 시간 이전 로그 | journalctl --until "2026-04-07 10:00:00" |
systemctl
| 옵션 | 의미 | 예시 |
| status | 서비스 현재 상태 | systemctl status sshd |
| start | 서비스 시작 | systemctl start nginx |
| stop | 서비스 중지 | systemctl stop nginx |
| restart | 서비스 재시작 (실행 중일 때) | systemctl restart nginx |
| enable | 부팅 시 자동시작 등록 | systemctl enable nginx |
| disable | 부팅 시 자동시작 해제 | systemctl disable nginx |
dpkg
| 옵션 | 의미 | 예시 |
| -l | 설치된 패키지 목록 | dpkg -l |
| -l | grep <키워드> | 특정 패키지 필터링 | dpkg -l | grep nvidia |
| -s <패키지> | 특정 패키지 상세 정보 | dpkg -s nvidia-driver-565-server |
apt
| 옵션 | 의미 | 예시 |
| update | 패키지 목록 갱신 | apt update |
| install | 패키지 설치 | apt install nginx |
| install -y | 설치 시 자동 yes | apt install -y nginx |
| remove | 패키지 제거 (설정파일 유지) | apt remove nginx |
| remove --purge | 패키지 + 설정파일 완전 제거 | apt remove --purge nginx |
| autoremove --purge | 불필요 의존성 + 설정파일 정리 | apt autoremove --purge |
| list --installed | 설치된 패키지 목록 | apt list --installed |
| show <패키지> | 패키지 상세 정보 | apt show nvidia-driver-565-server |
smartctl
| 옵션 | 의미 | 예시 |
| -a | 전체 SMART 정보 | smartctl -a /dev/nvme0 |
| -H | 헬스 상태만 (PASSED / FAILED) | smartctl -H /dev/nvme0 |
mdadm
| 옵션 | 의미 | 예시 |
| --detail | RAID 상세 상태 | mdadm --detail /dev/md0 |
| --query | 간단한 RAID 정보 | mdadm --query /dev/md0 |
dmidecode
| 옵션 | 의미 | 예시 |
| -t system | 시스템 전체 정보 | dmidecode -t system |
| -s system-serial-number | 시리얼 번호만 출력 | dmidecode -s system-serial-number |
| -t memory | 메모리 슬롯 정보 | dmidecode -t memory |
| -t processor | CPU 정보 | dmidecode -t processor |
lscpu
| 옵션 | 의미 | 예시 |
| (없음) | CPU 전체 정보 | lscpu |
| | grep -i thread | Thread(s) per core 확인 (HT 여부) | lscpu | grep -i thread |
mount / fstab
| 옵션 | 의미 | 예시 |
| -o remount,rw / | 루트를 읽기/쓰기로 재마운트 | mount -o remount,rw / |
| -t xfs | 파일시스템 타입 지정 | mount -t xfs /dev/md1 /data |
lvcreate (LVM)
| 옵션 | 의미 | 예시 |
| -L <크기> | LV 크기 지정 | lvcreate -L 1T -n msjeong data |
| -l <PE수> | PE 개수로 크기 지정 | lvcreate -l 100%FREE -n msjeong data |
| -n <이름> | LV 이름 지정 | lvcreate -L 1T -n msjeong data |
free
| 옵션 | 의미 | 예시 |
| -h | human-readable (GB, MB) | free -h |
| -m | MB 단위 | free -m |
| -g | GB 단위 | free -g |
df / du
| df/du | 옵션 | 의미 | 예시 |
| df | -h | 마운트된 파일시스템 사용량 (human-readable) | df -h |
| du | -sh <경로> | 특정 디렉토리 총 용량 | du -sh /var/log |
| du | -sh * | 현재 디렉토리 하위 항목별 용량 | du -sh * |
반응형
LIST
'🔧 Engineering > 📁 Study Notes' 카테고리의 다른 글
| GRUB에 nomodeset 설정 (0) | 2026.05.29 |
|---|---|
| 혼자 해보는 점검 실습 (0) | 2026.04.22 |
| NVIDIA 드라이버 로그 — NVRM XID 에러 (0) | 2026.04.03 |
| NVSwitch 유무에 따른 NVIDIA 패키지 설치 가이드 (0) | 2026.04.03 |
| LVM 생성 및 마운트 가이드 (0) | 2026.04.02 |