진단 및 조치(FAQ)

메인이미지

진단 및 조치(FAQ)

 

  • 서버
  • 디스크어레이
문제 증상 조치 방법
Power on 이상 서버의 전원 스위치를 눌러도 서버가 켜지지 않음  - AC 전원 코드의 연결 상태 확인.
 - AC 전원 코드를 분리하였다가 다시 연결 후 Power on.
 - BMC가 장착된 서버의 경우 AC 전원 코드 연결 후 BMC Boot up이 완료되어야 서버의 Power on이 가능하므로 AC 전원 인가 후 약 1분후 Power on.
 - 모니터와 서버의 연결 케이블 상태 확인
 - 다른 모니터에 연결하여 VGA 출력 확인
 - 서버 뒷면 Power Supply LED 상태 확인(점멸/점등) 확인
소음 발생 이상 소음 발생  - 서버가 설치된 장소의 외기 온도 확인. 서버의 외기 온도가 높을 경우 CPU 냉각을 위해 냉각 팬이 고속으로 동작.
 - 냉각 팬이 모두 정상적으로 구동하고 있는지 확인. 다수 냉각 팬 중 단일 팬의 장애 발생 시 타 정상 팬이 고속으로 동작.
 - 서버 전면 경고등(FAN module 장애 경고등)확인
 - 서버 관리 포트를 통한 확인
알람 발생 알람 발생  - RAID 컨트롤러가 장착되어 있는 경우 RAID 볼륨을 구성하는 디스크 장애 발생 시 RAID 컨트롤러에서 알람 발생. RAID 컨트롤러의 관리 SW를 통해 알람 중지. 장애 디스크의 교체 필요.
 - 전원공급기가 이중화 되어 있는 제품의 경우 단일 전원공급기의 이상 발생 시 알람 발생. 전원공급기에 연결된 AC 코드와 전원에 이상이 없는지 확인. 입력 AC 전원에 이상이 없는 경우 장애 전원공급기의 교체 필요.
 - 서버 보다는 컴퓨터(PC)에서 Beep 발생이 발생하는경우가 많음
 - HDD 디스크장애시 디스크 캐피어 경고 LED확인
키보드, 마우스 이상 키보드, 마우스의 미 동작  - 키보드, 마우스가 서버에 정상적으로 연결되어 있는지 확인.
 - 타 키보드, 마우스를 연결하여 동작 확인.
 - 서버를 Reboot하여 Main Bios에 들어가 키보드 동작 상태 확인. Main Bios에서도 동작 불능 시 서버 장애 점검 필요.
 - 시스템 Hang이 여부 확인
USB 장치 문제 USB 장치 인식 문제  - 타 서버나 PC에서 USB 장치의 정상 동작 확인.
 - 서버의 USB OS 드라이버가 정상적으로 설치되어 있는지 확인.
 - USB Locking Tool 확인
OS Boot 이상 POST 과정 후 OS Boot가 정상적으로 진행되지 못함  - 'Boot device order' 문제일 수 있으므로 Main bios에서 Boot device가 1번으로 설정되어 있는지 확인.
 - USB 메모리 등 추가 저장 장치가 서버에 부착되어 있는 경우 제거.
 - RAID CARD의 OS영역 디스크 장애 확인
 - RAID CARD의 불량 확인
 - Local HDD Disk(SATA) 장애 확인
랙 마운트 랙 마운트를 위한 슬라이드 레일 설치 방법  - 각 제조사가 제공하는 랙 마운트용 슬라이드 레일 설치 매뉴얼 참조
네트워크 통신 네트워크 통신 이상  -LAN 케이블이 서버에 정상적으로 연결되어 있고 해당 포트의 Activity LED와 Link LED가 동작하는지 확인.
 - 문제가 발생한 서버에 연결된 LAN 케이블이 타 서버에서도 정상 동작하는지 확인.
 - LAN 케이블이 연결된 네트워크 스위치의 이상 유무 확인.
 - Link Speed에 따른 LED 상태 확인
 - 서버의 OS단에서 Command,아이콘(x)상태확인
ODD 이상 SW 설치 시 DVD 이상  - 설치를 위해 장착한 DVD 미디어에 이상이 없는지 타 컴퓨터에서 이상 유무 확인
   => 이상 있을 시 ODD drive 불량
디스크 IO 성능 디스크 IO 성능 저하  - 디스크 IO 성능이 크게 저하된 경우 OS의 성능 모니터링 툴을 이용하여 디스크 IO에 비 정상적인 IO 부하를 주는 것이 없는지 확인.
 - RAID 컨트롤러 관리 SW를 구동하여 이벤트 로그 등을 확인, 이상이 없는지 확인.
CPU 성능 CPU 성능 저하  - CPU에 비정상적인 부하를 주는 프로세스가 없는지 확인.
 - 외부 온도의 높은 상승, 냉각 팬 이상 유무 확인.
원격 관리 원격 모니터링, 전원 관리 등  - 서버에 설치된 OS 별 ipmitool을 이용하여 서버 상태 관리 가능.
 - 원격 관리 (Remote KVM 등) 접속을 위해서는 서버 후면의 IPMI (Management) 전용 RJ45 포트에 접속하여 모니터링 및 관리 가능.
 - 원격 관리 포트의 IP 설정 등 자세한 내용은 서버 제조사의 사용자 매뉴얼 참조.
서버 사양 확인 서버 사양 확인 방법  [각 서버 제조사마다 상이함]
 - 서버 후면 Specificaiton Label에 주요 파트의 사양이 표기되어 있음.
AS 신청 관련 AS 신청 방법 협회 방안을 정리해 주시기 바랍니다.
시리얼 넘버 AS 신청을 위한 시리얼 넘버 확인 방법  [각 서버 제조사마다 상이함]
 - 서버 후면 Specificaiton Label에 부착된 시리얼 넘버로 AS 신청 수행.
문제 증상 조치
FRU 상태 이상 1. 전면 또는 뒷면에 Fault/Service Required LED 엠버에 불이 켜져 있음 -> 조치 1.
2. 컨트롤러 모듈 상태등이 꺼져 있음 -> 조치 2.
3. 컨트롤러 뒷면에 FRU OK LED가 꺼져 있음 -> 조치 2.
조치1.
컨트롤러 뒷면에 FRU, 연결상태 LED 등을 확인

조치 2.
컨트롤러 모듈이 올바르게 장착되어 있는지 확인 후 전원이 인가 되어 있는지 확인
이벤트 로그 확인
power-up 에러 전면 또는 뒷면 패널에 Fault/Service Required LED 엠버에 불이 켜져 있음 1. 다른 컨트롤러를 이용하여 컨트롤러 재시작 후 동일 문제가 발생하는지 확인
2. 컨트롤러 재 장착 후 동일 문제가 발생하는지 확인
3. 컨트롤러 교체
Cache flush 에러 전면 또는 뒷면 패널에 Fault/Service Required LED 엠버에 불이 켜져 있음 1. 다른 컨트롤러를 이용하여 컨트롤러 재시작 후 동일 문제가 발생하는지 확인
2. 컨트롤러 재 장착 후 동일 문제가 발생하는지 확인
3. 컨트롤러 교체
Cache self-refresh 에러 전면 또는 뒷면 패널에 Fault/Service Required LED 엠버에 불이 켜져 있음 1. 다른 컨트롤러를 이용하여 컨트롤러 재시작 후 동일 문제가 발생하는지 확인
2. 컨트롤러 재 장착 후 동일 문제가 발생하는지 확인
3. 컨트롤러 교체
드라이브 오프라인 됨 디스크 드라이브 모듈 LED가 모두 꺼져 있음 디스크 드라이브를 재장착 후 확인
드라이가 구성 안됨 디스크 드라이브 모듈 LED가 모두 꺼져 있음 디스크 드라이브를 재장착 후 확인
Online/Activity LED가 꺼져 있고
드라이브가 오프라인 됨
Power/Activity/Fault LED 엠버등이 깜박 거림 이벤트 로그 확인 
HBA port link가 다운 HBA port 링크 상태 LED가 꺼져 있음 1. FC 케이블 연결 확인
2. 케이블 상태 점검
3. 케이블 교체
4 .SAN switch 확인
5. 다른 port를 사용하여 동일한 문제가 발생하는지 확인
6. PCI 슬롯에 문제가 없는지 확인
확장 Port link가 다운 확장 Port 상태 LED 가 꺼져 있음 1. 확장 케이블 연결 확인
2. 케이블 상태 점검
3. 케이블 교체
4. SAN switch 확인
5. 다른 port를 사용하여 동일한 문제가 발생하는지 확인
6. PCI 슬롯에 문제가 없는지 확인
Network link가 다운 Network Lan port 링크 상태 LED가 꺼져 있음 네트워크 케이블 상태 점검
네트워크 케이블 교체
Network 스위치 에서 설정 값 및 구성 확인 
PDU 이상 PDU LED 가 꺼져 있음 파워 케이블이 올바르게 연결되었는지 확인
로그 확인
드라이브 인클로저 rear panel 이상 드라이브 인클로저 rear panel OK LED 등이 꺼져 있음 PDU 또는 팬이 허용치 초과
컨트롤러 문제 cache 상태 LED는 꺼져 있고 컨트롤로가 시작되지 않음 컨트롤러 교체
컨트롤러 시작 안함 cache 상태 LED는 깜박 거리고 컨트롤로는 시작 됨 시스템은 데이터를 flushing 하고 있다 문제가 지속되면 컨트롤러를 교체
인클로저가 초기화 되지 않음 인클로저가 초기화 되지 않음 전원 코드가 올바르게 연결되어 있는지 확인 한다
이벤트 로그를 확인한다
디스크어레이 인클로저 추가 후
인클로저가 초기화 되지 않음
디스크어레이 인클로저 추가 후 인클로저 ID 값이 올바르지 않음 컨트롤러 2개 모두 동작 하는지 확인하고 perform rescan 을 실행한다 
오류 메시지 표시 됨 오류 메시지 표시 오류 상태를 파악하여 권장 조치 사항을 수행
 ※ 권장 조치를 수행 후 오류 상태를 해결 할 수 없는 경우 제조사에 문의
한국컴퓨팅산업협회
HPC이노베이션허브 : 경기도 성남시 수정구 대왕판교로 815(285-2번지) HPC이노베이션 허브 2층 276호 사업화지원실
E-mail : admin@k-cia.or.kr | Tel : 031-5182-9044