본문 바로가기

OpenShift Container Platform

Single Node OpenShift Issue~

 

참조 기술 문서

 

https://cloud.redhat.com/blog/working-with-operating-system-templates-in-openshift-virtualization

 

제안 아키텍쳐

 

POC 일정 및 이벤트

 

 

POC 중 이슈사항

 

  • NFD 라벨링 이슈
  • NFD 설치시 GPU PCI 에 대해 Nvidia 벤더 레이블링이 되어야 하지만 레이블링이 되지 않음.
    강제로 노드에 아래 Label 추가 후 Nvidia-GPU Operator 정상 동작  

  • OV Local-Storage 이슈
  • Local-Storage Filesystem 으로 설정 시 디스크별로 한개의 PV 설정 만 가능
    디스크를 나누어 PV 로 사용하려면 디스크를 LVM으로 나누고 Local-storage를 Block으로 설정해야만 함
    Local-volume Set도 기대하는 동작이 되지 않음

  • 가상화 GPU Passthrough 이슈
  • Operator 로 설정하는 방식을 알지 못하였고, 직접 바인딩을 시도하였는데 GPU 카드별로 설정 방식 상이
  • RTX6000의 경우 GPU 카드에 있는 전체 pci 정보를 포함해야만 GPU카드를  PassThrough로 정상 할당 가능 

명령어를 통해 vfio-pci 드라이버 직접 바인딩 예시

 

  • 가상화 GPU Container 할당 방식과, VM PassThrough 방식 동시 사용 이슈
  • 1대의 노드에 대해 Container 할당 방식과 VM PassThrough 할당 방식을 전환하여 사용할 수는 있으나 동시에 여러 방식으로 할당하는 것은 불가능

 

GPU 모니터링 화면