GPU çalışanı düğümü AWS'ta bir Red Hat OpenShift kümesi ' e ekleniyor
Before you install IBM® Maximo® Visual Inspection in Maximo Application Suite on AWS, a GPU worker node needs to be added to the Red Hat® OpenShift® kümesi. Geçerli AWS Maximo Application Suite BYOL olanakları, GPU içeren düğümleri içermez. AWS , GPU ' larla birlikte gönderilen EC2 eşgörünümlerini sunar. p3.2xlarge , MVI için kullanılmak üzere önerilen EC2 yönetim ortamı tipidir.
AWS tarafından önerilen GPU örnekleri hakkında daha fazla bilgi için bkz. Önerilen GPU Eşgörünümleri.
Kullanılacak uygun EC2 GPU örneğini seçin ve daha sonra, Maximo Application Suite örneğinizin kurulu olduğu bölgede yönetim ortamının kullanılabilirliğini denetleyin. Bu bilgiler, AWS konsolundaki EC2 hizmeti altında bulunan eşgörünüm tipi sayfasından edinilebilir. Örneğin, Maximo Application Suite yönetim ortamınızı us-east-1 bölgesinde konuşlandırdıysanız, o bölge için EC2 yönetim ortamı tipinin sayfasına gidin ( https://us-east-1.console.aws.amazon.com/ec2/v2/home?region=us-east-1#InstanceTypes:) ve eşgörünüm tipine göre süzgeç uygulayın. Eşgörünüm tipini, eşgörünüm tipinin ayrıntılarını, hesaplamanın, ağ oluşturma, depolama, hızlandırıcılar ve fiyatlandırma bilgilerini görüntüleyen sayfayı tıklatın. Ağ oluşturma altında, yönetim ortamı tipinin kullanılabilirlik bölgeleri verilir.
Başlamadan önce
- Denetim kabuğuBu, bootnode olabilir. Bu makineyi EC2 gösterge panosunda bulun. Sık sık durdurulur ve tüm eşgörünümler listesinin altında yer alıyor. Durdurulmuş durumdaysa, yönetim ortamını yeniden başlatın. Bu yönetim ortamına EC2-userolarak bağlanın.İpucu: Önyükleme düğümüne uzaktan bağlı Visual Studio Code ' u kullanabilirsiniz. Bu uygun bir şey, ama gerekli değil.
ocjq
Yordam
Resmi Red Hat documentation , AWSüzerinde bir makinenin nasıl oluşturulacağı hakkında bilgi alır. Bunun nasıl yapacagına ilişkin bir örnek de buradaele alınmıştır. Bu yordam, var olan bir Worker düğümünün YAML özel kaynağının bir kopyasını oluşturmayı içerir. The copy is then updated for instanceType (updated to p3.2xlarge), the metadata name, selector labels, and appropriate metadata are removed. It is also good to check the values under the placement key (update the availabilityZone and region, if needed). Daha sonra bu özel kaynak YAML kullanılarak yeni bir makine kümesi yaratılır.
Ensure that you run the commands in the openshift-machine-api namespace.
oc create -f <machine set custom resource> komutunu çalıştırdıktan sonra (Adım 12), çıkış her zaman makinenin yaratıldığını gösterir. Ancak, bir hata varsa, makine kümesi hazır değil ve kullanılabilir durumda değildir. oc get machine ' un çalıştırılması anında hatayı belirtebilir:
NAME PHASE TYPE REGION ZONE AGE
masocp-qxkeml-wh7px-master-0 Running m5.2xlarge us-east-1 us-east-1a 18h
masocp-qxkeml-wh7px-master-1 Running m5.2xlarge us-east-1 us-east-1b 18h
masocp-qxkeml-wh7px-master-2 Running m5.2xlarge us-east-1 us-east-1c 18h
masocp-qxkeml-wh7px-worker-gpu-us-east-1a-5z7sd Failed 4s
masocp-qxkeml-wh7px-worker-gpu-us-east-1a-nhldx Failed 20s
masocp-qxkeml-wh7px-worker-us-east-1a-h2c8g Running m5.4xlarge us-east-1 us-east-1a 18h
masocp-qxkeml-wh7px-worker-us-east-1a-p7mt9 Running m5.4xlarge us-east-1 us-east-1a 18h
masocp-qxkeml-wh7px-worker-us-east-1b-4rlrq Running m5.4xlarge us-east-1 us-east-1b 18h
masocp-qxkeml-wh7px-worker-us-east-1b-dhv6g Running m5.4xlarge us-east-1 us-east-1b 18h
masocp-qxkeml-wh7px-worker-us-east-1c-ks85p Running m5.4xlarge us-east-1 us-east-1c 18h
masocp-qxkeml-wh7px-workerocs-us-east-1a-9r6pj Running m5.4xlarge us-east-1 us-east-1a 17h
masocp-qxkeml-wh7px-workerocs-us-east-1b-p9psl Running m5.4xlarge us-east-1 us-east-1b 17h
masocp-qxkeml-wh7px-workerocs-us-east-1c-94d7q Running m5.4xlarge us-east-1 us-east-1c 17h
Run oc describe machine <machine name> or oc describe machineset
<machineset name> to see the reason for the failure and check the error message under Durum or Takvim Etkinlikleri:
Durum:
Koşullar:
Son Geçiş Saati: 2022-05-26T15:20:25Z
İleti: Eşgörünüm
Nedeni: InstanceNotYaratıldı
Önem Düzeyi: Uyarı
Durum: Yanlış
Tip: InstanceExists
Hata İletisi: Hata başlatma örneği: İstenen örnek tipiniz (p3.2xlarge), istenen Kullanılabilirlik Bölmesinde (us-east-1a) desteklenmiyor. Lütfen bir Kullanılabilirlik Bölgesi belirtmeyerek ya da us-east-1b, us-east-1c, us-east-1d, us-east-1fseçeneklerini belirleyerek isteğinizi yeniden deneyin.
Hata Nedeni: InvalidConfiguration
Son Güncelleme: 2022-05-26T15:20:26Z
Aşama: Başarısız
Sağlayıcı Durumu:
Koşullar:
Son Algılayıcı Saati: 2022-05-26T15:20:26Z
Son Geçiş Saati: 2022-05-26T15:20:26Z
İleti: Yönetim ortamı başlatılırken hata: İstenen örnek tipiniz (p3.2xlarge), istenen Kullanılabilirlik Bölgesinizde (us-east-1a) desteklenmiyor. Lütfen bir Kullanılabilirlik Bölgesi belirtmeyerek ya da us-east-1b, us-east-1c, us-east-1d, us-east-1fseçeneklerini belirleyerek isteğinizi yeniden deneyin.
Neden: MachineCreationFailed
Status: False
Type: MachineCreation
Events:
Type Reason Age from Message
---- ------ ---- ---- -------
Warning FailedCreate 52s (x2 over 53s) awscontroller masocp-qxkeml-wh7px-worker-gpu-us-east-1a-5z7sd: reconciler makine yaratılamadı: hata başlatma örneği: hata başlatma örneği: İstenen örnek tipiniz (p3.2xlarge), istenen Kullanılabilirlik Bölgesinizde (us-east-1a) desteklenmiyor. Lütfen bir Kullanılabilirlik Bölgesi belirtmeyerek ya da us-east-1b, us-east-1c, us-east-1d, us-east-1fseçeneklerini belirleyerek isteğinizi yeniden deneyin.
oc delete machineset <machineset name>
Özel kaynakta availabilityZone değerini düzenleyin ve oc
create -f <customresource.json>öğesini yeniden çalıştırın. Monitor the creation of the machine set and machines by using the commands that are listed in step 13. Diğer hata tipleri için, makine kümesini silin, özel kaynağı düzenleyin ve düzenlenen özel kaynak JSON dosyasını kullanarak makine kümesini yeniden yaratın.