TensorRT 模型轉換

您可以啟用或停用 NVIDIA TensorRT 模型轉換,並配置用來轉換不同模型類型的精準度。

配置 TensorRT 模型轉換

若要配置 TensorRT 模型轉換,請編輯下列目錄位置中的 vision-edge-properties 檔案:

<installation root directory>/volume/run/var/config/vision-edge-properties

從這個目錄位置,您可以完成下列轉換配置:

  • 啟用或停用 TensorRT 轉換
  • 配置轉換不同模型類型的精準度。

啟用 TensorRT 模型轉換的參數

下表詳細說明控制是否針對不同模型類型啟用 TensorRT 模型轉換的參數。

表 1. 啟用 TensorRT 模型轉換的參數
參數 TRUE/FALSE 停用 TensorRT 模型轉換
DLE_DISABLE_TENSORRT TRUE 所有模型類型。 此參數的值會置換任何模型特定的設定。
DLE_DISABLE_TENSORRT_GOOGLENET TRUE 僅限 GoogleNet 模型。
DLE_DISABLE_TENSORRT_SSD TRUE 僅限 SSD 模型。
DLE_DISABLE_TENSORRT_YOLOV3 TRUE 僅限 YOLOv3 模型。
DLE_DISABLE_TENSORRT_TINY_YOLOV3 TRUE 僅限小型 YOLOv3 型號。

TensorRT 模型轉換精準度

與維護 32 位元精準度的模型相比,轉換為 16 位元減少精準度的模型執行更有效率且佔用較少 GPU 記憶體。 轉換為 16 位元降低精準度的模型可能會導致精確度的小損失。

下表詳述轉換值 TensorRT 模型轉換。

附註: 您必須重新啟動 Maximo® Visual Inspection Edge ,變更才會生效。

TensorRT 模型轉換值

表 2. TensorRT 模型轉換值
說明
fp16

模型會轉換成 16 位元浮點,降低精準度。

pf32 型號維護 32 位元浮點精準度。

TensorRT 模型精準度的參數

下表詳述決定 TensorRT 模型轉換期間所使用 TensorRT 模型精準度的參數。

表 3. TensorRT 模型轉換的參數
參數 為 TensorRT 模型精準度設定的模型類型
DLE_TENSORRT_PRECISION_GOOGLENET fp16/fp32 GoogLeNet
DLE_TENSORRT_PRECISION_SSD fp16/fp32 SSD
DLE_TENSORRT_PRECISION_YOLOV3 fp16/fp32 YOLOv3
DLE_TENSORRT_PRECISION_TINY_YOLOV3 fp16/fp32 極小 YOLOv3