TensorRT 模型轉換
您可以啟用或停用 NVIDIA TensorRT 模型轉換,並配置用來轉換不同模型類型的精準度。
配置 TensorRT 模型轉換
若要配置 TensorRT 模型轉換,請編輯下列目錄位置中的 vision-edge-properties 檔案:
<installation root directory>/volume/run/var/config/vision-edge-properties
從這個目錄位置,您可以完成下列轉換配置:
- 啟用或停用 TensorRT 轉換
- 配置轉換不同模型類型的精準度。
啟用 TensorRT 模型轉換的參數
下表詳細說明控制是否針對不同模型類型啟用 TensorRT 模型轉換的參數。
| 參數 | TRUE/FALSE |
停用 TensorRT 模型轉換 |
|---|---|---|
DLE_DISABLE_TENSORRT |
TRUE |
所有模型類型。 此參數的值會置換任何模型特定的設定。 |
DLE_DISABLE_TENSORRT_GOOGLENET |
TRUE |
僅限 GoogleNet 模型。 |
DLE_DISABLE_TENSORRT_SSD |
TRUE |
僅限 SSD 模型。 |
DLE_DISABLE_TENSORRT_YOLOV3 |
TRUE |
僅限 YOLOv3 模型。 |
DLE_DISABLE_TENSORRT_TINY_YOLOV3 |
TRUE |
僅限小型 YOLOv3 型號。 |
TensorRT 模型轉換精準度
與維護 32 位元精準度的模型相比,轉換為 16 位元減少精準度的模型執行更有效率且佔用較少 GPU 記憶體。 轉換為 16 位元降低精準度的模型可能會導致精確度的小損失。
下表詳述轉換值 TensorRT 模型轉換。
附註: 您必須重新啟動 Maximo® Visual Inspection Edge ,變更才會生效。
TensorRT 模型轉換值
| 值 | 說明 |
|---|---|
fp16 |
模型會轉換成 16 位元浮點,降低精準度。 |
pf32 |
型號維護 32 位元浮點精準度。 |
TensorRT 模型精準度的參數
下表詳述決定 TensorRT 模型轉換期間所使用 TensorRT 模型精準度的參數。
| 參數 | 為 TensorRT 模型精準度設定的模型類型 |
|---|---|
DLE_TENSORRT_PRECISION_GOOGLENET fp16/fp32 |
GoogLeNet |
DLE_TENSORRT_PRECISION_SSD fp16/fp32 |
SSD |
DLE_TENSORRT_PRECISION_YOLOV3 fp16/fp32 |
YOLOv3 |
DLE_TENSORRT_PRECISION_TINY_YOLOV3 fp16/fp32 |
極小 YOLOv3 |