TensorRT 模型轉換

您可以啟用或停用 NVIDIA TensorRT 模型轉換，並配置用來轉換不同模型類型的精準度。

配置 TensorRT 模型轉換

若要配置 TensorRT 模型轉換，請編輯下列目錄位置中的 vision-edge-properties 檔案:

<installation root directory>/volume/run/var/config/vision-edge-properties

從這個目錄位置，您可以完成下列轉換配置:

下表詳細說明控制是否針對不同模型類型啟用 TensorRT 模型轉換的參數。

表 1. 啟用 TensorRT 模型轉換的參數
參數	`TRUE/FALSE`	停用 TensorRT 模型轉換
`DLE_DISABLE_TENSORRT`	`TRUE`	所有模型類型。此參數的值會置換任何模型特定的設定。
`DLE_DISABLE_TENSORRT_GOOGLENET`	`TRUE`	僅限 GoogleNet 模型。
`DLE_DISABLE_TENSORRT_SSD`	`TRUE`	僅限 SSD 模型。
`DLE_DISABLE_TENSORRT_YOLOV3`	`TRUE`	僅限 YOLOv3 模型。
`DLE_DISABLE_TENSORRT_TINY_YOLOV3`	TRUE	僅限小型 YOLOv3 型號。

與維護 32 位元精準度的模型相比，轉換為 16 位元減少精準度的模型執行更有效率且佔用較少 GPU 記憶體。轉換為 16 位元降低精準度的模型可能會導致精確度的小損失。

下表詳述轉換值 TensorRT 模型轉換。

附註: 您必須重新啟動 Maximo® Visual Inspection Edge ，變更才會生效。

TensorRT 模型轉換值

表 2. TensorRT 模型轉換值
值	說明
`fp16`	模型會轉換成 16 位元浮點，降低精準度。
`pf32`	型號維護 32 位元浮點精準度。

TensorRT 模型精準度的參數

下表詳述決定 TensorRT 模型轉換期間所使用 TensorRT 模型精準度的參數。

表 3. TensorRT 模型轉換的參數
參數	為 TensorRT 模型精準度設定的模型類型
`DLE_TENSORRT_PRECISION_GOOGLENET fp16/fp32`	GoogLeNet
`DLE_TENSORRT_PRECISION_SSD fp16/fp32`	SSD
`DLE_TENSORRT_PRECISION_YOLOV3 fp16/fp32`	YOLOv3
`DLE_TENSORRT_PRECISION_TINY_YOLOV3 fp16/fp32`	極小 YOLOv3