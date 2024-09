Algumas aplicações de segmentação de instâncias, como detectar itens defeituosos em uma linha de montagem de fabricação, exigem resultados em tempo real. Modelos de estágio único foram desenvolvidos para casos de uso em que a velocidade é uma prioridade máxima.

Modelos de duas etapas como o Mask R-CNN são altamente precisos, mas sua abordagem inerentemente sequencial é difícil de acelerar. Modelos de segmentação de instância em um único passo, como o YOLACT (You Only Look At CoefficienTs), em vez disso, se baseiam em modelos de detecção de objetos em um único estágio, como o YOLO (You Only Look Once).

No YOLACT, um FPN cria mapas de feição de alta resolução, que são alimentados em duas ramificações paralelas: uma ramificação FCN propõe k "máscaras de protótipo" de possíveis instâncias de objeto; simultaneamente, uma ramificação de camadas totalmente conectadas produz muitas "caixas âncora", semelhantes às propostas de região, e também prevê k "coeficientes de máscara", uma para cada máscara de protótipo, indicando a probabilidade de um objeto proposto estar alinhado com uma máscara de segmentação proposta. A supressão não máxima (SNM) é usada para filtrar casos propostos com os mais altos coeficientes de máscara.