Layer proprietario di metric learning applicato on-top a pipeline di object detection (YOLO, Ultralytics, Detectron2, EfficientDet, DETR). Riduce drasticamente i campioni necessari in fase di training e garantisce precisione estrema in inference per l'identificazione visiva.
DART opera come secondo stadio di una pipeline di computer vision. Il primo stadio — un detector basato su architetture come YOLO, Ultralytics, Detectron2, EfficientDet o DETR — localizza gli oggetti nella scena producendo bounding box e crop. Il secondo stadio è DART: un modulo proprietario di metric learning che proietta ogni crop in uno spazio di embedding ad alta dimensionalità.
In questo spazio vettoriale, l'identità di ogni oggetto viene risolta tramite nearest-neighbor retrieval su un database di reference embeddings. Il risultato è un'identificazione — non una classificazione — con soglia di confidenza configurabile e rejection nativa degli elementi sconosciuti (open-set recognition).
Richiedi una demo
L'AI tradizionale (classificatori CNN/ViT) richiede centinaia o migliaia di immagini annotate per classe e un ciclo di re-training completo ad ogni nuova categoria. DART ribalta questo paradigma grazie al few-shot metric learning.
Il backbone di feature extraction è pre-addestrato una sola volta. Aggiungere una nuova classe significa fornire una decina di immagini di riferimento: DART genera i relativi embedding vettoriali e li indicizza nel database. Nessun fine-tuning, nessun re-training, nessun downtime. Le nuove classi sono disponibili in tempo reale.
Sei proprietà tecniche che distinguono DART dai classificatori tradizionali in fase di inference.
DART non assegna probabilità distribuite su N classi. Misura la distanza nell'embedding space e identifica per prossimità: se nessun reference è abbastanza vicino, l'oggetto viene rigettato. Zero falsi positivi strutturali.
La complessità di inference è indipendente dal numero di classi grazie all'indicizzazione ANN (Approximate Nearest Neighbor). Stessa latenza e accuratezza con 100 o 100.000 classi.
Soglia di similarità configurabile su cosine distance. Gli oggetti sconosciuti o fuori dominio vengono rigettati nativamente, senza classi “other” artificiali.
L'embedding space apprende invarianza a rotazione, scala, illuminazione e background. Feature descriptors stabili anche in condizioni operative non controllate.
Pipeline ottimizzata per inference in tempo reale. Detection + embedding extraction + retrieval in un singolo forward pass, compatibile con deployment edge e cloud.
Soglie di confidenza, distanza massima e top-K retrieval configurabili per caso d'uso. Bilancia precision vs. recall con un singolo parametro.
Le immagini vengono acquisite da diversi sistemi — lightbox, telecamere, smartphone — e inviate al nostro cloud per l'elaborazione. Il risultato viene restituito in tempo reale tramite API.
Per ambienti con requisiti di sicurezza stringenti o esigenze di latenza minima, l'intera infrastruttura GETCOO — DART engine, database embeddings, dashboard — viene installata on-premise presso il cliente.
Contattaci per una dimostrazione personalizzata
della nostra tecnologia AI.