Partner in evidenza: il Politecnico di Torino migliora il riconoscimento della configurazione delle mani in tempo reale

L'innovazione nella trasformazione digitale spesso nasce da ricerche interdisciplinari. Mentre il nostro progetto si concentra sull'applicazione industriale dei gemelli digitali, i nostri partner di Politecnico di Torino stanno ampliando i confini della visione artificiale e dell'interazione uomo-macchina attraverso le loro ultime ricerche sul riconoscimento del linguaggio dei segni.

Abbattere le barriere della comunicazione con il rilevamento RGB-D

In uno studio pubblicato di recente in Sensori, i ricercatori del Dipartimento di Ingegneria Gestionale e della Produzione (DIGEP) e del Dipartimento di Ingegneria Biomedica hanno sviluppato un framework per il riconoscimento in tempo reale delle configurazioni delle mani in Lingua dei segni italiana (LIS).

La ricerca affronta una componente critica del linguaggio dei segni: il "chereme", ovvero la forma specifica della mano utilizzata durante un segno. Concentrandosi su queste configurazioni come attività di classificazione autonoma, il team ha creato un modo più efficiente per consentire ai computer di "leggere" le forme delle mani senza dover elaborare un gesto temporale completo e complesso.

Come funziona: dai punti di riferimento all'apprendimento automatico

L'approccio del team utilizza materiali a basso costo Telecamere RGB-D (che catturano sia le informazioni sul colore che sulla profondità) combinate con sofisticati strumenti di elaborazione:

  • Integrazione MediaPipe: Il sistema estrae punti di riferimento 3D della mano in tempo reale.
  • Estrazione di caratteristiche geometriche: Questi punti di riferimento vengono convertiti in caratteristiche geometriche 3D, come le distanze tra la punta delle dita e il palmo, che vengono poi normalizzate per tenere conto delle diverse dimensioni delle mani.
  • Classificazione SVM: Un classificatore Support Vector Machine (SVM) identifica quindi la configurazione specifica.

I risultati sono impressionanti, con il sistema che raggiunge una precisione di 96.8% attraverso 24 distinte configurazioni delle mani LIS.

Oltre il laboratorio: potenziali applicazioni

Sebbene l'obiettivo primario sia quello di facilitare la comunicazione per la comunità dei sordi, questo tipo di tracciamento manuale ad alta precisione ha implicazioni significative per il nostro lavoro in Produzione intelligente. La capacità di un sistema di riconoscere accuratamente configurazioni complesse delle mani in tempo reale è essenziale per:

  • Collaborazione avanzata uomo-robot: Permettere ai tecnici di controllare i cobot industriali attraverso gesti precisi delle mani.
  • Formazione immersiva: Miglioramento delle simulazioni di realtà virtuale (VR) in cui sono richieste interazioni manuali precise per l'assemblaggio o la manutenzione virtuale.

Ci congratuliamo con il team del Politecnico di Torino, composto da Luca Ulrich, Giorgia Marullo ed Enrico Vezzetti, per questo contributo al campo della visione artificiale. Questa ricerca sottolinea l'eccellenza tecnica del nostro consorzio di progetto e i diversi modi in cui la modellazione digitale sta plasmando il nostro futuro.


Pubblicazione completa: Un approccio basato su telecamera 3D per il riconoscimento in tempo reale della configurazione della mano nella lingua dei segni italiana, pubblicato in Sensors (2026).

Articoli simili