Le géant américain a mis au point une intelligence artificielle capable de reconnaître et isoler des voix dans une foule. Le but pourrait être d’améliorer les services et appareils proposés par Google.

Nous avons tous connu l’appel téléphonique inaudible à cause d’un brouhaha ambiant. Et si cette sorte de désagrément pouvait être de l’histoire ancienne ? Alors que la Chine est désormais capable – dans un but policier – de localiser une personne recherchée parmi une foule de plus de 50 000 personnes, Google a mis au point une IA en mesure d’isoler une voix, comme l’explique une publication du 11 avril 2018 dans le Google Research Blog.

Il faut savoir qu’un microphone retransmet l’intégralité de ce qu’il écoute, à la différence des humains qui peuvent faire des distinctions. Le système mis au point par les chercheurs de Google utilise un algorithme et le deep learning pour isoler la voix de certaines personnes dans une foule, rien qu’en se focalisant sur ces dernières. Il faut savoir que pas moins de 100 000 vidéos ont été utilisées pour entraîner l’IA.

Comme le montre la vidéo visible en fin d’article, les résultats sont plutôt impressionnants. L’intelligence artificielle en question est capable de générer une prise audio de très bonne qualité, et ce après avoir isolé une voix au milieu d’un environnement bruyant. Au total, pas moins de 2000 heures de vidéo ont été « nettoyées » de leur bruit de fond !

Enfin, Google a déclaré être toujours en réflexion quant à la façon d’appliquer cette technologie au niveau de ses propres produits. Les spéculations vont bon train, mais il serait logique que les utilisateurs en profitent directement. Nous pensons par exemple à la plateforme de messagerie instantanée Hangouts, à l’application Duo, ou encore à une future version de l’enceinte connectée Google Home, pour laquelle la notion de reconnaissance vocale serait améliorée.

Sources : Siècle Digital – 01net