Noé Tits, après avoir obtenu son diplôme d’ingénieur électricien, a poursuivi une thèse à l’Institut Numediart – UMONS sur l’application des techniques de Machine Learning pour la synthèse vocale expressive.
Actuellement, il s’occupe de la R&D de la technologie vocale de Flowchase pour analyser automatiquement et donner du feedback aux apprenants d’anglais sur leur prononciation en utilisant les paradigmes du Machine/Deep Learning et Signal Processing. Flowchase est une application qui vous permet de booster votre prononciation en anglais grâce à une technologie vocale analysant votre parole.
Pendant l’année 2020, il a étudié la contrôlabilité d’un système de synthèse vocale expressive. On attend par contrôlabilité, la possibilité de modifier à souhait le caractère expressif de la parole synthétisée grâce à des paramètres.
La contrôlabilité est évaluée avec une expérience objective et une expérience subjective. L’évaluation objective est basée sur une mesure de corrélation entre les caractéristiques acoustiques et une représentation latente de l’expressivité. L’évaluation subjective est basée sur une expérience de perception dans laquelle on montre aux utilisateurs une interface 2D de synthèse vocale expressive contrôlable et on demande à ces utilisateurs de retrouver la position d’une phrase de référence. Pour en savoir plus sur son travail: https://www.mdpi.com/2227-9709/8/4/84/htm
De plus, selon Noé Tits, pour pouvoir interagir correctement avec des systèmes intelligents, un défi majeur est de rendre cette interaction aussi intuitive et naturelle que possible pour les utilisateurs.
Lorsqu’on travaille avec l’interaction vocale, cela correspond à synthétiser une voix naturelle avec une expressivité cohérente avec le contexte. Les différentes possibilités dans ce domaine seraient intéressantes pour, par exemple, la création de personnages virtuels avec des voix expressives, pour des films d’animation, des livres audio synthétiques…