Bonjour,
Je me présente, je m’appelle Florian, j’ai 18 ans et je suis en terminale S science de l’ingénieur. Au cours de cette année, nous devons créer un projet, le développer et le produire si possible. Mes 3 camarades et moi-même sommes partis sur la réalisation d’un « casque » nommé « DeafGlasses » qui serait composé d’un microphone, d’un écran et d’autres composants essentiellement Arduino ainsi que d'un Raspberry Pi model 3b+. L’idée est de permettre aux personnes atteintes de surdité partielle ou totale de pouvoir palier à leur handicape, du moins, en partie. Globalement, le fonctionnement est assez simple : les paroles d’un tiers, le signal sonore, est capté par le microphone qui, par le biais d’un code, d’un programme, convertit le signal sonore en signal numérique, sous forme de texte et l’affiche sur un écran situé à une distance réglable des yeux de l’utilisateur.
Mon rôle dans ce projet concerne la retranscription des paroles en texte et de l'envoie de ce dernier sur un écran arduino donc voici le lien :
https://www.gotronic.fr/art-shield-ecran-tft-tactile-ada1651-21306.htm
Que je vous explique comment cela est censé fonctionné dans mon esprit :
Un microphone branché en USB au RPi 3B+ sera chargé de réceptionné les paroles qu'un tiers échange avec la personne qui porte le DeafGlasses. Ces paroles seront traitées à l'aide d'un programme python faisant intervenir une intelligence artificielle qui devra retranscrire ce qui a été dit puis envoyer le texte à l'arduino qui l'affichera sur l'écran.
Seulement, de nombreux problèmes :
- Le gros problème et la raison pour laquelle je poste ce Topic concerne la première phase de cette retranscription de la parole. Pour réaliser cela, il me faut un moteur Speech To Text sur le Raspberry qui sera connecté à Internet. En effet, soit il n'est pas connecté et il ne pourra retranscrire que des mots clés soit il l'est et le champs des possibles s'ouvre car pour réaliser cette retranscription vocale, il faut que toutes les phrases soient traitées.
Ainsi, n'y connaissant rien en la matière, j'ai cherché sur Youtube et j'ai eu l'idée d'installer Jarvis, l'assistant vocal créé par la chaîne "Domotique facile". Dans mes plans, j'installais l'assistant, je "bloquais" tout ce qui concernait la partie interaction entre Jarvis et le porteur du casque. Cela aurait été le "corps" qui aurait porté le moteur STT car je ne sais pas si sur python, je peux simplement créer un programme où j'aurais installé simlpement le moteur STT et créé une variable pour chaque parole qui aurait été traitées et transformées en texte que j'aurais ensuite envoyer à l'arduino.
Bref, j'ai donc installé Jarvis, j'ai obtenu la clé de "snow boy" pour la détection du mot clé, google pour la synthèse vocale (le moteur TTS qui ne me sert pas dans mon projet mais sans, cela ne marchait pas) et en ce qui concerne le plus important, le moteur STT, je n'ai pas pu l'installer : celui de google est payant de ce que j'ai vu, celui de bing ne fonctionne pas (les clés que j'avaient ne sont valides qu'un mois et ne fonctionnaient pas), il y a wit dont j'ignore le fonctionnement et Snow boy que je ne peux pas utiliser avec le projet car il fonctionne hors ligne. De plus, tout est en anglais et j'ai peur de payer des frais sans le savoir ou de m'être abonné à des choses gratuites et que de l'argent me soit prélevé ensuite.
Voilà le coeur du problème, pour le synthétiser, comment transcrire la parole sur arduino ? Est-ce qu'un "corps", une "enveloppe" est indispensable pour que le moteur STT fonctionne ? Est la bonne solution avec Jarvis ou je peux m'en passer car je ne m'en serais servi justement uniquement comme "corps" : pas d'utilisation de reconnaissance vocale et de commande.
Si vous vous demandez l'utilité et le choix de repasser par l'arduino pour afficher le text et pourquoi on n'a pas simplement brancher un écran sur l'HDMI du RPi, c'est parce qu'étant des débutant en informatique et en programmation, nous ignorions l'existence des RPi et nous voulions absolument programmer en arduino pour avoir "une sécurité" car ce sont les seuls composants auxquels nous avons du faire face depuis le lycée et donc les seuls avec lesquels nous avions des "connaissances". De plus, nous aurons une application programmé sur MIT app inventor qui nous permet de gérer des fonctionnalité sur l'écran (police, taille) et cela passe par un module bluetooth arduino donc l'arduino centralise tous les composants.
Je vous remercie beaucoup par avance, toutes les aides sont les bienvenues !
Bonne fin de journée !