Oui je suis d'accord avec toi, car c'est déjà ce que je fais pour plusieurs objets connectés que j'ai conçu, j'utilise même MySQL en liaison avec mon serveur pour certains objets.
Ce que je pense faire pour le projet de box vocale actuel, c'est utiliser un ESP32 un micro I²S et un décodeur mp3, comme ça j’envoie à mon serveur (une appli qui écouterait sur un certain port) une commande vocale, et je pourrai retourner une réponse du serveur sous forme mp3 que pourra être dit par le décodeur mp3 de l'ESP32. Enfin ça c'est l'idée de départ, mais avec l'enrichissement de ce qui s'est dit ici, il se pourrait que j'améliore encore cela.
Quoi qu'il en soit, l'ESP32 n'aura pas un boulot monstre afin de le rendre rapide et réactif.
Merci beaucoup.