#synthèse

Articles repérés par Hervé Le Crosnier @hlc CC BY 21/02/2024

Amazon révèle une synthèse vocale “de pointe” avec BASE TTS
▻https://actualitte.com/article/115810/technologie/amazon-revele-une-synthese-vocale-de-pointe-avec-base-tts
https://actualitte.com/uploads/images/amazon-revele-une-synthese-vocale-de-pointe-avec-base-tts-65d488ac7d178497660891.jpg
L’équipe d’une vingtaine de chercheurs ne dissimule pas sa fierté d’avoir mis au point un modèle de synthèse vocale doté d’un nombre impressionnant de 980 millions de paramètres, et « entraîné » à l’aide de 100.000 d’enregistrements vocaux issus du domaine public.
BASE TTS, ou Big Adaptive Streamable TTS with Emergent abilities (Large modèle adaptatif de synthèse vocale en diffusion continue) est présenté comme une technologie de synthèse vocale « de pointe », capable de prononcer correctement des mots étrangers dans un discours en anglais, de marquer la ponctuation, mais aussi d’exprimer telle ou telle émotion.
Le modèle fonctionne à partir d’un texte brut, qu’il analyse et interprète selon ses capacités, avec une relative autonomie. Son « entrainement » à partir d’un grand volume de discours et autres extraits de conversation a permis d’affiner la prosodie de BASE TTS, autrement dit sa lecture, mais aussi la manière dont l’outil prononce les mots de manière régulière, en respectant les sonorités et les rythmes.
Autant de « détails » qui ne passent pas inaperçus, lorsque l’on écoute un texte retranscrit par une synthèse vocale...
Des livres lus à la pelle ?
Le développement de cet outil par des chercheurs affiliés à Amazon n’est pas anodin, puisque la firme de Seattle mise notamment sur le livre audio pour fidéliser ses clients. Sa filiale Audible a de nombreux concurrents, dont le géant suédois Spotify, et le nerf de la guerre se trouve entre autres du côté de la taille du catalogue.
Aussi, l’enjeu de la synthèse vocale apparait-il comme crucial : en proposant aux auteurs indépendants, mais également aux éditeurs, un outil performant pour transposer le texte à l’oral, Amazon peut s’assurer un flux de récits et de documents audio continu.
Amazon Polly, présenté en 2019, constituait un premier pas en ce sens, avec une solution technique simple et efficace pour faire la lecture avec un certain nombre de voix synthétiques. Fin 2023, la multinationale ouvrait même une phase de texte auprès des auteurs indépendants, pour qu’ils puissent aisément exploiter leurs textes au format audio.
BASE TTS pourrait sans aucun doute améliorer l’expérience des utilisateurs de ces livres audio lus par des voix de synthèse. Pour la plus grande inquiétude des comédiens et comédiennes, déjà secoués par les développements technologiques dans ce domaine.
Toutefois, le modèle de synthèse vocale restera pour l’instant réservé à d’autres recherches menées en interne, sans mise à disposition du public. Les chercheurs continueront à étudier les améliorations apportées par la fouille massive des données, pour développer d’autres applications de synthèse vocale.
#Synthèse_vocale #Amazon #Livre_audio

Articles repérés par Hervé Le Crosnier @hlc CC BY

Écrire un commentaire
Dror@sinehebdo @sinehebdo 2/06/2020

Les miracles de la #synthèse_vocale :
#Ayn_Rand et #Slavoj_Žižek - Barbie Girl
▻https://www.youtube.com/watch?v=h56WLqdD-7I
#humour

Dror@sinehebdo @sinehebdo

Écrire un commentaire
ze_dach @ze_dach CC BY-NC-SA 14/06/2018

My Line powered by Google - Google Colombia - YouTube
▻https://www.youtube.com/watch?v=0ZVjhTltaIA
At one time, #Google Assistant could only be found on a handful of smartphones. Today, Google Assistant is available on 500 million devices — smartphones, smart speakers, smart watches, tablets, smart televisions, and a broad range of home appliances and cars.
But what about the billions of people in the world who still don’t have a smartphone? Enter #MyLine, a phone number you can call to ask Google Assistant questions in parts of Colombia — without a smartphone or computer or even the internet.
When a person calls 6000913, they receive a welcome greeting and invitation to ask any question. After posing a question, users may hear prompts like “Do you have more questions?” or “Feel free to hang up whenever you’re done,” #CainkadeStudio CEO Jeremy Landis told VentureBeat in an email.
L’idée est géniale, mais l’idéal est de faire la même chose avec un #assistant_vocal open source (eg. #Mycroft.AI ou #HeyAthena) câblé sur des moteurs de recherche respectant la vie privée type #DuckDuckGo ou #libre comme #searx.
Mycroft – Open Source Voice Assistant - Mycroft
▻https://mycroft.ai
Hey Athena – Your personal voice assistant ▻https://github.com/rcbyron/hey-athena-client
- #Google
- #YouTube
ze_dach @ze_dach CC BY-NC-SA
- ze_dach @ze_dach CC BY-NC-SA 14/06/2018
  
  Je rajoute quelques tags #voix #assistance_vocale #intelligence_artificielle #synthèse_vocale
  
  ze_dach @ze_dach CC BY-NC-SA
Écrire un commentaire
mad meg @mad_meg CC BY 9/06/2018

2

2

Question et demande sur le fonctionnement de @seenthis - la synthèse vocale.
Je croi que ma demande est plutot déstinée à @arno
J’utilise beaucoup la synthèse vocal par défaut dans firefox pour écouté les articles pendant que je dessine. Mais sur seenthis, la petite icone qui permet la lecture n’est pas présente. Je ne sais pas si c’est une fonctionnalité difficile à mettre en place, mais j’aimerais bien que ma robote lectrice « Amélie » puisse me lire @seenthis . Ca serait plus sympas pour l’accessiblilité car les fonctionnalité sont pratiques pour les non et mal voyant·es et pas seulement pour les dessinatrices.
Merci d’avance et bonne journée.
#seenthis #accessibilité #synthèse_vocale #Amélie

mad meg @mad_meg CC BY
- ARNO* @arno ART LIBRE 9/06/2018
  
  Je ne connais pas Amélie, mais il faudrait regarder s’il y a un balisage qui permettrait de lui indiquer ce qu’il est pertinent de lire…
  Dans une logique (peut-être) similaire, il n’apparait pas de bouton « lecteur » dans Safari pour les pages de Seenthis : c’est le bouton qui permet, dans les pages d’articles, de virer toute l’interface graphique et de n’afficher que le texte. Généralement c’est la même chose qui permet d’« aspirer » le texte pour liseuses, ou différents outils permettant de lire hors ligne. Typiquement le genre de chose pour lequel je n’ai jamais réussi à trouver s’il existe un balisage dédié. Il est très possible que l’absence de bouton « lecteur » dans Safari soit le même genre de difficulté que l’absence de lecture par synthèse vocale (c’est-à-dire que ces outils n’arrivent pas à identifier quel est le texte pertinent dans la page).
  
  ARNO* @arno ART LIBRE
- mad meg @mad_meg CC BY 9/06/2018
  
  Merci @arno
  Je me suis dit que c’etait un problème de balise aussi mais je sais meme pas bien ce qu’est une balise. Je vais voire si je trouve quelques infos. J’appel ma synthèse vocale amélie mais il y a aussi thomas et plein d’autres prénoms selon les langues et les genres des voix. Ca s’appel plutot probablement la synthèse vocal par défaut dans firefox.
  Gogol me propose ca : ▻http://outils-web.fr/ajoutez-de-la-reconnaissance-vocale-a-votre-site
  Mais je sais pas si c’est adapté au problème.
  
  mad meg @mad_meg CC BY
- RastaPopoulos @rastapopoulos CC BY-NC 9/06/2018
  
  @arno : <main> et surtout l’aria role=main ?
  Je viens de regarder dans quelques sites qu’on a et où ça marche, j’ai l’impression qu’il prend le role main moins le <footer> s’il y en a un dedans.
  
  RastaPopoulos @rastapopoulos CC BY-NC
- b_b @b_b PUBLIC DOMAIN 10/06/2018
  
  D’après le code de la lib qui gère ça dans firefox, voici la liste des éléments préférés pour repérer le contenu : article|body|content|entry|hentry|h-entry|main|page|pagination|post|text|blog|story
  ▻https://github.com/mozilla/readability/blob/master/Readability.js#L116
  Quelques infos à ce sujet par ici : ▻https://stackoverflow.com/questions/30661650/how-does-firefox-reader-view-operate/30688312
  Il n’y a plus qu’à créer un ticket à ce sujet pour qu’on pense à améliorer seenthis sur ce point dans le futur :)
  
  b_b @b_b PUBLIC DOMAIN
- mad meg @mad_meg CC BY 6/04/2020
  
  Coucou les codeuses et codeurs de seenthis. Ou en etes vous de cette commande ? J’en aurais bien l’utilité en ce moment de tsunami informationnel. Du coup je me permet de vous relancer. Merci en tout cas pour seenthis c’est tellement top que c’est #supercalifragilisticexpialidocious
  
  mad meg @mad_meg CC BY
Écrire un commentaire
Fil @fil 4/11/2017

This Startup’s Artificial Voice Sounds Almost Indistinguishable From A Human’s
▻https://www.forbes.com/sites/parmyolson/2017/11/03/this-startups-artificial-voice-sounds-almost-indistinguishable-from-a-humans
https://thumbor.forbes.com/thumbor/600x315/smart/https%3A%2F%2Fblogs-images.forbes.com%2Fparmyolson%2Ffiles%2F2017%2F11%2Fthumbnail_Peter-Cahill-Voysis-1-1200x800.jpg
▻https://soundcloud.com/user-580363316/voysis-wavenet
#wavenet #voix #synthèse_vocale

Fil @fil

Écrire un commentaire
Fil @fil 13/04/2017

4

4

A Neural Parametric Singing Synthesizer
▻http://www.dtic.upf.edu/~mblaauw/IS2017_NPSS
Musique :
▻http://www.dtic.upf.edu/~mblaauw/IS2017_NPSS/files/f2_npss_power_ultimo_bgm_fx.mp3
le fichier ci-dessous ne contient que la voix de synthèse (on entend quelques blips):
▻http://www.dtic.upf.edu/~mblaauw/IS2017_NPSS/files/f2_npss_multi_ultimo_dry.mp3
le papier des chercheurs de l’uni Pompeu Fabra (Barcelone): ▻https://arxiv.org/pdf/1704.03809.pdf
#machine_learning #robot #synthèse_vocale #chant @intempestive

Fil @fil
- Fil @fil 14/04/2017
  
  un article de @qz
  ▻https://qz.com/958213/i-couldnt-tell-that-this-was-a-robot-singing-duke-ellingtons-signature-song
  
  Fil @fil
- Fil @fil 24/05/2017
  
  un autre, avec une démo assez probante (encore détectable au casque quand même)
  ▻https://singularityhub.com/2017/05/24/new-ai-mimics-any-voice-in-a-matter-of-minutes
  
  Fil @fil
- Fil @fil 7/09/2017
  
  Un autre outil du même acabit, mais cette fois on s’approche de l’indétectable (?)
  ▻https://ytaigman.github.io/loop/site
  
  Fil @fil
Écrire un commentaire
mad meg @mad_meg CC BY 27/11/2016

8

8

J’ai trouvé hier cet outil de synthèse vocale en ligne et gratuite sur Chrome et Safari qui fonctionne plutot bien
▻http://ttsreader.com/fr
Maintenant je peu profiter des textes de @seenthis pendant que je dessine. Si vous en connaissez d’autres je suis prenneuse.
#outil #synthèse_vocal #lecture #audio

mad meg @mad_meg CC BY
- Archiloque @archiloque CC BY 27/11/2016
  
  @mad_meg dans les versions récentes de Firefox je crois que c’est intégré : quand tu vas dans le mode « lecture » il y a un bouton sur la gauche, sinon ça fait partie des fonctionnalisés de base sur mac même si les vois ne sont pas très agréables
  
  Archiloque @archiloque CC BY
- mad meg @mad_meg CC BY 27/11/2016
  
  cool @archiloque et @intempestive je ne connaissais pas cet outil dans Firefox c’est trop bien ce petit livre. c’est bien plus pratique que ttsreader et les voix sont pas fantastiques mais je me suis déjà habituée à Amélie.
  Vive @seenthis
  
  mad meg @mad_meg CC BY
- mad meg @mad_meg CC BY 27/11/2016
  
  Sur @seenthis j’ai pas vu l’icone de livre s’afficher. C’est pareil que pour toi.
  
  mad meg @mad_meg CC BY
- marcimat @marcimat 28/11/2016
  
  Je ne l’ai pas vu sur seenthis, mais pour Firefox, cela dépend aussi de la longueur du texte. Le livre ne s’affiche que si le texte a suffisamment de caractères semble t-il.
  La seule chose qui me chiffonne avec la synthèse vocale, c’est qu’elle ne change pas de langue sur les citations ou paragraphes ou mots étrangers (alors même que le html indique bien dedans la langue utilisée pour la citation). Du coup, ça lit tout francisé, et c’est assez bizarre. Elle ne comprend pas bien non plus les mots composés avec trait d’union, faisant généralement une grande coupure dessus. Après il y a aussi quelques prononciations incorrectes, mais on ne peut pas lui en vouloir, quand c’est le sens ou la grammaire de la phrase qui décide de la prononciation de tel ou tel mot.
  
  marcimat @marcimat
- mad meg @mad_meg CC BY 28/11/2016
  
  C’est vrai que pour les mots en langue étrangère ca donne des choses amusantes et comme je met beaucoup de textes féministes écrit en langage neutre ca fait un peu bégayer Amélie. Ca reste quant même assez performant et combiné à wikisource ca me promet de chouettes écoutes.
  
  mad meg @mad_meg CC BY
- unagi @unagi CC BY-NC 7/12/2016
  
  Je viens de m’apercevoir que wallabag aussi dispose d’une synthèse vocale.
  ▻https://seenthis.net/messages/529712
  
  unagi @unagi CC BY-NC
Écrire un commentaire
Nicolas Hoizey @nhoizey CC BY-NC-SA 21/09/2010

Faites chanter votre Mac !
►http://www.mac4ever.com/news/41056/astuce_faites_chanter_votre_mac_a_grand_coups_de_terminal
osascript -e ’say “oh This is a silly song silly song silly song this is the silliest song ive ever ever heard So why keep you listening listening listening while you are supposed to work to work to work to work its because i hate my job hate my job hate my job its because i hate my job more than anything else No its because youve no life youve no life youve no life and you better go get one after forwarding this crap” using “cellos”’
#say #terminal #mac #logiciel #voix #synthèse_vocale #chanson #gp:links

Nicolas Hoizey @nhoizey CC BY-NC-SA

Écrire un commentaire

#synthèse_vocal