|
Convertir des fichiers texes en fichiers audio avec TextSound
|
|
Logiciel Concerné : TextSound
Version du logiciel utilisée pour cet article : Textsound 2.0
Langue du Logiciel : anglais uniquement
Nom de l’éditeur : ByteCool Software Inc.
Site de l’éditeur : http://www.bytecool.com
Plates-formes supportées : Windows 95, 98, ME, Windows NT 4.0, 2000 et Windows XP
Tarif de la licence : $29.95
A noter que le logiciel n’est pas vendu en magasin, on peut uniquement l’acheter par carte bancaire en ligne en quelques cliques sur le site de l’éditeur.
Vous recevez ainsi par E-mail un code personnel qui le déverrouille instantanément.
L’unique limitation de la version d’essai de Textsound est que le logiciel Ne vous autorise à effectuer que 50 conversions de fichiers textes en fichiers audio.
L’activation de Textsound en entrant votre code personnel fera disparaître immédiatement cette limitation.
A noter que pour aller plus vite dans la suite de ce document, nous utiliserons fréquemment les initiales TS pour dénommer TextSound.
TextSound est un petit logiciel qui vous permet de convertir des fichiers textes (*.txt) de toute taille en fichiers audio Wav, MP3, WMA, etc.
Ceci peut être extrèmement pratique pour pouvoir écouter des documents de toutes natures sans rester nécessairement devant votre PC, mais c’est surtout si vous disposez d’un baladeur MP3 que vous aprécirez grandement le fait de pouvoir écouter un texte préalablement converti par TS en fichier audio.
_ De plus, TextSound peut convertir à la volée autant de fichiers que vous le désirez et chaque fichier peut bénéficier de réglages différents concernant la synthèse vocale utilisée pour la conversion ou le format audio souhaité.
Pour les personnes qui le désirent, TS propose aussi une version en ligne de commande du logiciel (tsc.exe) qui peut être pratique aux utilisateurs expérimentés pour intégrer par exemple la conversion de fichiers texes en fichiers audio au sein de fichiers batch.
Nous n’évoquerons pas cependant dans cet article l’utilisation particulière de tsc.exe dans la mesure ou je pense que les personnes intéressés sauront par eux-même découvrir son mode de fonctionnement, celui-ci étant très bien documenté dans l’aide en ligne du logiciel.
Tout d’abord, il vous faut aller chercher le logiciel chez son concepteur.
Téléchargement direct de TextSound (Taille : 2 MO)
Une fois le logiciel téléchargé, vous pouvez en lancer l’installation.
L’installation à proprement parlée est très simple, le programme d’installation est tout à fait standard et ne pose aucune question particulière en dehors des usuels choix du dossier de destination / groupe de programme.
Une fois TextSound installé, il vous faut également installer un moteur de synthèse vocale qui soit compatible avec la norme Microsoft SAPI 4.0.
la synthèse Eloquence livrée avec JAWS n’étant pas compatible.
Vous trouverez, à la fin de cet article, une sélection de moteurs de synthèse vocale que j’ai personnellement testé avec TextSound et qui ont donné de bons résultats.
L’interface de TS est tout à fait standard et ne pose aucun problème d’accès avec un lecteur d’écran comme JFW.
En arrivant dans TS, vous êtes positionné sur la liste de conversions qui est vide au départ.
Il s’agit de la liste des fichiers à convertir ou qui ont été converti.
Cette liste comprend, outre le nom du fichier concerné, le nom du fichier de destination, le paramétrage de synthèse vocale choisi pour ce fichier et enfin l’indication du status :
Ce status peut être un des suivants :
New, si le fichier vient d’être ajouté à la liste de conversion mais que vous n’avez pas encore lancé cette dernière
Pending, si vous avez lancé la conversion mais que le fichier sur lequel vous êtes positionné n’a pas encore été traité
Converting, si le fichier a convertir est en cours de traitement par TS
Building, si TS est en train d’encoder le fichier dans un format compressé tel que MP3, etc.
Done, si le fichier a été converti
error, si une erreur quelconque s’est produite pendant la conversion, dans ce cas, un message explicatif suit généralement l’indication error.
Voici un exemple d’un élément d’une liste de conversion :
[ebook fr french fr... [ebook fr french franc... Pierre, French, Info... New
Comme vous le voyez, par défaut, JFW ne peut pas lire dans son intégralité les éléments de la liste de conversion.
Ceci est due au manque de place à l’écran qui ne permet pas de tout afficher en même temps.
Les voyants, eux, ne sont pas gênés car ils peuvent faire défiler l’information avec la souris en agrandissant les colonnes de la liste de conversion.
heureusement une parade bien utile existe pour nous.
Il s’agi , quand vous vous trouvez dans TS, d’ouvrir le gestionnaire de configurations de JFW pour modifier le fichier
textsnd.jcf
une fois dans le gestionnaire de configurations, activer le menu modifier options et aller dans les options avancées.
là, cochez simplement la case "utiliser MSAA pour les vues de listes".
Vous pouvez alors faire ALT-f4 et sauver le fichier textsnd.jcf.
Vous aurez ainsi un meilleur accès à la liste de conversions.
Nous allons à présent examiner les menus déroulants de Textsound.
Le menu File contient les options usuelles du menu Fichier de tout logiciel.
Cependant, ce menu sert ici à ouvrir ou sauver des listes de conversions.
Ceci peut se révéler utile si vous convertissez fréquemment une liste de fichiers ayant toujours le même nom et que vous souhaitiez par conséquent conserver aussi les mêmes paramètres de conversion pour cette liste.
Le menu conversion, également disponible par la touche "menu contextuel" contient les options suivantes :
Add... : Pour ajouter un fichier à la liste de conversion.
Ce choix ouvre une boîte de dialogue standard d’ouverture de fichier.
Remove : ce chois retire le fichier de la liste de conversion sur lequel vous êtes positionné mais n’efface pas le fichier du disque bien évidemment !
La touche Del ayant le même effet.
Edit : ce choix ouvre une boîte de dialogue permettant de modifier, pour chaque fichier, les paramètres de voix souhaités ainsi que le format audio de destination (si nécessaire) nous reviendrons plus en détail sur ce qui se cache derrière le choix Edit plus loin dans cet article.
Select All (CTRL+A) : sélectionne tous les fichiers de la liste de conversion pour effectuer une action sur l’ensemble des fichiers de la liste de conversion, qu’il s’agisse d’éditer à la volée les paramètres de synthèse vocale de tous les fichiers à la fois par exemple, cf. choix Edit, ou bien pour lancer la conversion sur l’ensemble de la liste.
Convert ! (f5) : lance la conversion
Echape : arrêtes immédiatement la conversion
View source (ctrl+w) : lance simplement votre éditeur de texte (par défaut le bloc-notes de Windows) sur le fichier de la liste de conversion sur lequel vous êtes positionné. Ceci peut être utile si vous souhaitez vérifier le contenu d’un fichier texte avan la conversion
Preview (ctrl+p) : lance votre lecteur de fichiers audio sur le fichier de la liste de conversion sur lequel vous êtes positionné, à condition toutefois que le fichier de la liste ait été déjà converti bien entendu,sinon vous obtiendrez un message d’erreur !
Le menu Options vous permet de configurer via les chois "Preferences" et "Output Format" le choix de la synthèse vocale toujours utilisée par défau ainsi que le format audio de destination par défaut.
On trouve aussi dans le menu options le choix "Voice guide" qui vous enverra tout simplement sur le site de ByteCool Software sur une page listant plusieurs moteurs de synthèse vocale compatibles avec TextSound.
Cela dit, l’information présentée sur cette page, outre qu’elle est en Anglais, n’est pas très à jour mais elle peut néanmoins vous intéresser.
Le menu Help vous permet comme toujours d’accéder à l’aide en ligne de TextSound et vous offre aussi une option pour rentrer votre code personnel d’enregistrement pour dévérouiller le programme.
Nous allons à présen examiner en détail la boîte de dialogue qui se cache derrière l’option Edit du menu conversion.
Cette boîte de dialogue vous sera vite utile pour adapter ne serait-ce que la vitesse de la synthèse vocale que vous souhaitez utiliser pour un fichier donné.
une fois donc avoir validé sur Edit, vous trouvez les éléments suivants :
tout d’abord, un bouton radio à trois positions qui vous permet de sélectionner l’emplacement de destination du fichier converti.
"In the same folder as the text file " : le fichier audio de destination sera créé dans le même dossier que le fichier texte à convertir
"In the specified "Favorite Sound Folder" : dans votre dossier de fichiers son préféré, cf. menu options / Preferences pour en indiquer l’emplacement
"Use the user-defined folder and filename " : vous permet d’indiquer pour le fichier dont vous éditer les paramètres de conversion, son emplacement et son nom complêt (faire Shift Tab quand vous vous trouvez sur ce choix pour accéder à la zone d’édition correspondante )
"Text-to-Speech voice name" : il s’agit d’une liste déroulante qui vous présente toutes les voix de synthèse vocales disponibles sur votre système.
L’indication de la langue pour chaque voix n’est pas forcément précisée, cela dit l’absence de cette indication signifie généralement qu’il s’agi d’une voix anglaise.
"Text-to-Speech Voice Speed" : il s’agit d’une case de défilement horizontal qui permet d’indiquer la vitesse de prononciation de la synthèse vocale.
"Text-to-Speech Voice Pitch" : permet de régler le ton de la voix, plus il est élevé, plus la voix sera aigûe.
"Text-to-Speech Voice Volume" : permet de régler le volume de la voix pour le fichier audio de destination.
Sauf exception il vaut mieux laisser le volume sur 100%.
"Output Format..." : ce bouton ouvre une autre boîte de dialogue permettant de configurer le format audio de destination.
Le premier élément de cette boîte de dialogue est une liste déroulante de choix de formats d’enregistrements déjà préconfigurés.
Par défaut, à l’installation de Windows, vous en avez trois : Qualité CD, Qualité Radio, et Qualité Téléphonique.
mais vous pouvez créer les votres grâce au bouton "Enregistrer sous..." qui suit.
ou en supprimer grâce au bouton "supprimer..."
Vous trouvez ensuite une liste déroulante qui vous présente les différents CODEC audio présents dans Windows où que vous avez instalés.
dans une installation de Windows par défaut, vous en avez déjà une quinzaine, mais la plupart ne sont utiles que pour des types d’applications biens spécifiques, tel que le CODEC GSM qui sert pour des applications de téléphonie, etc.
Les seuls formats audio réellement utiles pour nous sont ici le format PCM qui vous permet d’enregistrer en format .Wav Non compressé, ainsi que le format "MPEG Layer 3" MP3.
Voici quelques astuces qui me paraissent utile de vous indiquer dans la mesure où j’utilise TexSound depuis près de 18 Mois :
Si vous avez un gros fichier texte à convertir, mieux vaut le couper en plusieurs parties.
En effet, il est plus simple de s’y retrouver dans des fichiers de tailles plus petites, surtout si vous intérompez la lecture du fichier audio avant la fin.
Selon mon expérience, un fichier texte de 60 KO vous produira un fichier audio d’environ 60-65 minutes à une vitesse de lecture normale.
Concernant le format audio de destination pour la conversion, il est préférable de sélectionner un format dont
l’échantillonnnement en KiloHertz soit le même que celui de la synthèse vocale utilisée.
Ceci pour éviter l’efet désagréable d’un son audio rendu trop métalique à cause du ré-échantillonnage à la conversion qui peut provoquer des distortions désagréabls.
Par exemple, si vous utilisez la synthèse IBM ViaVoice TTS, vous choisirez par exemple le format MP3 suivant :
32 KBit/S, 22,050 HZ, Mono.
Voici le taux d’échantillonnage des synthèses vocales que j’ai pu tester avec TextSound à titre d’information :
IBM ViaVoice TTS : 22,050 Hz
L&H TTS 3000 : 11,025 Hz
L&H RealSpeak (fourni avec Omnipage Pro version 12 : 11,025 Hz
Infovox Desktop Pro 2.0 (voix Julie) : 22,050 Hz
Infovox Desktop Standard : 16,000 Hz
At&T Natural Voices : 16,000 Hz
Il est également possible d’ajouter des fichiers textes à la liste de conversion via l’explorateur ou le poste de travail.
En efet, lorsque vous êtes positionné dans l’explorateur sur un fichier dont l’extention est .txt, une option supplémentaire dénommée "convert to audio file..." aparaît alors dans les choix du menu contextuel.
TextSound est en théorie compatible avec tous les moteurs de synthèse vocale qui gèrent la norme Microsoft SAPI 4.0, mais à l’usage, on constate hélas que plusieurs synthèses vocales ne fonctionnent pas corectement avec TextSound.
C’est le cas en particulier des synthèses basées sur le moteur Elan Speech comme Digalo TTS 2000 et Sayitpro.
Voici donc une petite liste de moteurs de synthèse vocale que je peux vous recomander d’utiliser :
L&H TTS 3000 : ce moteur de synthèse vocale a été développé par L&H pour Microsoft.
Il offre une qualité de voix médiocre mais il est gratuit, très peu gourmand en ressources système et il est disponible en 11 langues.
Vous pouvez [télécharger la voix L&H 3000 française ici>-http://activex.microsoft.com/activex/controls/agent2/lhttsfrf.exe] (2,24 MO)
IBM ViaVoice TTS : il s’agit de la synthèse vocale d’IBM que les utilisateurs de JFW connaissent très bien, puisque la voix est identique à Eloquence.
c’est vraiment la synthèse vocale offrant le meilleur rendement avec TextSound, on peut ainsi convertir en moins de 20 minutes un fichier texte de 500 KO en MP3 sur un PC équipé d’un Pentium 4 à 1.3 GHZ.
si vous disposez déjà de certains logiciels spécialisés comme Open Book version 6 ou plus récent, ou bien Home Page Reader, le navigateur Web parlant d’IBM, vous avez déjà cette syntèse vocale installée sur votre ordinateur.
Sinon, le moyen le plus simple pour obtenir sans frais IBM ViaVoice TTS est encore d’installer la version démo 30 Jours de Home Page Reader : téléchargement IBM Home Page Reader version démo ici.
L’installation de HPR installera du même coup IBM ViaVoice TTS qui n’est pas limité dans le temps contrairement à la démo HPR, et de plus, la désinstallation de HPR ne retire pas IBM ViaVoice TTS qui dispose de sa propre entrée dans "Ajout / Suppression de programmes".
AT&T Natural Voices : Une synthèse vocale de très bonne qualité élaborée dans les laboratoirs de AT&T aux Etats-unis.
Elle est néanmoins très gourmande en espace (disque 850 MO par voix installée) et demande pas mal de ressources système.
Cette synthèse vocale peut être achetée ici : achat synthèse AT&T Natural Voices
On peut aussi l’acheter à un tarif très compétitif chez NextUp Technology mais il est alors nécessaire de commander les voix AT&T avec un des logiciels conçus par NextUp.
Infovox Desktop version Pro et version Standard : ces deux moteurs réalisés par Babel Infovox sont de très bonne qualité et marchent très bien avec TextSound.
une version d’évaluation 30 Jours est disponible ici : Page de téléchargement des versions d’évaluation Infovox Desktop
Malheureusement, les tarifs des licences des produits Infovox sont notoirement élevés.
J’espère que cet article vous donnera envie d’utiliser TextSound.
Si vous avez des difficultés à utiliser ce logiciel, n’hésitez pas à envoyer un message sur les listes Winaide ou Ceci-son.
Moi-même ou d’autres se feront un plaisir de répondre à vos questions.