Conversió de text a parla en català

He intentat investigar si es possible convertir de text a parla en català, per tal de fer audiollibres en català de forma fàcil com es poden fer en castellà o en anglès, per exemple.

La conclusió és que aquests recursos existeixen i tot sembla indicar que han estat desenvolupats per universitats públiques catalanes.

Recentment l'Observatori de la Societat del Coneixement va recomanar en les seves conclusions que aquests recursos haurien de ser disponibles lliurement, per tal de millorar la situació de desavantatge de la llengua catalana.
Aquesta conclusió sota el títol de "Crida a alliberar els recursos públics de la llengua catalana" es pot consultar.

1) Nosaltres fem servir un programa que es diu TextAloud que permet a qualsevol usuari produir fàcilment arxius wav o mp3 a partir de qualsevol text, d'una pàgina web, o arxiu de text (txt, o inclús pdf o word).

Aquest programa es basa en unes biblioteques TTS de conversió de text a parla, basades en una tecnologia desenvolupada per Microsoft, anomenada Microsoft Speech API

A la pàgina de recursos de Nextup es poden baixar lliurement biblioteques TTS SAPI per a anglès, holandès, francès, alemany, italià, portuguès i espanyol.

Preguntat a Nextup si aquesta biblioteca es pot aconseguir pel català, la seva resposta ha estat:
"There are several spanish voices, but none specifically Catalan I know of.

Ken White
NextUp.com
The Power of Spoken Audio
http://www.NextUp.com"

Nota: Tirant lo Blanch en anglès
Al Projecte Gutenberg, existeix una versió resumida en anglès del Tirant lo Blanch, que fa dos anys PalmCAT va convertir al format per a ordinadors de butxaca. En aquests dos anys 824 usuaris han baixat aquesta versió.
Recentment PalmCAT ha fet una versió àudio en anglés, d'aquesta versió resumida, per escoltar en qualsevol reproductor digital que es pot baixar lliurement de The archive.org. Aquesta versió està disponible en línia.

Crida l'atenció que aquesta obra cabdal de la literatura catalana, citada per Cervantes com "la millor obra literària del món" es pugui trobar lliurement en anglés en tantes versions, (text, de butxaca i diversos formats àudio) mentre en català només es pugui trobar la primera versió text, digitalitzada de forma casolana pels mestres i alumnes de tinet.cat que i encara no ha trobat el suport necessari per a fer la seva correcció.

Paco Rivière
Coordinador de PalmCAT

APÈNDIX

2) Per tal de saber si aquests recursos, o altres de similars estan disponibles en català, he estat cercant informació amb els resultats que es presenten a continuació, sense haver arribat a cap conclusió definitiva. Potser caldria contactar amb cada un dels grups de recerca de la UPC, UAB, La Salle i l'Institut d'estudis Catalans. Tot i que donat que el primer document sembla indicar que aquesta tecnologia es va fer servir al Fòrum de les Cultures, sembla lògic creure que aquesta tecnologia està desenvolupada en català.
Si alguna d'aquestes institucions estigués disposada a cedir a PalmCAT aquesta tecnologia per a la preparació d'audiollibres en català a partir de textos clàssics, al domini públic o cedits pels seus autor, PalmCAT podria preparar alguns audiollibres lliures com ha preparat el Tirant en anglès.

* Exemple d'us de la TTS en català
* ATLAS pone su voz sintetizada en la Exposición "VEUS-VOCES-VOICES" del Forum Universal de las Culturas - Barcelona 2004
"El usuario, tecleando sobre una mesa de cristal transparente, introduce el texto en cualquiera de las cuatro lenguas oficiales y obtiene, inmediatamente, la traducción en el idioma que ha elegido: catalán, español, francés o inglés. Además, gracias a los sistemas "text-tospeech" (conversión de texto a habla) de ATLAS, el usuario puede escuchar, por voz sintetizada, la locución en voz natural de su texto en el idioma seleccionado.
Nota: Segons aquesta pàgina de la UPC: (de programari desenvolupat per la UPC) clicant a IBERVOX, ens envia a la web de ATLAS!

* Altres eines que fan servir els Microsoft Speech API
Pàgines que parlen del TTS per al català:

* Loquendo TTS Vocal Technologies and Services.

* Speech processing group
- IBERVOX Speech Recognition and Text-to-Speech for Dialogic CTI Boards
- URVI Speech Recognition and Text-to-Speech for Natural MicroSystems CTI Boards

* NLP Research Group - Natural Language Processing

* Grup de recerca: 00000023 - 00: VEU - Grup de Tractament de la Parla
Codificació de veu, Conversió text a veu, Diàleg oral, Reconeixement de la veu, Reconeixement del locutor, Traducció oral

* Laboratori de Fonètica Institut d'Estudis Catalans
Direcció: Daniel Recasens
- Grup de recerca sobre fonètica experimental (UAB - IEC).
- Atles lingüístic del Domini Català
Direcció: Joan Veny i Clar, Lídia Pons i Griera

* Corpus orals per a la fonètica i les tecnologies de la parla
Joaquim Llisterri
- Departament de Filologia Espanyola, Universitat Autònoma de Barcelona
- Observatorio Español de Industrias de la Lengua, Instituto Cervantes

Següent: Google ads ignora el català
Anterior: L'audio llibre a Catalunya Radio

Notícies relacionades:
Acord amb Loquendo per crear audiollibres en català
El primer audiollibre en català

Conversió de text a parla en català

Comentaris

Publica un comentari a l'entrada

Entrades populars d'aquest blog

Ens hem traslladat a palmcat.tiddlyspot.com

Com desar documents en format PalmDoc amb l'Abiword