MarioCPPP
2023-02-18 13:57:42 UTC
Gli audiolibri pare stiano spopolando, eppure a me fanno
caghare.
Sapete perché ? Perché la recitazione dei DIALOGHI è inadeguata.
Bisognerebbe fare un passo ulteriore : stabilire una mappa
di associazioni biunivoca o quasi tra i personaggi
dialoganti e le rispettive voci audio.
Almeno tutti i principali attori dovrebbero avere una voce
loro. Nei film di animazione lo sanno bene : la VOCE è parte
del personaggio.
Quindi, a che minchia serve una anche magnifica voce
leggente, se appiattisce i dialoghi ?
Ora però il problema è uno diverso e tecnicamente MOLTO
COMPLESSO (sto cominciando a pensarci per il semplice fatto
che tra MidJourney e ChatGPT3 ed altri le IA stanno
migliorando la loro gestione e trasformazione degli input).
Veniamo al problema (di certo MIO ma immagino non solo mio)
: la stragrande parte delle volte, quando scriviamo "i
sorgenti" dei libri, non TAGGHIAMO in nessuna maniera con
METADATI univoci (che potrebbero anche essere il colore del
testo e/o del background) le parti dialogate in modo da
rendere il testo univocamente associabile ad un personaggio.
Questo perché il lettore non ne ha bisogno, lo capisce da
varie diciture prefisse o suffisse o dal contesto a volte.
Ma un programma di generazione audio magari no. E Neppure un
set di lettori/lettrici potrebbe riuscirci senza avere prima
studiato il testo.
Ora il problema è serio perché talvolta (nel mio caso lo è
di certo, perché le sei branche sorelle della PluriLogia
hanno raggiunto 2’842’181 parole / 17’910’067 di caratteri,
e la Rilettura integrale con il TAGGING manuale delle parti
dialogate è materialmente impossibile a meno di non
dedicarci un paio d'anni consecutivi di noia e fatica.
Il punto è : una IA specializzata nell'analisi del testo,
può già comprendere le associazioni parte <=> personaggio ?
Una parte, esigua del lavoro l'ho fatta con la
FORMATTAZIONE. Il parlato è sempre tra virgolette inglesi
doppie, in corsivo, il pensato sempre tra apici singoli
inversi, ancora in corsivo .... poi ci sono il telepatico in
grassetto corsivo non delimitato ed il parlato "divino" o
gattese o di altre entità salienti in ALL-UPPERCASE. In
altre parole è abbastanza uniformememnte riconoscibile il
testo che NON DEVE venire assegnato a nessuna voce specifica
(e quindi lasciato alla voce narrante *) : il testo privo di
qualsiasi formattazione.
Ma una IA saprebbe associare gli interventi ai personaggi ?
Che sono sovente indicati con una pletora di alias per
evitare ripetizioni ?
Riuscirebbe a TAGGARE le parti per assegnarle agli strumenti ?
Qualcuno ha idee di come si potrebbe affrontare, in modo non
manuale, questo problema ?
A voi piacciono gli audiolibri "piatti" ad una sola voce ? O
vi fanno caghare come a me ?
Lancio la pietra nello stagno !
--
1) Resistere, resistere, resistere.
2) Se tutti pagano le tas
caghare.
Sapete perché ? Perché la recitazione dei DIALOGHI è inadeguata.
Bisognerebbe fare un passo ulteriore : stabilire una mappa
di associazioni biunivoca o quasi tra i personaggi
dialoganti e le rispettive voci audio.
Almeno tutti i principali attori dovrebbero avere una voce
loro. Nei film di animazione lo sanno bene : la VOCE è parte
del personaggio.
Quindi, a che minchia serve una anche magnifica voce
leggente, se appiattisce i dialoghi ?
Ora però il problema è uno diverso e tecnicamente MOLTO
COMPLESSO (sto cominciando a pensarci per il semplice fatto
che tra MidJourney e ChatGPT3 ed altri le IA stanno
migliorando la loro gestione e trasformazione degli input).
Veniamo al problema (di certo MIO ma immagino non solo mio)
: la stragrande parte delle volte, quando scriviamo "i
sorgenti" dei libri, non TAGGHIAMO in nessuna maniera con
METADATI univoci (che potrebbero anche essere il colore del
testo e/o del background) le parti dialogate in modo da
rendere il testo univocamente associabile ad un personaggio.
Questo perché il lettore non ne ha bisogno, lo capisce da
varie diciture prefisse o suffisse o dal contesto a volte.
Ma un programma di generazione audio magari no. E Neppure un
set di lettori/lettrici potrebbe riuscirci senza avere prima
studiato il testo.
Ora il problema è serio perché talvolta (nel mio caso lo è
di certo, perché le sei branche sorelle della PluriLogia
hanno raggiunto 2’842’181 parole / 17’910’067 di caratteri,
e la Rilettura integrale con il TAGGING manuale delle parti
dialogate è materialmente impossibile a meno di non
dedicarci un paio d'anni consecutivi di noia e fatica.
Il punto è : una IA specializzata nell'analisi del testo,
può già comprendere le associazioni parte <=> personaggio ?
Una parte, esigua del lavoro l'ho fatta con la
FORMATTAZIONE. Il parlato è sempre tra virgolette inglesi
doppie, in corsivo, il pensato sempre tra apici singoli
inversi, ancora in corsivo .... poi ci sono il telepatico in
grassetto corsivo non delimitato ed il parlato "divino" o
gattese o di altre entità salienti in ALL-UPPERCASE. In
altre parole è abbastanza uniformememnte riconoscibile il
testo che NON DEVE venire assegnato a nessuna voce specifica
(e quindi lasciato alla voce narrante *) : il testo privo di
qualsiasi formattazione.
Ma una IA saprebbe associare gli interventi ai personaggi ?
Che sono sovente indicati con una pletora di alias per
evitare ripetizioni ?
Riuscirebbe a TAGGARE le parti per assegnarle agli strumenti ?
Qualcuno ha idee di come si potrebbe affrontare, in modo non
manuale, questo problema ?
A voi piacciono gli audiolibri "piatti" ad una sola voce ? O
vi fanno caghare come a me ?
Lancio la pietra nello stagno !
--
1) Resistere, resistere, resistere.
2) Se tutti pagano le tas