Drie jaar geleden was een synthetische stem onmiddellijk herkenbaar. Het mechanische ritme, de slecht gekalibreerde pauzes, de verkeerde intonatie. Dat was nuttige maar onvolmaakte technologie, en de luisteraar merkte het. Vandaag is dat onderscheid vrijwel verdwenen. AI-stemmen van de nieuwe generatie worden geproduceerd door modellen die zijn getraind op miljoenen uren menselijke spraak. Het resultaat is een synthese die prosodische nuances, natuurlijke pauzes en ritmevariaties beheert.
De Nederlandse stemmen van Everlit
Everlit biedt meerdere Nederlandse stemmen met mannelijke en vrouwelijke varianten, gekalibreerd voor verschillende leesstijlen. De journalistieke stemmen zijn geoptimaliseerd voor het lezen van nieuws: gedragen tempo, duidelijke articulatie, zonder uitgesproken regionaal accent. De verhalende stemmen hebben een langzamer en warmer tempo, geschikt voor langere content en reportages.
Het systeem verwerkt de bijzonderheden van het Nederlands correct: de scheidbare werkwoorden, samenstellingen en leenwoorden uit het Engels die frequent voorkomen in het hedendaagse journalistieke taalgebruik.
De 30 ondersteunde talen
- Premium niveau: Nederlands, Engels (Amerikaans en Brits), Spaans, Frans, Duits, Portugees, Italiaans
- Hoog niveau: Pools, Russisch, Japans, Koreaans, Mandarijn, Arabisch
- Standaardniveau: Scandinavische talen, Oost-Europese talen, Aziatische talen
- In ontwikkeling: dialecten en regionale varianten
Stemkloning: wat het is en hoe het werkt
Stemkloning is de technologie waarmee u een AI-stem kunt maken die klinkt als een specifiek persoon. Het startpunt is een audio-opname van die persoon: minimaal 30 minuten schone spraak voor een basisstem, tot meerdere uren voor een hifigetrouwe replica.
Het model analyseert de unieke kenmerken van die stem: de fundamentele frequentie, de manier waarop medeklinkers verbinden met klinkers, ademhalingsgewoonten, persoonlijk ritme. Het resultaat is een AI-stem die spreekt zoals die specifieke persoon, niet als een generieke stem.
We hebben de stem van onze hoofdredacteur gekloond. Hij "leest" nu de opiniestukken, ook als ze zijn geschreven door andere collega's. De lezers voelen de continuïteit. Het is de klankhandtekening van de krant geworden.
De Nederlandse markt en de audiomogelijkheid
Nederland heeft een van de hoogste podcastpenetratiegraden in Europa. Zo'n 40 procent van de Nederlanders luistert maandelijks naar ten minste één podcast, en onder de 25 tot 44 jaar loopt dat percentage op tot ruim 55 procent. Nederlandse uitgevers die audiocontent aanbieden, sluiten aan bij een publiek dat al klaar is voor dat formaat.
De Vlaamse markt in België, met bijna 7 miljoen Nederlandssprekenden, biedt extra bereik voor uitgevers die content in het Nederlands produceren. Een podcast die zowel Nederlandse als Vlaamse luisteraars aanspreekt, heeft een potentieel publiek van ruim 22 miljoen mensen.
Technische audiokwaliteit
Naast de natuurlijkheid van de stem telt de technische audiokwaliteit. Everlit genereert bestanden in MP3-formaat met 128 kbps voor standaarddistributie en WAV met 44,1 kHz voor professionele kwaliteitseisen. Volumestandaardisatie is automatisch: alle afleveringen hebben hetzelfde loudnessniveau, een consistentie die luisteraars waarderen.