Hrvatsko prepoznavanje govora
Najtočnija transkripcija i pretvaranje govora u tekst za hrvatski jezik
Napravili smo i uredili veliku bazu hrvatskog govora za naš Dataset i koristili ga za fino podešavanje Whispera kako bi postigli najbolje rezultate za prepoznavanje govora potrebne za naše glasovne AI asistente, ali i ponudili ga kao zaseban proizvod.
Zašto naša transkripcija i prepoznavanje govora?
Naši modeli su rezultat opsežnog istraživanja i razvoja, prilagođeni specifičnostima hrvatskog jezika i sa velikom bazom hrvatskog govora (Dataset).
Vrhunska Preciznost
Nakon 6 mjeseci stvaranja i uređivanja hrvatskog govornog Dataseta, razvili smo modele koji nadmašuju sva postojeća rješenja za hrvatski jezik, posebno za snimke pozivnih centara i telefonske razgovore.
Domaći Hosting
Svi podaci obrađuju se lokalno na našim sigurnim poslužiteljima u Hrvatskoj, osiguravajući potpunu usklađenost s GDPR-om i zaštitu privatnosti.
Skalabilnost
Naša infrastruktura automatski se prilagođava vašim potrebama, omogućujući obradu tisuća sati zvuka u stvarnom vremenu bez gubitka performansi.
Najniži WER
Najbolja stopa pogreške riječi za hrvatski na svim mjerilima
Optimizirano za CC
Posebno podešeno za telefonske snimke i CC okruženja
API pristup
Jednostavna integracija putem krajnjih točaka s API ključevima
Spremno za produkciju
Pokreće naše glasovne AI asistente u produkciji
Automatska transkripcija
Pretvorite govor u tekst automatski - idealno za transkripciju sastanaka, poziva i audio datoteka
API za prepoznavanje govora i transkripciju (Govor u tekst)
Iako naš javno dostupni model pokazuje vrhunske rezultate na javnim datasetovima, ti podaci često ne oslikavaju stvarne izazove s terena. Naš privatni model dodatno je fino podešen na opsežnom internom Datasetu (pozivni centri, telefonske snimke), gdje postiže značajno bolje rezultate od javnog modela, što je jasno vidljivo iz tablice na našim testnim setovima.
Kontaktirajte nas za API pristup i cijene za tvrtke.
Usporedba modela
Niže je bolje
Datasetovi označeni značkom Interni predstavljaju realna okruženja pozivnih centara, snimaka telefonskih poziva, snimljenog prirodnog govora...
SL99 Dataset
(sl99 test)| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 22.93 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 18.44 |
| SL Private Model | 11.53 |
SL31 Dataset
(sl31 test)| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 21.62 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 16.97 |
| SL Private Model | 8.81 |
Fleurs Dataset
(google/fleurs hr_hr test)| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 12.73 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 8.66 |
| SL Private Model | 9.93 |
Parla Dataset
(parla_867k test)| Model | WER (%) |
|---|---|
| openai/whisper-large-v3-turbo | 10.23 |
| SL Public Model(GoranS/whisper-large-v3-turbo-hr-parla) | 3.52 |
| SL Private Model | 4.59 |
Besplatni javni model
Objavili smo finetuniran model podešen na Datasetu Hrvatskog sabora (Parla), slobodno dostupan na Hugging Faceu.
Trebate transkripciju ili pretvaranje govora u tekst za vaš projekt?
Pristupite našem najsuvremenijem API-ju za prepoznavanje govora i automatsku transkripciju.

Vrhunska infrastruktura i performanse
Pokreće Omonia & Exoscale Zagreb
Naše AI usluge rade na enterprise infrastrukturi smještenoj u Zagrebu, uz podršku Omonia i A1 Hrvatska (Exoscale hr-zag-1). To osigurava ultra-nisku latenciju za glasovne aplikacije u stvarnom vremenu i potpunu suverenost podataka.
Ultra-niska latencija
<10ms odziv u Hrvatskoj putem Omonijinog optimiziranog BGP usmjeravanja.
Suverenost podataka
Svi podaci ostaju u Hrvatskoj. GDPR usklađena obrada na lokalnim poslužiteljima.
10Gbit+ Povezivost
Višestruke redundantne 10Gbit veze osiguravaju neprekidnu uslugu.
Tier 3 Pouzdanost
N+1 redundancija na napajanju i hlađenju za 99.99% dostupnost.
Stupite u kontakt
Tu smo da vam pomognemo transformirati način na koji se povezujete s vašim klijentima. Bilo da imate pitanja, trebate demo ili ste spremni započeti, naš tim je na samo poruku udaljen.