Radikale Lautverschiebung
Das Bairische weicht vokalisch extrem vom Standard ab (z.B. "oa" statt "ei"). Die KI ordnet dem akustischen Signal daher in Panik ähnlich klingende Hochdeutsch-Silben zu – was oft völlig ihren Zweck verfehlt.
Wenn Dialekt KI versucht, Bairisch zu verstehen, resultiert dies oft in skurrilem Kauderwelsch. Woran das liegt und wie Forschungs-Initiativen aus Bayern das ändern wollen.
Journalisten nutzen immer öfter Transkriptions-KIs, um Interviews aufzuzeichnen. Doch sobald Menschen im tiefsten bairischen Dialekt kommunizieren, kapitulieren Standardprogramme kläglich. Ein Forschungsprojekt des Bayerischen Rundfunks (BR) und der LMU München hat dies eindrucksvoll dokumentiert.
Spricht ein Bayerisch Sprechender ganz unbefangen, erzeugt die Dialekt KI teils absurde Haluzinationen. Wo im Original vielleicht über Landwirtschaft oder Tradition geredet wird, liefert die KI laut Forschern plötzlich Wortschöpfungen wie "Rührscheiße", "Schwanzheit" oder Transkriptionen vom "Schnupfer-Xare".
Das Bairische weicht vokalisch extrem vom Standard ab (z.B. "oa" statt "ei"). Die KI ordnet dem akustischen Signal daher in Panik ähnlich klingende Hochdeutsch-Silben zu – was oft völlig ihren Zweck verfehlt.
Doppelte Verneinung ("Da is koa Mensch ned") und eigene Konjunktionen verwirren KI-Sprachmodelle, die auf strikte Duden-Regelwerke trainiert wurden.
Der reiche bairische Wortschatz (z.B. "Drahdiwaberl", "Oachkatzlschwoaf") ist in globalen Datensätzen der großen Tech-Konzerne de facto nicht existent.
Um zu verhindern, dass Dialekte in der digitalen Welt aussterben, braucht es massig Trainingsmaterial. Das erwähnte LMU/BR-Projekt, genauso wie der Dialektsammler, arbeiten daran, genau diese KI-tauglichen, regionalen Sprach-Korpora zu sammeln, damit in Zukunft auch der "Xare" ohne Fehler im Computer ankommt.
"Künstliche Intelligenz verändert unsere Sprache, denn sie nimmt nicht nur unser Vokabular auf, sondern fängt an, unsere Interaktionen zu steuern. Gerade beim Bairischen darf man das Feld nicht globalen Standardmodellen überlassen."
Egal ob Oberbayerisch, Niederbayerisch oder Oberpfälzisch – sprechen Sie mit und füttern Sie die faire Dialekt KI von morgen.
Dialekt hochladen