Siirry sisältöön

Avoin Avustaja vastaa suomenkielisen kielimallin kysyntään

Jenna Saarni / 4.3.2025

TurkuNLP-kieliteknologiaryhmä Turun yliopistosta on avannut Avoin Avustaja -verkkoalustan, jonka avulla kuka tahansa voi osallistua suomenkielisen keskustelevan kielimallin kehittämiseen.

Avoin Avustaja

Suuret kielimallit tulivat koko kansan tietoisuuteen viimeistään yhdysvaltalaisen OpenAI-yhtiön kehittämän ChatGPT:n myötä. ChatGPT:tä hyödynnetään laajasti esimerkiksi työnteon ja opiskelun tukena, mutta myös vapaa-ajan pulmien ratkaisemiseen.

Kielimallit ja niiden koulutus

Suuret neuroverkkopohjaiset kielimallit laskevat tilastollisia todennäköisyyksiä sanojen esiintymiselle. Todennäköisyydet ne laskevat ihmisen tuottamista tekstiaineistoista eli koulutusdatasta. Usein suuret kielimallit pohjautuvat englannin kieleen. Esimerkiksi ChatGPT osaa tuottaa suomen kieltä, mutta usein joukosta voi havaita englannille tyypillisiä lauserakenteita. Tämän vuoksi kielimalleja tulisikin kouluttaa kokonaan suomenkielisillä tekstiaineistoilla, jotta käytössä olisi luonnollista suomea käyttävä malli.

Suuret kielimallit perustuvat usein myös suljettuun lähdekoodiin, minkä vuoksi mallien varsinainen kehitystyö ja toimintatavat jäävät käyttäjiltään piiloon.

Suomenkielinen kielimalli

Turun yliopiston teknillisessä ja humanistisessa tiedekunnassa toimii TurkuNLP-kieliteknologiaryhmä, jonka pitkän linjan tutkimustyö keskittyy muun muassa kieliteknologiaan, luonnollisen kielen käsittelyyn ja digitaaliseen kielentutkimukseen.

Ryhmä vastaakin nyt kokonaan suomenkielisen keskustelevan kielimallin kysyntään Avoin Avustaja -verkkoalustan avulla. Avoin Avustaja sisältää erilaisia tehtäviä, joista käyttäjä voi valita itselleen kiinnostavimmat. Alustalla voi esimerkiksi keksiä arkisia kysymys-vastauspareja tai arvioida muiden käyttäjien kirjoittamia tekstejä. Avoimen Avustajan käytöstä on pyritty tekemään mahdollisimman yksinkertaista: verkkoalustalle voi rekisteröityä kuka tahansa sähköpostin avulla eikä sen käyttö vaadi erityisiä teknisiä taitoja.

TurkuNLP:lle kielimallin avoimuus oli kaiken lähtökohta. Avoimen Avustajan ohjelmakoodi kuten alustalla tuotettu koulutusdata ovat kaikkien vapaassa käytössä avoimesta lähteestä. Tämä lisää työn läpinäkyvyyttä ja tuo aineistot laajemmin eri ihmisten käyttöön.

Avoimen Avustajan pääasiallinen tehtävä on suomenkielisen keskustelevan tekoälyn kehittäminen. Kehitystyöhön voi osallistua kuka tahansa.

Aiheeseen liittyvää:

Turun yliopisto: Kohti suomenkielistä keskustelevaa tekoälyä Avoin Avustaja -verkkoalustalla (21.12.2023)
Avoin Avustaja: avoin-avustaja.fi