Vili Huhta-Koivisto

Vili Huhta-Koivisto

Data-analyytikko

Uusi neuroverkkoihin pohjautuva koneoppimismalli ennakoi työkykyriskiä työterveyskäyntien potilasteksteistä. Etuna perinteisiin ratkaisuihin on, että mallin pystyy siirtämään helpommin uuteen ympäristöön ja hyödyntämään työterveyspalveluita tarjoavien tahojen välillä.  Sopeutumiskyky auttaa laskemaan kustannuksia ja tekemään koneoppimisesta saavutettavamman.

Työkyvyttömyydestä johtuva työpanoksen menetys sekä muut kustannukset ovat iso yhteiskunnallinen ongelma. Heikentyvä huoltosuhde aiheuttaa lisäpainetta työurien pidentämiselle, jossa työkyvyttömyyden ehkäisemisellä on ensiarvoisen tärkeä asema.

Nykyisten työkyvyttömyysriskin seulontamenetelmien ongelmiksi muodostuvat tarkkuus sekä niiden korkeat resurssivaatimukset. Kehitin diplomityössäni neuroverkkoihin pohjautuvan koneoppimismallin, jolla työkykyriskiä voidaan ennakoida työterveyskäyntien potilasteksteistä.

Työkyvyttömyyseläkkeiden määrät ovat pitkällä aikavälillä pienentyneet. Taustalla ovat elintason parantuminen sekä työn murros. Tämä on mahdollistanut vanhempien ikäpolvien paremman työssäjaksamisen. Kehitys on ollut päinvastaista nuorten osalta. Pätkätyöt ja epävarmuus ovat johtaneet tilanteeseen, jossa pienenevistä ikäluokista yhä suurempi joukko päätyy työkyvyttömäksi heti uran alkutaipaleella.

Nykyisin työkyvyttömyysriskiä pyritään tunnistamaan pääasiassa seulomalla potilaskäyntejä terveydenhoitoalan asiantuntijoiden toimesta. Lähestymistapana tämä on erittäin raskas, joten kustannusten pitämiseksi kohtuullisella tasolla seulonnan tarkistusväliä on kasvatettava. Lisäksi inhimilliset virheet ovat todennäköisiä, kun yksi henkilö joutuu käsittelemään satoja potilastietoja.

Koneoppiminen tarjoaa mahdollisuutta ennusteiden automatisointiin

Koneoppimisella luodut mallit kykenevät luokittelemaan potilaita riskin perusteella. Suurena haasteena on kuitenkin mallin luomisen kustannukset sekä vaadittavan koulutusaineiston puuttuminen. Lisäksi merkittävä osa informaatiosta on suomenkielisissä potilasteksteissä, joiden käsittely on ollut perinteisesti suuri haaste tietokoneille.

Viimeaikainen kehitys neuroverkkojen kyvyissä soveltaa jo opittua tietoa uusissa tilanteissa on mahdollistanut läpimurron luonnollisten tekstien käsittelyssä (NLP). Koneoppimismalli voidaan kouluttaa ensin yleisellä datalla ja sen jälkeen luotua mallia voidaan edelleen hienosäätää tarkoituksenmukaiseksi. Tekstin ymmärtämisen kontekstissa nämä kyvyt mahdollistavat kielimallin kouluttamisen verkosta löytyvällä yleisellä tekstiaineistolla ja mallin hienosäätämisen murto-osalla aikaisemmin tarvitusta datasta.

Luokittelun mahdollistamiseksi tarvitaan edelleen esimerkkejä, joista malli voi oppia halutun käyttäytymisen. Malli pystyy kuitenkin luomaan vastaavat ennusteet myös muista vastaavista teksteistä. Perinteisempi rakenteellisiin muuttujiin perustuva koneoppimismalli vaatii usein suurempaa uudelleenkouluttamista, muuttujien ollessa erilaisia datalähteestä riippuen. Tekstistä tehtävien ennusteiden etuna perinteisiin ratkaisuihin onkin siis, että mallin pystyy siirtämään helpommin uuteen ympäristöön.  Sopeutumiskyky auttaa laskemaan kustannuksia ja tekemään koneoppimisesta saavutettavamman.

Diplomityön aikana kehitetty tekstiennustemalli vastasi kyvyiltään perinteisempää koneoppimisratkaisua. Työkykyriskissä olevista henkilöistä kyettiin tunnistamaan 80 %. Tekstipohjainen oppija käytti ennusteissaan vain tekstiä, joten käytössä oleva informaatio oli huomattavasti vähäisempää kuin perinteisellä rakenteellisiin muuttujiin perustuvalla mallilla. Tämä ei kuitenkaan vaikuttanut merkittävästi erottelukykyyn, mikä osaltaan osoittaa menetelmän tehokkuuden.

Lisää aiheesta ja tuloksisista webinaaritallenteen puheenvuorossani Asiakastarpeista kohti konkretiaa – lopputöidemme oppeja

Tutustu myös: