Boyu Fan väittelee aiheesta Yhdistetty oppiminen heterogeenisissä järjestelmissä: esineiden internetistä perustusmalleihin

M.Eng. Boyu Fan väittelee perjantaina 5.6.2026 aiheesta Yhdistetty oppiminen heterogeenisissä järjestelmissä: esineiden internetistä perustusmalleihin. Väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osaston Systems and Media -ryhmässä tehtävää tutkimusta.

M.Eng. Boyu Fan puolustaa väitöskirjaansa “Federated Learning in Heterogeneous Systems: From Internet of Things to Foundation Models” perjantaina 5.6.2026 klo 12 Helsingin yliopiston Exactum-rakennuksen auditoriossa CK112 (Pietari Kalmin katu 5, pohjakerros). Vastaväittäjänä toimii professori Hamed Haddadi (Imperial College London, Iso-Britannia) ja kustoksena professori Pan Hui (Helsingin yliopisto). Väitöstilaisuus pidetään englanniksi.

Boyu Fanin väitöskirjatyö on osa Helsingin yliopiston tietojenkäsittelytieteen osastolla ja Systems and Media -ryhmässä tehtävää tutkimusta. Väitöskirjan ohjaajana on toiminut professori Pan Hui (Helsingin yliopisto).

Yhdistetty oppiminen heterogeenisissä järjestelmissä: esineiden internetistä perustusmalleihin

Yhdistetty oppiminen (Federated Learning, FL) on noussut reunatekoälyn (edge intelligence) kulmakiveksi. Se mahdollistaa tekoälymallien yksityisyyttä suojaavan ja yhteistoiminnallisen kouluttamisen hajautetuissa solmuissa paljastamatta arkaluonteista raakadataa. FL:n käytännön soveltamista todellisiin esineiden internetin (Internet of Things, IoT) ympäristöihin kuitenkin haittaa vakavasti heterogeenisuus, kuten laitteiden ominaisuuksien valtavat erot ja paikallisten datojen monimuotoisuus. Perinteiset FL-protokollat, jotka luottavat joustamattomaan synkronisaatioon ja "yksi koko sopii kaikille"-malliarkkitehtuureihin, eivät skaalaudu tehokkaasti erittäin dynaamisissa ympäristöissä. Tämä joustamattomuus johtaa vakaviin hidastelijailmiöihin (straggler effects), joissa järjestelmän suorituskykyä rajoittaa merkittävästi sen heikoin solmu, ja aiheuttaa usein mallin ajautumista (model drift) tilastollisen divergenssin vuoksi. Näiden seurauksena nykyisillä menetelmillä on vaikeuksia tasapainoilla koulutuksen tehokkuuden ja mallin tarkkuuden välillä erityisesti skaalattaessa resurssirajoitteisiin reunalaitteisiin.

Edellämainittujen haasteiden ratkaisemiseksi tämä väitöskirja esittelee johdonmukaisen sarjan heterogeenisuuden huomioivia menetelmiä, jotka etenevät tietoliikennekeskeisistä optimoinneista mallikeskeisiin mukautuksiin. Ensiksi käsittelemme IoT-verkkojen tietoliikennepullokauloja esittelemällä SAFI:n, puolisynkronisen protokollan, joka eristää hidastelijat viiveeseen perustuvan klusteroinnin ja hybridisynkronointimekanismin avulla. Toiseksi, siirtyessämme malliarkkitehtuurin tasolle, puramme perinteisen FL:n rakenteellisen joustamattomuuden FedTSA- ja FedMixer-viitekehysten avulla. Nämä viitekehykset mahdollistavat sen, että resurssirajoitteiset asiakkaat voivat kouluttaa omia alimallejaan, jotka ovat räätälöity niiden laitteistoresurssien ja ajallisten ominaispiirteiden mukaan. Ne hyödyntävät uudenlaisia generatiivisia protokollia ja keskinäisiä tiedon tislausta (Knowledge Distillation, KD) mallien eri dimensioiden tukemiseksi. Lopuksi esittelemme HeLoRA:n, joka ratkaisee yleisten tekoälymallien (Foundation Models, FMs) hyödyntämiseen resurssirajoitteisilla laitteilla liittyvät ainutlaatuiset rajoitteet. Tämä viitekehys keskittyy parametritehokkaan hienosäädön (PEFT) heterogeenisuusongelmiin ja ratkaisee erilaisten LoRA-sovittimien dimensioepäsuhdan kontekstitietoisen kohdistuksen ja konsensuspohjaisen tiedon tislauksen avulla.

Tämän tutkimuksen uutuusarvo on FL:n järjestelmällisen kehityksen ohjaamisessa: siirtymisessä tehokkaista synkronointiprotokollista rakenteesta riippumattomaan tiedon fuusioon (knowledge fusion). Mahdollistamalla tiedonsiirron avulla kohdistetun arkkitehtuurillisen monimuotoisuuden osoitamme, että järjestelmän tehokkuus ja mallin tarkkuus eivät sulje toisiaan pois, vaan niitä voidaan optimoida rinnakkain. Tämä työ edistää tehokkaasti edistyneen tekoälyn saavutettavuutta (democratization), jolloin sekä pienitehoiset anturit että tehokkaat reunapalvelimetkin voivat tehdä saumatonta yhteistyötä. Lopuksi ehdotetut heterogeenisuuden huomioivat viitekehykset mahdollistavat osallistavamman, tehokkaamman ja skaalautuvamman ekosysteemin kaikille läsnäolevalle reunaälylle, joka pystyvät tukemaan seuraavan sukupolven yksilöityjä ja yksityisyyttä suojaavia tekoälysovelluksia.

Väi­tös­kir­jan saa­ta­vuus

Väitöskirjan elektroninen versio tulee olemaan saatavilla Helsingin yliopiston avoimessa julkaisuarkistossa Heldassa osoitteessa .

Painettuja väitöskirjoja voi tiedustella väittelijältä itseltään: .