Neuroverkot – kuten ne ymmärrän (osa 4)

Miten digitaalisuodin voi mukautua – olematta huono?

Mitä hyötyä digitaalisen filtterin mukautumisesta on? Eikö itse asiassa tämä tee, ainakin naiivisti ajateltuna, digitaalisuotimesta epäkonsistentin, jos ajattelee että sen tuottama “jälki” (tulosten jono) on riippuvainen siitä, mitä filtteri on siihen mennessä kohdannut? Voi olla että en vielä ymmärrä täysin konseptia.

Otetaan naiivi esimerkki tällaisesta ongelmallisesta sarjasta. Suotimen tehtävänä on jaotella koevastaukset 7 eri “looraan”, eli kategoriaan. Koevastaus on pala tekstiä, jonka neuroverkon algoritmi käy läpi. Pisteytys tulee ulos yhtenä kokonaislukuna, 4, 5, 6, 7, 8, 9, tai 10.

Suodin alkaa tutkia vastauksia. Vastauksia on yhteensä 1000 kpl, suurehkon lukion verran. Suodin käy ensin läpi vastauksen #1, ja antaa arvosanan numerona (kouluarvosana 4-10). Verkko päätyi ensimmäisen vastauksen kohdalla arvosanaan 8. Asiantuntija, oikea ihmisopettaja, kertoo verkolle oman palautteensa (arvosana 6), jolloin neuroverkkoa opetetaan. Verkko muokkaa omaa näkemystään “hieman” sinne suuntaan, minne luotettu asiantuntija on neuvonut oman arvosanansa perusteella.

Eli mitä todellisuudessa tapahtuu tässä on täysin aritmetiikkaa, matemaattista logiikkaa: ensin lasketaan erotus, 6 – 8 = -2. Verkon pitäisi hakeutua siis kohti numeroa 6. Nyt tapahtuu myös keskeinen neuroverkon suunnittelijan eli ohjelmoijan tekemä valinta; kuinka dramaattisesti (eli: millä suuruudella), ja miten verkon painoja muokataan, jotta verkon antama vastaus konvergoituisi kohti oikeaa vastausta.

Ongelmaksi näkisin sen, että alkupään automaattisesti annetut arvosanat ovat “volatiilimpia” eli heppoisimmin periaattein annettuja, kuin loppupäässä – koska digitaalisuodin on oppinut enemmän (laajemmin) loppupäässä, verrattuna sen alkupään tietoihin.

Ratkaisuja?

Verkkoa voidaan ensin treenata, eli opettaa sille riittävän laaja otos. Opetuksen aikaisia tuloksia ei vielä käytetä / näytetä, vaan niiden tarkoitus on pelkästään säätää verkko tuottamaan oikeita ratkaisuja, ja sellaisia jotka ovat keskenään linjassa. Tästä lisää vielä myöhemmin, kun pääsen konkreettisen koodin äärelle.

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s