Nykyään ja tulevaisuudessa
Tekoäly on jo olennainen osa monia sovelluksia. Tutkijat ja kehittäjät pyrkivät ahkerasti luomaan parempia tapoja hyödyntää perusmalleja entistä tehokkaammin.
Onko tekoäly (AI) kaukaisen tulevaisuuden teknologia? Vastaus on ”kyllä” ja ”ei”. Ei, koska tekoälysovellukset ovat jo pitkään olleet osa arkielämäämme. Sellaisia ovat esimerkiksi kasvojentunnistus, jota monet käyttävät älypuhelimiensa lukituksen avaamiseen, ja käännöspalvelut, jotka muuntavat nykyään lauseita ja jopa kokonaisia asiakirjoja useille muille kielille todella taitavasti muutamassa sekunnissa. Lisäksi ChatGPT:n ja Copilotin kaltaiset chatbot-järjestelmät tarjoavat nykypäivän koululaisille ja opiskelijoille aivan uuden tavan laatia kirjoitelmia.
Nämä kolme IT-sovellusesimerkkiä eivät perustu perinteiseen ehtolauseohjelmointiin. Sen sijaan ne käyttävät valtavia määriä koulutustietoa, edistyneitä oppimismenetelmiä, kuten valvottua tai vahvistettua oppimista, ja algoritmeja, jotka hyödyntävät usein erittäin monimutkaisia neuroverkkoja. Tekoälyalgoritmi ei koskaan tuota tulokseksi ”0” tai ”1”. Sen sijaan tekoäly laatii aina todennäköisyyden sille, että matemaattisesti laskettu ennuste on oikein, eikä todennäköisyys koskaan ole 100 prosenttia. Tekoälyn esittämät väitteet ovat aina vähintäänkin hieman virheellisiä. Juuri tämä ominaisuus edellyttää tulosten tarkastelua, mutta se ei millään tavalla heikennä teknologian valtavaa potentiaalia. Tekoäly onkin ainoa tapa laskea käytännölliset ratkaisut mutkikkaimmille yhdistelmille. Tekoälysovellus on kuin älykäs kollega, jolla on paljon tietoa mutta joka joskus erehtyy.
Tekoäly on saapunut myös logistiikkaan. Yli kuusi vuotta sitten Fraunhofer IML:n DACHSER Enterprise Lab -tiimi aloitti algoritmien kehittämisen DACHSERin kappaletavaraverkoston tonnimäärien ennustamiseksi 25 viikkoa etukäteen. He kehittivät myös kuvantunnistusratkaisun pakettien reaaliaikaiseen tunnistamiseen, paikantamiseen ja mittaamiseen kappaletavaravarastoissa. DACHSERin tekoälyn toteutusstrategian kulmakivenä on jo vuosien ajan ollut logistiikka- ja prosessiasiantuntijoiden yhteistyö matemaatikkojen ja ohjelmistokehittäjien kanssa.
Uusia odottamattomia mahdollisuuksia
Tekoälyä voidaan pitää myös tulevaisuuden teknologiana. Uudet mallit avaavat yhä odottamattomia mahdollisuuksia. Alan eturintamaan kuuluvissa generatiivisen tekoälyn perusmalleissa käytetään edistyneitä algoritmeja, jotka on koulutettu internetistä kerättyjen tietomassojen avulla tekstien ja kuvien ymmärtämiseen ja luomiseen. Erityisesti ChatGPT ja muut suuret kielimallit (LLM) antavat vaikutelman ”älykkyydestä”. Tämä perustuu kuitenkin vain matemaattiseen funktioon, joka ennustaa johdonmukaisen sanajärjestyksen.
Tekoälyn perusmallit: tekoälyn (AI) alalla perusmalli on suuri, esikoulutettu valtaviin tietojoukkoihin perustuva malli, joka on yhteensopiva monien sovellusten kanssa. Perusmalleja on monenlaisia, mukaan lukien suuret kielimallit (LLM) ja visuaaliset käsittelymallit. LLM:t, kuten OpenAI:n GPT-4, Gemini (aiemmin ”Bard”), Googlen Bert ja Metan Llama3, ovat erikoistuneet luonnollisen kielen ymmärtämiseen ja luomiseen. Visuaaliset mallit, kuten OpenAI:n Sora ja DALL-E, on suunniteltu luomaan videoita ja kuvia vapaamuotoisen tekstinsyötön (kehotteiden) perusteella. Kuten nimestä voi päätellä, perusmallit toimivat usein perustana erikoissovelluksille, joita varten ne on mukautettu sisältämään tiettyjä tehtäviä tai tietojoukkoja.
Näiden mallien tulokset ovat vaikuttavia, ja ne tarjoavat paljon mahdollisuuksia. Esimerkiksi robotiikassa asiantuntijat kokeilevat perusmalleja keinona kommunikoida autonomisten ajoneuvojen kanssa ja ohjata niitä. Tämä parantaisi robotin kykyä suorittaa monimutkaisia tehtäviä, kuten luonnollisen kielen käsittelyä, kuvan ja kohteen tunnistusta ja itsenäistä navigointia. Näiden mallien avulla robotit voivat oppia valtavasta tietomäärästä ja mukautua uusiin ympäristöihin ja tehtäviin. Tämän myötä ne tarjoavat entistä enemmän joustavuutta ja laajemman sovellusvalikoiman. Ennen pitkää näemme, voidaanko varastoissa käytettäviä autonomisia ajoneuvoja ohjata entistä intuitiivisemmin ja tehokkaammin. Asiasta tehdään intensiivistä tutkimusta kaikkialla maailmassa.
RAG: parempi perusta tekoälyavusteiselle tutkimukselle
Monet tekoälyn kehitysaskeleet keskittyvät ”noutamalla laajennettuun tuottamiseen” (RAG), jonka luvataan parantavan suurten perusmallien tuottamien tulosten laatua. Periaatteessa RAG toimittaa suuriin kielimalleihin laadukkaampia tietoja ja tietolähteitä tiettyä käyttötapausta varten. Tämä estää kielimallia tuottamasta tuloksia, jos se ei pysty keksimään ratkaisua, joka on hyvin todennäköisesti oikea. Tällaista LLM-työkalujen epäsopivaa toimintaa kutsutaan ”hallusinaatioksi”, ja se voi usein nakertaa käyttäjien luottamusta tekoälyyn.
Tekoälyn lisätutkimus tuottaa aivan uudenlaisia käyttömahdollisuuksia. DACHSERin kaltaisten yritysten on löydettävä oikea yhdistelmä standardoitujen tekoälysovellusten käytön ja yrityksen sisäisten kehitysaskeleiden välillä. Tekoälymallit on koulutettava yrityksen sisäisillä tiedoilla erityisesti logistiikan erikoisprosesseja ja -ratkaisuja varten. Internetissä saatavilla olevat yleiset tiedot eivät riitä koulutuspohjaksi. Samalla on otettava huomioon erityisesti huomattavaa laskentatehoa vaativien tekoälymallien kustannukset sekä EU:n uuden tekoälysovellusten oikeudellisen kehyksen noudattaminen tekoälysäädöksen mukaisesti. Sekä ala että yhteiskunta alkavat vasta kaivautua syvemmälle tekoälyn käyttöön – matkalle, joka asettaa varmasti kosolti haasteita.
Kirjoittaja: Andre Kranke, DACHSERin tutkimus- ja kehitysjohtaja