Slik kommer KI frem til svarene sine

Språkmodeller trenes på store mengder tekstdata fra internett, inkludert bøker, artikler, nettsider og andre tekstkilder.

Treningen involverer følgende trinn:

Datasamling: Store datasett med tekst samles inn fra ulike kilder.
Forbehandling: Tekstdataene renses og forberedes for trening. Dette kan inkludere fjerning av spesialtegn, normalisering av tekst, og segmentering av tekst i mindre deler.
Trening: Modellen trenes ved å forsøke å forutsi det neste ordet i en setning, gitt de foregående ordene. Dette skjer gjennom en prosess kalt "selvtilsyn", der modellen lærer mønstre og strukturer i språket.

Når du stiller et spørsmål, skjer følgende:

Oppdeling: Spørsmålet deles opp i mindre biter, vanligvis ord eller deler av ord. Flere slike biter kalles en sekvens.
Kontekst: Modellen har lært seg selv opp til å forstå konteksten av instruksjonen.
Forutsigelse: Modellen beregner den neste delen i sekvensen basert på konteksten den har lært. Dette gjentas til et fullstendig svar er generert.
Fra kode til tekst: Tekstbiten oversettes fra kode til menneskelig lesbar tekst.

Teksten er skrevet delvis ved hjelp av Agder KI.