Integer posuere erat a ante venenatis dapibus

Cum sociis natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Maecenas sed diam eget risus varius blandit sit amet non magna.

Heading

Duis mollis, est non commodo luctus, nisi erat porttitor ligula, eget lacinia odio sem nec elit. Curabitur blandit tempus porttitor. Sed posuere consectetur est at lobortis.

  1. Opgave 1
  2. Opgave 2

Er SkoleGPT biased?


























Det lærer du

  • Udregne afstanden mellem to punkter i et koordinatsystem
  • Opsamle og sortere data i regneark
  • Kende nogle af de algoritmer, der bruges til anbefalinger: K-NN og A-NN
  • Forstå, hvordan sange, film og lignende kan modelleres i et koordinatsystem ud fra deres egenskaber

Del 1: Anbefalingsalgoritmer i hverdagen

Inden I går i gang med matematikken, skal I tale om de anbefalingsalgoritmer, I møder hver dag.

01 / 03

Diskuter i klassen

Hvor møder I anbefalingsalgoritmer i hverdagen?

Diskuter i klassen

Hvilke apps giver de bedste og de dårligste anbefalinger?

Diskuter i klassen

Hvorfor får man tit flere og flere anbefalinger, der ligner hinanden?

Del 2: Disney+ anbefaler

I skal nu prøve selv at være anbefalingsalgoritme. På arbejdsarket møder I to opdigtede børn, Lucca og Charlie. I ved, hvilken film de hver især har set sidst, og I skal foreslå fire film, de kunne have lyst til at se.

01 / 03

Opsamling i klassen

På hvilke punkter minder jeres filmforslag om den film, Lucca eller Charlie har set på forhånd?

Opsamling i klassen

Hvordan finder en streamingtjeneste ud af, hvad den skal anbefale?

Opsamling i klassen

Hvorfor får man nogle gange anbefalet noget, man ikke ville se?

Del 3: Mød forskeren

I skal nu undersøge to af de algoritmer, Rasmus Pagh og hans kollegaer arbejder med: K-NN og A-NN.

Del 4: K-NN algoritmen

K-NN står for “K-Nearest Neighbors”, de K nærmeste naboer. Algoritmen finder de punkter, der ligger tættest på det, du sidst har set, og foreslår dem som anbefalinger. Først skal I se en kort video, der forklarer hvordan K-NN virker.

  1. Video: Hvad betyder K-NN?
01 / 04

Øvelse: Anbefal med K-NN

Brug arbejdsarkene K-NN anbefalingsalgoritmen, del A og B. Vælg 10 film og bedøm dem på en skala fra 0 til 10 for både kærlighed og action. Indsæt filmene som punkter i koordinatsystemet.

Beregn afstandene

Vælg den film, du så sidst, og marker den tydeligt. Beregn afstanden fra jeres valgte punkt til hvert af de andre punkter. Find ud fra jeres udregninger de tre nærmeste punkter.

Vurder anbefalingen

Synes I, det nærmeste punkt er det bedste forslag? Ekstraopgave: Hvad er den største afstand, der kan være mellem to film i koordinatsystemet?

Opsamling i klassen

Hvordan var det at regne afstanden til alle punkter? Var der situationer, hvor det 2. eller 3. nærmeste punkt virkede som en bedre anbefaling end det, der lå tættest på? K-NN er grundig, men langsom: jo flere punkter, jo mere skal computeren regne.

Del 5: A-NN algoritmen

A-NN står for “Approximate Nearest Neighbors”, omtrentlige nærmeste naboer. Hvor K-NN beregner afstanden til alle punkter, så tager A-NN en genvej: den deler koordinatsystemet ind i felter og leder kun efter naboer i de felter, der er tæt på. Det går hurtigere, men er ikke altid lige så præcist.

  1. Video: Hvad betyder A-NN?
01 / 04

Øvelse: Anbefal med A-NN i GeoGebra

Åbn GeoGebra-filen med Spotify-data. Hver sang er allerede lagt ind som et punkt med happiness på x-aksen og danceability på y-aksen.

Vælg din sang

Vælg det musiknummer, du hørte sidst, og skift punktets farve til rødt. Hvis der er punkter i samme felt som jeres valgte nummer, så sæt et kryds i regnearket. Opdater 10 gange og sæt krydser i regnearket hver gang.

Find anbefalingen

Sortér sangene i regnearket, så dem der har været i samme felt flest gange ligger øverst. Anbefalingen er det punkt, som ligger i samme felt flest gange.

Snak i grupper

Hvilken sang valgte I? Er A-NN algoritmens anbefaling faktisk den sang, der ligger nærmest? Kunne nummer 2 eller 3 på listen være en lige så god anbefaling?

Del 6: Matematisk modellering

Det, I lige har gjort, er et eksempel på matematisk modellering. I tager noget fra virkeligheden, en sang eller en film, og oversætter det til matematik, et punkt i et koordinatsystem. Derefter bruger I matematik (afstandsberegning) til at finde et svar, og til sidst fortolker I, om svaret giver mening i virkeligheden.

  • Forsimpling: fra den komplekse virkelighed til en afgrænset problemstilling
  • Oversættelse: fra ord til matematik (sang eller film bliver til et punkt)
  • Matematisk problemløsning: selve afstandsberegningen
  • Fortolkning: hvad betyder svaret tilbage i virkeligheden?
  • Virkede det? er svaret godt nok, eller skal vi prøve igen?
01 / 01

Diskuter i klassen

Hvor i jeres arbejde med K-NN og A-NN passer de forskellige faser ind? Hvad gjorde I først, og hvor skiftede I mellem virkeligheden og matematikken?

Del 7: Opsamling og dilemmaer

Del 8: Perspektivering, hvad arbejder Rasmus Pagh med nu?

I har nu undersøgt to af de grundlæggende algoritmer, Rasmus Pagh og hans kollegaer arbejder med. Men forskningen står ikke stille.

Privacy og anbefalinger

Når en streamingtjeneste eller en musiktjeneste skal anbefale noget, har den brug for data om dig. Hvad har du set? Hvad har du hørt? Hvad har andre, der ligner dig, kunne lide? Men jo mere data tjenesten samler, jo mere ved den om dig som person, og det rejser nogle vigtige spørgsmål om privatliv. En af Rasmus Paghs forskningsinteresser er privacy, altså beskyttelse af personlige data, og hvordan man kan lave gode anbefalinger uden at indsamle for meget om den enkelte bruger.

Skal en anbefalingsalgoritme overraske?

De fleste algoritmer er bygget til at give dig mere af det, du allerede kender. Men når Spotify altid foreslår sange, der minder om dem, du har hørt, kan det være svært at opdage ny musik. Det samme gælder Netflix og YouTube. Forskere som Rasmus Pagh arbejder på, hvordan algoritmer kan blive bedre til både at ramme dine præferencer og samtidig give dig nye perspektiver. Det er et matematisk spørgsmål, men også et samfundsmæssigt et: hvad sker der, hvis vi kun præsenteres for det, vi allerede ved, vi kan lide?

Materialer til forløbet

Tak for denne gang.