OpenAI sin GPT o1 Preview

«o1 is still flawed, still limited, and it still seem more impressive on first use than it does after you spend more time with it.» 
– Sam Altman, 2024 (1)

«It’s not AGI, or even close
– Professor Gary Marcus, 2024 (2)

«Men det må ikke forveksles med at modellen kan tenke
– Professor Morten Goodwin, 2024 (3)

«The o1-preview model still hallucinates non-existing libraries and functions for me, and is quickly wrong about facts that aren’t well-represented on the web. It’s the usual string of «You’re absolutely correct, and I apologize for the oversight in my previous response. [Let me make another guess.]. While the reasoning may have been improved, this doesn’t solve the problem of the model having no way to assess if what it conjures up from its weights is factual or not
– layer8, 2024 (4)

«The o1 model doesn’t “reason,” at least not in the “human” sense of the word. The model still doesn’t know what it’s saying
– Javier Pastor, 2024 (5)

Innledning

I løpet av høsten 2024 kom nyheten om at OpenAI hadde videreutviklet ChatGPT-konseptet til et verktøy som er enda kraftigere og som foretar noe som kan betegnes som resonering. Verktøyet blir kalt o1 (tidligere kalt Strawberry).

OpenAI selv beskriver verktøyet som nyttig dersom «…you’re tackling complex problems in science, coding, math, and similar fields. For example, o1 can be used by healthcare researchers to annotate cell sequencing data, by physicists to generate complicated mathematical formulas needed for quantum optics, and by developers in all fields to build and execute multi-step workflows».

I nettartikkelen «Vi introduserer OpenAI o1: Et sprang i AIs resonneringsevner for avansert problemløsning» presenteres verktøyet blant annet slik:

«OpenAI’s ny modell, ÅpenAI o1 eller Strawberry, representerer et betydelig fremskritt innen Kunstig intelligens. Den bygger på arven fra tidligere modeller, slik som OpenAIs GPT-serie, og introduserer forbedrede resonneringsevner som utdyper problemløsning på tvers av ulike felt, som vitenskap, koding og matematikk. I motsetning til forgjengerne, som først og fremst utmerket seg med å behandle og generere tekst, kan o1-modellen undersøke komplekse utfordringer dypere

Videre beskrives det at «OpenAI o1-modellen skiller seg ut fordi dens avanserte design forbedrer evnen til å håndtere komplekse problemer innen naturfag, matematikk og koding betydelig. Bygget på utviklingen gjort av tidligere AI-gjennombrudd, bruker o1-modellen en blanding av forsterkning læring og en metode kalt tankekjede behandling. Denne tilnærmingen lar den tenke gjennom problemer trinn for trinn, omtrent som mennesker gjør, noe som gjør den bedre til å takle komplekse resonneringsoppgaver

Det er verdt å merke seg at det er «naturfag», «matematikk» og «koding» som fremheves som områder for dette verktøyet. Jeg jobber innen det samfunnsfaglige, men dersom verktøyet virkelig evner å «tenke gjennom problemer trinn for trinn, omtrent som mennesker gjør,…» burde det kunne klare å levere akademiske besvarelser på arbeidskrav i mine fagemner. Eller…?

Jeg testet GPT O1 Preview først på AK1 i fagemnet ORG5005 – Digital beredskap (et fagemne tilhørende MASIK), deretter på første del av AK2 i fagemnet IKT1023 – Spillbasert læring (IKT og læring 2).

Videre testet jeg dets evne til å skrive en stil om Kjell Hallbing og Lasse Efskinds bok «Soldatens lille røde bok», og jeg ba om svar på hvor mange som har etternavnet Godejord i Norge.

Til slutt testet jeg verktøyet på «båtproblemet».

o1 ble testet via Yuntian Dengs nettside «OpenAI-O1-Preview: Research Preview», tirsdag 17.09 2024. Denne nettsiden ble funnet via «How to Try and Use All OpenAI Models Including o1-preview and o1-mini for Free».

Å bruke denne type «testside» kan være en klar svakhet ved dette forsøket, siden jeg ikke kan sjekke at denne «appen» oppfører seg nøyaktig som den ordinære GPT O1.

Test av verktøyet på AK1 i ORG5005

Akkurat som ved tester utført på ChatGPT, beskrevet i kapittel 6 – «Når oppgavene blir lange…», ble verktøyet bedt om å skrive en akademisk besvarelse og hele oppgaveteksten for AK1 i ORG5005 ble lagt inn.

Resultatet ble som følger:

SVAR FRA o1 START

Arbeidskrav 1 – Øvingsdirektiv for Altiby Brannvesen

Studentens navn: Ola Nordmann

Innledning

Denne besvarelsen omhandler utarbeidelsen av et øvingsdirektiv for Altiby Brannvesen, med fokus på håndtering av hybride angrep og bortfall av digital infrastruktur. Øvelsen er designet for å styrke beredskapen og bevisstheten rundt utfordringene som kan oppstå når digitale systemer svikter under en krisesituasjon.

Øvingsdirektiv

1. Innledning

Altiby Brannvesen står overfor stadig mer komplekse trusler, inkludert hybride angrep som kombinerer fysiske og digitale elementer. For å sikre effektiv oppdragsløsning under slike forhold, skal det gjennomføres en øvelse som simulerer et omfattende strømbrudd kombinert med cyberangrep mot kritisk infrastruktur.

2. Hensikt

Øvelsens hensikt er å forbedre Altiby Brannvesens evne til å håndtere krisesituasjoner hvor digital infrastruktur er utilgjengelig eller kompromittert, og å øke bevisstheten rundt avhengigheten av digitale systemer.

3. Målsettinger

– Overordnet mål: Styrke beredskapen ved å øve på oppdragsløsning uten tilgang til digitale systemer.

– Delmål:
– Identifisere sårbarheter i dagens rutiner ved bortfall av digital infrastruktur.
– Teste alternative kommunikasjons- og ledelsessystemer.
– Evaluere beslutningsprosesser under begrenset situasjonsforståelse.

4. Scenario

4.1 Scenariobeskrivelse

En kraftig storm treffer Altiby, noe som fører til omfattende strømbrudd og ødeleggelser. Samtidig blir byens nettverk utsatt for et koordinert cyberangrep som lammer kommunikasjon og tilgang til digitale ressurser. Brannvesenet må håndtere flere pågående branner og redningsoppdrag uten vanlig tilgang til digitale verktøy.

4.2 Momenter i scenarioet

– Strømbrudd i store deler av byen.
– Telekommunikasjon er ustabil eller utilgjengelig.
– Nødnett fungerer kun sporadisk.
– Digitale kart og ressursoversikter er utilgjengelige.
– Meldinger om branner og ulykker kommer inn via analoge kanaler.

5. Planleggingsorganisasjon og prosess

5.1 Organisering

– Øvingsleder: Beredskapssjef i Altiby Brannvesen.
– Planleggingsgruppe: Representanter fra operativ avdeling, kommunikasjon, IT og støttefunksjoner.
– Observatører: Innleid ekstern konsulent og representanter fra nabokommunens brannvesen.

5.2 Planleggingsprosess

– Fase 1: Definere mål og omfang (uke 1-2).
– Fase 2: Utarbeide detaljert øvingsplan (uke 3-4).
– Fase 3: Gjennomføre øvelsen (uke 5).
– Fase 4: Evaluering og rapportering (uke 6).

6. Milepæler og frister

– Møte i planleggingsgruppen: Uke 1, mandag kl. 10:00.
– Ferdigstillelse av øvingsplan: Uke 4, fredag kl. 15:00.
– Gjennomføring av øvelsen: Uke 5, onsdag kl. 08:00 – 16:00.
– Evaluering og debrief: Uke 5, torsdag kl. 09:00.
– Endelig rapport: Uke 6, fredag kl. 12:00.

7. Rapportering

– Løpende rapportering til øvingsleder ved milepæler.
– Sluttrapport som inkluderer funn, anbefalinger og handlingsplan.

Kommentarnotat

1. Begrunnelse for valg av scenario

Valget av et scenario med strømbrudd og cyberangrep er basert på økende trender i hybride trusler mot kritisk infrastruktur (Jøsok, 2020). Ved å simulere bortfall av både fysiske og digitale systemer, settes brannvesenet på prøve i en realistisk og utfordrende situasjon.

2. Faglige referanser og justeringer

– Avhengighet av digitale systemer: Moderne brannvesen er sterkt avhengige av digitale verktøy for kommunikasjon, navigasjon og ressursstyring (Smith & Brown, 2019). Ved å fjerne disse, tvinges mannskapet til å benytte alternative metoder.

– Kommunikasjon under krise: Effektiv kommunikasjon er kritisk. Øvelsen tester bruk av analoge kommunikasjonsmidler, som er anbefalt i krisesituasjoner med teknologisvikt (Nasjonal kommunikasjonsmyndighet, 2018).

– Beslutningstaking under usikkerhet: Uten digitale situasjonsbilder må ledere ta beslutninger basert på begrenset informasjon, noe som krever trygghet og erfaring (Klein, 2008).

3. Valg av mål og delmål

Målene er satt for å dekke både operative og organisatoriske aspekter ved krisehåndtering uten digitale hjelpemidler. Fokus på sårbarhetsidentifisering legger grunnlag for forbedringstiltak.

4. Refleksjonsnotat

Arbeidet med dette øvingsdirektivet har gitt meg innsikt i hvor sårbar egen organisasjon er ved bortfall av digital infrastruktur. Planleggingsprosessen har bevisstgjort meg på viktigheten av redundante systemer og behovet for jevnlig trening på analoge metoder. Jeg har også erfart hvor komplekst det er å designe en øvelse som både er realistisk og oppnåelig innenfor organisatoriske rammer.


SVAR FRA o1 SLUTT

Kommentarer fra meg

  1. Som en første grov skisse er øvingsdirektivet ikke dumt, men det er langt unna et fullverdig direktiv.
  2. Kommentarnotatet er ikke i nærheten av kravene stilt i oppgaven og
  3. refleksjonsnotatet er ikke en gang brukbar som skisse.

En student med skrivesperre kan ta utgangspunkt i dette for videre arbeid, men her har vi nok et godt eksempel på at samtaleroboter, uansett hvor «avansert» de påståes å være, ikke kan erstatte studentens eget tankearbeid og arbeid med relevant fagstoff.

I ORG5005 (som for IKT og læring 1 og 2) er det å vise evne til på egenhånd å finne relevant litteratur som kan støtte opp under faglige refleksjoner helt vesentlig. La oss se på verktøyets forslag til litteraturliste:

Litteraturliste

– Jøsok, Ø. (2020). Hybride trusler mot kritisk infrastruktur. Norsk Sikkerhetsforlag.

[Det finnes en Øyvind Jøsok som har skrevet om informasjonssikkerhet, men denne boken får ingen treff ved søk i Google eller Google Scholar. «Norsk sikkerhetsforlag» virker ikke å eksistere.]


– Klein, G. (2008). Naturalistic Decision Making. Lawrence Erlbaum Associates.

[Første treff ved søk på Google viser at Gary Klein har, sammen med Caroline E. Zsambok, vært redaktør for boken «Naturalistic decision making». Men den kom i 1997. Forlaget er korrekt.
Videre søk viser at Gary Klein er forfatter av en artikkel «Naturalistic decision making», publisert i juni 2008 i «Human Factors – The Journal of the Human Factors and Ergonomics Society».
Så her vi ser nok et klassisk eksempel på at de statistiske beregningene setter sammen enkeltvis korrekt informasjon til noe som samlet sett blir feil.]


– Nasjonal kommunikasjonsmyndighet. (2018). Kommunikasjon i krisesituasjoner. NKOM Rapport.

[Denne rapporten virker ikke å eksistere, i alle fall ikke med dette navnet. Rapporter fra NKOM er tilgjengelig via NKOMs «Rapporter og dokumenter». Det nærmeste jeg kunne finne var rapporten «EkomROS 2018 – Risikovurdering av ekomsektoren».]


– Smith, A., & Brown, B. (2019). Digital Dependency in Emergency Services. Journal of Emergency Management, 17(4), 223-230.

[Verken forfatterne eller artikkelen er mulig å finne ved ordinære Google søk eller ved søk i Google Scholar. Søk etter tidsskriftet gir resultat på den aktuelle utgaven, men her finnes ingen spor etter en artikkel med det navnet som oppgis av verktøyet.]

Konklusjon

Det er mulig media vil kalle resultatet gjengitt over for å «resonere», men noe mer «intelligent» og «tenkende» enn ChatGPT 4. og lignende samtaleroboter er det absolutt ikke.

Digital Norway beskriver i nettartikkelen «OpenAI sin nye språkmodell kan «resonnere» ved hjelp av en indre monolog» at «Selv sier OpenAI at modellen er i stand til å «resonnere». Dette handler om at språkmodellen kan løse problemer ved å emulere en form for logikk, i stedet for å gjenkjenne mønstre og regne seg frem til statistisk sett gode svar.»

Resultatet fra denne testen viser absolutt ingen form for emulering av «logikk». Tvert i mot er det tydelig at verktøyet benytter seg av statistiske beregninger av hvordan bokstaver kan settes sammen til noe som tilsynelatende virker å være et fullverdig svar.

Som skisseverktøy for å komme i gang kan det nok være nyttig, men antakelig vil andre versjoner av ChatGPT eller Microsoft CoPilot være like – eller mer – nyttig. Å stole på verktøyets evne til å finne frem til relevant faglitteratur er totalt bortkastet, og en student som legger ved overforstående litteraturliste vil være heldig om vedkommende slipper unna med laveste karakter.

«Besvarelsen» som sådan står til en solid F.

GPT O1 prøver seg på AK2 i IKT1023

I dette arbeidskravet skal studentene utvikle et spill i Kodu, og siden denne samtaleroboten skal være særlig velegnet for koding la jeg inn to «oppdrag» knyttet til første del av arbeidskrav 2 i dette fagemnet.

Del 1 av AK2 er formulert som følger:

Krav i oppgaven

1) Lag et enkelt spill i Kodu. Bestem et enkelt plott. Ta utgangspunkt i følgende krav:

  • Lag en øy
  • Lag minst én høyde/fjell
  • Bruk minst 2 forskjellige materialer (farger/mønster) på øya
  • Sett inn minst 2 stille objekter (f. eks et tre/eple/stein)
  • Sett inn minst 2 spillobjekter (f. eks. en kodu/blekksprut/rover)
  • La minst ett spillobjekt følge en sti
  • La det andre (minst ett spillobjekt)
    • få en oppgave (f. eks. skyte eller samle inn ting)
    • styres av piltastene på tastaturet
  • Lag en enkel instruks for spillerne der du forklarer hva målet er, hva som skal til for å vinne spillet, og hva som må til for å tape, samt hvordan man beveger Kodu. Instruksen skal komme frem ved oppstart av spillet. 

Kravene over er obligatoriske. Ta gjerne med flere krav i spillet ditt, men det er viktig at kravene spesifisert over er oppfylt som et minimum.

Som man ser av oppgaveteksten over er det opp til studenten selv hva denne vil at spillet skal handle om. Men for å teste GPT O1 sin evne til å resonere rundt en forespørsel, og ikke minst knyttet stricto sensu til koding, ba jeg den kort om å utforme et Kodu-spill med et klart oppdrag. Kravene stilt i oppgaveteksten gjengitt over, ble ikke lagt inn i oppdraget.

Les gjennom denne testen, last så ned Kodu og løs de to oppgavene til slutt i denne testgjennomgangen.

Oppdrag 1

Meg: Lag et Kodu-spill der spilleren må samle 10 epler for å vinne

GPT: Selvfølgelig! Her er en veiledning for hvordan du kan lage et Kodu-spill der spilleren må samle 10 epler for å vinne:

Trinn 1: Start et nytt spill

  1. Åpne Kodu Game Lab.
  2. Klikk på «New World» for å starte med en tom verden.


Trinn 2: Lag landskapet

  1. Bruk terrengverktøyene til å lage et enkelt landskap. Du kan gjøre det så stort eller lite som du ønsker.
  2. Legg til noen høyder, daler eller vann for variasjon.
  3. Dekorer med trær, steiner eller andre objekter for å gjøre verdenen mer interessant.


Trinn 3: Legg til spilleren (Kodu)

  1. Klikk på objektverktøyet (ikonet med en Kodu-figur).
  2. Klikk på bakken der du vil plassere spilleren.
  3. Velg «Kodu» fra objektlisten.


Trinn 4: Programmer spilleren til å bevege seg

  1. Høyreklikk på Kodu-figuren og velg «Program».
  2. Legg til følgende linjer i programmeringen:
    WHEN: [Keyboard] do [Move]

    (Hvis du bruker en kontroller, velg Gamepad i stedet for Keyboard.)


Trinn 5: Legg til epler i verdenen

  1. Bruk objektverktøyet igjen.
  2. Klikk på forskjellige steder i verdenen for å plassere eplene.
  3. Velg «Apple» fra objektlisten.
  4. Plasser totalt 10 epler spredt rundt i verdenen.


Trinn 6: Programmer Kodu til å samle epler

  1. Gå tilbake til Kodus programmering.
  2. Legg til følgende linje:
    WHEN: [Bump] Apple do [Eat]

    Dette gjør at Kodu «spiser» eller samler eplet når han berører det.


Trinn 7: Legg til en teller for eplene

  1. Fortsatt i Kodus programmering, legg til:
    WHEN: [Eat] Apple do [Score] +1


Trinn 8: Definer vinnerbetingelsen

  1. Legg til følgende linje i programmeringen:
    WHEN: [Score] >= 10 do [Game] –> [Win]

    Dette betyr at når spilleren har samlet 10 eller flere epler, vinner han spillet.


Trinn 9: Test spillet

  1. Klikk på «Play» for å starte spillet.
  2. Kontroller at Kodu kan bevege seg rundt og samle eplene.
  3. Sørg for at spillet avsluttes med en vinnermelding etter at du har samlet alle 10 eplene.


Trinn 10: Legg til ekstra funksjoner (valgfritt)

  1. Hindre: Legg til hindringer som steiner eller fiender for å gjøre spillet mer utfordrende.
  2. Lydeffekter: Legg til lyder når Kodu samler epler eller vinner spillet.
  3. Timer: Innfør en tidsbegrensning for å øke spenningen.
  4. Poengsystem: Gi forskjellige poeng for ulike objekter, eller trekk poeng for å treffe fiender.

Tips:

Husk å lagre spillet ditt ofte for å unngå å miste fremgang.
Eksperimenter med forskjellige objekter og programmeringskommandoer for å gjøre spillet unikt.


Lykke til med spillet ditt!

Oppdrag 2

Meg: Lag koden til et Kodu-spill der spilleren må samle 10 epler for å vinne

GPT: Selvfølgelig! Her er koden du trenger for å lage et Kodu-spill der spilleren må samle 10 epler for å vinne.


Steg 1: Plasser Kodu (spilleren) i verdenen

  • Bruk objektverktøyet til å plassere en Kodu-figur på bakken.

Steg 2: Programmer Kodu

Legg inn følgende programmeringsregler for Kodu:

  1. BEGYNN MED:
    • NÅR[Tastatur]Gjør[Flytt]
      • Dette gjør at Kodu kan bevege seg ved hjelp av tastaturet.
  2. DERETTER:
    • NÅR[Støter på][Eple]Gjør[Spis]
      • Dette gjør at Kodu «spiser» eplet når han kolliderer med det.
  3. OG SÅ:
    • NÅR[Spist][Eple]Gjør[Poengsum][Legg til]1
      • Dette øker poengsummen med 1 hver gang et eple spises.
  4. TIL SLUTT:
    • NÅR[Poengsum][Større enn eller lik]10Gjør[Spill][Vinn]
      • Når poengsummen når 10, vinner spilleren spillet.

Steg 3: Plasser epler i verdenen

  • Bruk objektverktøyet til å plassere 10 epler rundt omkring i verdenen.
  • Spre dem ut slik at spilleren må bevege seg for å samle dem.

Steg 4: Test spillet

  • Klikk på «Spill» for å teste spillet ditt.
  • Beveg Kodu rundt ved hjelp av tastaturet og samle alle 10 eplene.
  • Når alle eplene er samlet og poengsummen når 10, skal spillet vise en vinnermelding.

Detaljert veiledning for å legge inn koden:
  1. Åpne programmeringsvinduet for Kodu:
    • Høyreklikk på Kodu-figuren og velg «Program».
  2. Legg til Regel 1: Bevegelse
    • Linje 1:
      • NÅR: Klikk på «+» og velg «Tastatur».
      • GJØR: Klikk på «+» og velg «Flytt».
  3. Legg til Regel 2: Spise epler
    • Linje 2:
      • NÅR: Klikk på «+» og velg «Støter på», deretter «Eple».
      • GJØR: Klikk på «+» og velg «Spis».
  4. Legg til Regel 3: Oppdater poengsum
    • Linje 3:
      • NÅR: Klikk på «+» og velg «Spist», deretter «Eple».
      • GJØR: Klikk på «+», velg «Poengsum», deretter «Legg til», skriv inn 1.
  5. Legg til Regel 4: Vinn spillet
    • Linje 4:
      • NÅR: Klikk på «+», velg «Poengsum», deretter «≥», skriv inn 10.
      • GJØR: Klikk på «+», velg «Spill», deretter «Vinn».

Ekstra tips:
  • Tilpass bevegelse: Hvis du ønsker å bruke mus eller gamepad i stedet for tastatur, endrer du bare «Tastatur» til «Mus» eller «Gamepad» i Regel 1.
  • Flere utfordringer: Legg til hindringer eller fiender for å gjøre spillet mer spennende.
  • Lydeffekter: Du kan legge til lyder når Kodu spiser epler ved å legge til en «Spill lyd»-kommando under GJØR i Regel 2 eller 3.

Eksempel på Kodu-programmeringsregler:

LinjeNÅRGJØR
1TastaturFlytt
2Støter på EpleSpis
3Spist EplePoengsum Legg til 1
4Poengsum ≥ 10Spill Vinn

Lagre spillet ditt og ha det gøy med å spille og dele det med andre!

Mine kommentarer

I den første testen ber jeg GPT lage et spill, og svaret er en veiledning til å lage et spill. I den andre testen ber jeg om en kode, og GPT gjentar ordet kode i sitt svar, men resultatet er en veiledning. Tatt i betraktning hvordan man lager et spill i Kodu er ikke dette så rart. Men siden det påstås at GPT resonerer, hvorfor gir det ikke så beskjed om at en programkode ikke er mulig, men at den kan sette opp en detaljert veiledning for hvordan jeg kan laget et spill i Kodu?

oppgave

1. Bruk veiledningen gitt av GPT i Oppdrag 1 og lag dette spillet i Kodu
2. Bruk veiledningen gitt av GPT i Oppdrag 2 og lag dette spillet i Kodu
3. Hvordan fungerte disse to oppskriftene (veiledningene)?

Fortell om resultatene her. Du skal teste ut begge veiledningene gitt av GPT O1 og fylle inn begge tekstboksene i undersøkelsen.

Leseliste

  1. Kodu Makerspace – Learn to make your own games! (PDF)
  2. Kodu Workshop Manual (PDF)
  3. Skyscraper Panic! Creating a Game in an Hour with Kodu Game Lab

GPT 01 prøver seg på Kjell Hallbing

Jeg ba verktøyet skrive en stil om Kjell Hallbing og resultatet ble som følger:

SVAR FRA o1 START

Kjell Hallbing – Mannen bak Morgan Kane

Kjell Hallbing (1934–2004) var en norsk forfatter som oppnådde stor suksess og popularitet gjennom sine spenningsfylte westernromaner. Under pseudonymet Louis Masterson skrev han den berømte Morgan Kane-serien, som har solgt over 20 millioner eksemplarer verden over og blitt en viktig del av norsk populærkultur.

[Korrekt]

### Tidlige år og bakgrunn

Født den 5. november 1934 i Bærum vokste Kjell Hallbing opp i en tid preget av etterkrigstid og gjenoppbygging. Etter avsluttet skolegang tjenestegjorde han i militæret og hadde senere ulike jobber, blant annet innen salg og markedsføring. Hans interesse for historie, spesielt den amerikanske vesten, ble grunnlaget for hans senere forfatterskap.

—[Mye korrekt, men arbeidsbakgrunnen er noe tvilsom. Han jobbet så vidt jeg vet hele sitt liv i bank]

### Forfatterkarriere og Morgan Kane

I 1966 debuterte Hallbing som forfatter med romanen «El Gringo», [Feil. Han debuterte i 1961 med boken «Ubåt-kontakt»] som introduserte leserne for antihelten Morgan Kane [Feil. Første bok i Morgan Kane-serien var «Drep for loven» som kom ut i 1965], en kompleks og hardbarket Texas Ranger med en mørk fortid. Karakteren Morgan Kane skilte seg ut fra tradisjonelle westernhelter ved å være mer realistisk og menneskelig, noe som appellerte til et bredt publikum.

Gjennom sin karriere skrev Hallbing over 80 bøker om Morgan Kane [Feil. Han skrev 83]. Bøkene var kjent for sin detaljerte historiske nøyaktighet og realistiske skildringer av det ville vesten. Hallbing gjorde grundig research og inkorporerte faktiske hendelser og personer fra perioden, noe som ga leserne en autentisk opplevelse.

### Internasjonal suksess og påvirkning

Morgan Kane-serien ble ikke bare en suksess i Norge, men også internasjonalt. Bøkene ble oversatt til flere språk, inkludert svensk, finsk, islandsk, tsjekkisk og japansk. Serien solgte millioner av eksemplarer og gjorde Hallbing til en av Norges mestselgende forfattere gjennom tidene.

Hallbings suksess banet vei for andre norske forfattere innen westernsjangeren og bidro til å øke interessen for denne litterære stilen i Norge. Hans arbeid inspirerte også generasjoner av lesere og forfattere, både nasjonalt og internasjonalt. [Vel, vi har vel strengt tatt ikke hatt mange norske westernforfattere, og de vi har hatt skrev western-historier allerede på 50-tallet i Komet-og Villmarksliv-serien. Og at han inspirerte generasjoner av forfattere internasjonalt er vel å ta noe hardt i.]

### Andre verk og pseudonymer

I tillegg til Morgan Kane-serien skrev Hallbing under andre pseudonymer som Ward CameronLeo Manning og Colin Hawkins. Han skapte flere serier, inkludert «Diablo» og «Jubal Cade» [Feil. Jubal Cade-bøkene ble skrevet av Charles R. Pike. I Norge kom denne serien ut i 6 utgivelser på Breiens Forlag i perioden 1976 til 1977.], som også oppnådde popularitet. Disse verkene fortsatte trenden med historisk forankrede historier fylt med action og komplekse karakterer.

### Senere liv og arv

Til tross for sin enorme suksess levde Kjell Hallbing et relativt tilbaketrukket liv. Han fortsatte å skrive frem til midten av 1980-tallet, da han gradvis trakk seg tilbake fra forfattergjerningen. Hallbing gikk bort den 6. mai 2004, men hans verk lever videre og fortsetter å fascinere nye lesere.

Morgan Kane-serien har i senere år opplevd en renessanse, med nyutgivelser og planer om filmatisering. Karakteren Morgan Kane står som et ikon i norsk litteraturhistorie og representerer en tid da westernsjangeren sto sterkt i Norge.

### Betydning og innflytelse

Kjell Hallbings bidrag til norsk litteratur er betydelig. Han klarte å kombinere spennende fortellinger med historisk nøyaktighet, og skapte en universell appell som brøt kulturelle barrierer. Hans evne til å skildre det menneskelige i sine karakterer gjorde at leserne kunne identifisere seg med dem, til tross for den geografiske og tidsmessige avstanden.

### Konklusjon

Kjell Hallbing var en pioner innen norsk populærlitteratur som gjennom sitt forfatterskap brakte det ville vesten til norske lesere. Hans dedikasjon til håndverket og evne til å skape levende og engasjerende historier har sikret ham en varig plass i Norges litterære kanon. Morgan Kane lever videre som et testament til Hallbings talent og tiltrekningskraften til godt fortalte historier.

SVAR FRA o1 SLUTT

Konklusjon

GPT o1 klarer dette til dels bedre enn f.eks. ChatGPT i mine tester utført i 2022 og 2023 og beskrevet i Test av tematikk tilknyttet særnorske «fenomen».

Men dette skyldes nok at verktøyet enten benytter Internett i motsetning til tidligere versjoner av ChatGPT, eller at det nå ligger informasjon inne i verktøyets database om Kjell Hallbing og dennes forfatterskap. Men selv med fakta tilgjengelig, ser vi at de statistiske beregningene stadig går i «hytt og pine».

En elev som får i oppdrag å skriv en stil om Kjell Hallbing vil fortsatt komme lettere fra det – rent faktamessig – ved å bruke Store Norske Leksikon og/eller Wikipedia. Men for de som ikke orker å skrive selv og som i tillegg har lærere som setter lave krav til en stil, og eventuelt ikke sjekker fakta, så er jo dette et greit verktøy.

GPT 01 prøver seg på Lasse Efskinds bok «Soldatens lille røde»

For å se om GPT o1 har bedre kontroll på mer perifere eksempler på Norsk litteratur enn ChatGPT ba jeg den om å skrive en stil om Lasse Efskinds bok Soldatens lille røde.

Som et eksempel på hva man kan finne ved å foreta relativt enkle, men fokuserte, søk på Google siterer jeg her fra artikkelen «Revolusjonen har også et hjerte» av Trond Haugen:


«Pax var kanskje aldri et direkte revolusjonært forlag, men de tok opp arven etter Fram forlag og utga intellektuelt utfordrende og politisk omstridte bøker. Lasse Efskinds Soldatens lille røde bok fra 1970 representerer et radikalt høydepunkt i så måte. Den stilte spørsmålet om den norske forsvarslinja ikke undergravde soldatenes og arbeiderklassens interesser. I kongelig resolusjon 26. februar 1971 besluttet påtalemyndighetene å gi forfatter og forlag påtaleunnlatelse. Juridisk betydde det at myndighetene konstaterte at forfatter og forlag var skyldige i å ha overtrådt den militære straffeloven (oppviglerparagrafen), men at de lot nåde gå for rett og dermed unngikk en belastende rettssak. Bjerkmann og Efskind avviste påtaleunnlatelsen. Rettssaken i lagmannsretten endte med frifinnelse

Dette kan være greit å ha i bakhodet når en leser gjennom GPT o1s «resonering»:

SVAR FRA o1 START

«Soldatens lille røde» av Lasse Efskind – En Kritisk Utforskning av Krig og Militarisme

Lasse Efskind, født i 1944, er en norsk lege, forfatter, og tidligere skøyteløper som har markert seg innen både idrett, medisin og litteratur. Han er kjent for sitt sterke samfunnsengasjement og sitt kritiske blikk på politiske og sosiale strukturer. En av hans mest omtalte bøker er «Soldatens lille røde», utgitt i 1977,[Feil. Den kom ut på PAX-forlag i 1970] som tilbyr en provoserende og tankevekkende analyse av krigens natur og soldatens rolle. [Feil. Dette er en «bruksbok for soldater» og inneholder ingen analyse av krigens natur eller soldatens rolle]

[Biografiske data er korrekt]

### Bakgrunn og Kontekst

«Soldatens lille røde» kom ut på slutten av 1970-tallet, en tid preget av kald krig, militær opprustning og økende fredsbevegelser. Bokens tittel er en åpenbar referanse til «Maos lille røde», en samling sitater fra Mao Zedong som hadde stor innflytelse i Kina og blant revolusjonære grupper globalt. Ved å bruke denne referansen signaliserer Efskind en parallell mellom ideologisk indoktrinering i totalitære regimer og den mentaliteten han mener eksisterer innen militæret.

### Innhold og Struktur

Boken er delt inn i korte kapitler og avsnitt som kombinerer personlige refleksjoner, filosofiske betraktninger, poesi og satiriske kommentarer [Feil. Man kan nok si at bokens innhold er basert på personlige refleksjoner, men her er verken poesi eller satire]. Efskind benytter en fragmentert skrivestil som utfordrer leseren til å tenke kritisk og selvstendig. [Dette er en håndbok og skrivestilen er deretter. Dette ser fornuftig ut, men er bare statistisk generert tøv]

### Hovedtemaer

#### Kritikk av Militarisme og Indoktrinering

Efskind retter en skarp kritikk mot hvordan samfunnet glorifiserer krig og krigerrollen. Han argumenterer for at soldater ofte blir ofre for systematisk indoktrinering som fratar dem individuell tenkning og moral. Boken utforsker hvordan militæret former individer til å følge ordre uten å stille spørsmål ved rettferdigheten eller konsekvensene av sine handlinger.

#### Menneskelig Lidelse og Dehumanisering

Gjennom personlige anekdoter og sterke bilder skildrer Efskind krigens brutale realiteter. Han belyser den fysiske og psykiske lidelsen som soldater og sivile opplever, og hvordan vold og destruksjon fører til en dehumanisering av alle involverte parter. [I dette avsnittet forsvinner GPT o1 over i rene fantasier]

#### Politiske og Etiske Dilemmaer

Boken utfordrer leseren til å reflektere over de større politiske og etiske aspektene ved krig. Efskind stiller spørsmål ved myndighetenes motiver for å gå til krig, og om det noensinne kan rettferdiggjøres. Han oppfordrer til pasifisme og fremmer dialog og forståelse som alternativer til konflikt.

[Ok, for så vidt ikke dumt]

### Språk og Stil

Efskinds språk er poetisk og metaforisk, med en kombinasjon av alvor og sarkasme. Han bruker ordspill og ironi for å forsterke sitt budskap og engasjere leseren. Stilen er tidvis provoserende, noe som er bevisst for å fremkalle en emosjonell reaksjon og stimulere til dypere refleksjon.

[I dette avsnittet forsvinner GPT o1 over i rene fantasier]

### Betydning og Innflytelse

«Soldatens lille røde» vakte oppsikt ved utgivelsen og bidro til debatt rundt Norges rolle i internasjonale konflikter og militærpolitikk. Boken resonnerte spesielt med fredsaktivister og de som var kritiske til militærvesenet. Efskinds verk har blitt sett på som en viktig stemme i norsk litteratur som utfordrer etablerte normer og oppfordrer til sosial forandring.

[Ja, den vekket oppsikt og debatt, men å kalle dette en «viktig stemme» i norsk litteratur er å ta hardt i]

### Kritiske Perspektiver

Mens mange hyllet boken for dens modige standpunkt og dype humanistiske budskap, møtte den også kritikk. Noen mente at Efskinds synspunkter var naive eller ensidige, og at han overså komplekse realiteter knyttet til nasjonal sikkerhet og internasjonal politikk. Diskusjonen rundt boken reflekterer de polariserende holdningene til krig og fred i samfunnet.

[I dette avsnittet forsvinner GPT o1 over i rene fantasier]

### Relevant i Dag

Til tross for at boken ble skrevet i en annen historisk kontekst, forblir temaene i «Soldatens lille røde» aktuelle. Konsekvensene av krig, militærmaktens rolle, og spørsmål rundt etikk og moral i konflikt er fortsatt gjenstand for debatt. Efskinds verk oppmuntrer nye generasjoner til å stille kritiske spørsmål og søke fredelige løsninger.

[Her ser vi statistikken i fri flyt. I 1970 var det nok atskillig å ta fatt i knyttet til demokratiske prosesser i forsvaret knyttet til den enkelte soldat, og Norges rolle i NATO er selvsagt alltid noen som kan debatteres. Men denne boken er så til de grader forankret i SV og AKPml’s tankegods på 60- og 70-tallet at den neppe har annet enn historisk verdi i dag.]

### Konklusjon

Lasse Efskinds «Soldatens lille røde» er mer enn en bok; det er et opprop for menneskelighet, fred og kritisk tenkning. Gjennom sin engasjerende og utfordrende stil inviterer Efskind leseren til å reflektere over dyptgående spørsmål om krig, moral og individets plass i samfunnets strukturer. Boken står som et betydningsfullt bidrag til norsk litteratur og en påminnelse om litteraturens kraft til å påvirke og inspirere til endring.

[Her tar det til dels helt av]

Referanser:

– Efskind, Lasse. Soldatens lille røde. 1977. [Full tittel er «Soldatens lille røde bok» og utgivelsesår er 1970]
– Intervjuer og artikler om Lasse Efskinds samfunnsengasjement og forfatterskap. [Interessant statistisk beregnet bokstavsammensetning. Hvilke intervjuer og hvilke artikler?]

SVAR FRA o1 SLUTT

Konklusjon

GPT o1 klarer seg til dels noe bedre enn ChatGPT og andre samtaleroboter, men det er tydelig at det ikke er mye konkret informasjon i verktøyets database eller at det klarer å samle særlige mye informasjon fra internett-søk.

Igjen er det tydelig at verktøyet benytter seg av statistisk analyse og at det – i alle fall i denne type oppgaver – ikke foretar særlig mye menneskelignende resonering.

GPT o1 prøver seg på etternavnet «Godejord»

Hvis vi kan tenke oss at prateroboter kan bruke sine statistiske beregninger på å søke effektivt gjennom konkret informasjon offentlig tilgjengelig på f.eks. internett, så burde spørsmål om helt konkrete ting frembringe korrekt informasjon. Det er jo gjerne den lynraske beregningen av store mengder tekstdata som kan være tidsbesparende bruk av denne type digitale verktøy.

Så det å spørre om «How many have the surname Godejord in Norway» burde kunne gi et helt konkret og korrekt resultat.

Siden GPT o1 etter sigende er et slikt glitrende eksempel på KI, burde den jo klare seg bedre enn det ChatGPT gjorde i et tilsvarende forsøk.

Resultatet ble derimot som for tidligere forsøk og selv om jeg stilte spørsmålet på engelsk, svarte GPT o1 på norsk.:

SVAR FRA o1 START

Per oktober 2023 er etternavnet Godejord svært sjeldent i Norge. Ifølge Statistisk sentralbyrå (SSB), som fører oversikt over fornavn og etternavn i befolkningen, blir ikke detaljerte tall publisert for etternavn som bæres av færre enn fire personer, av personvernhensyn.

Basert på tilgjengelige data ser det ut til at færre enn fire personer i Norge har etternavnet Godejord. Dette betyr at mellom 1 og 3 personer sannsynligvis bærer dette etternavnet.

For den mest oppdaterte og nøyaktige informasjonen anbefaler jeg å sjekke den nyeste statistikken fra Statistisk sentralbyrås navnesøk. Der kan du søke på etternavn og få informasjon om antall navnebærere i Norge.

SVAR FRA o1 SLUTT

Konklusjon

Dette gikk like dårlig som for ChatGPT omni og hvilke «tilgjengelige data» som GPT o1 har benyttet seg av må foglarne vite. SSB sine data var det i alle fall ikke, for det er stadig 54 personer med etternavnet Godejord i Norge.

GPT O1 forsøker seg på båtproblemet

Som beskrevet i Test av båtproblem, og i testen for Perplexity AI, har det så langt ikke vært mulig å reprodusere det konkrete og korrekte svaret gjengitt i artikkelen av 2. des. 2023 i Digi.no, Kunstig intelligens: Fire konkrete erfaringer, av Trond Albert Skjelbred. Men kanskje GPT O1 klarer det? Jeg stiller samme spørsmål som artikkelforfatter gjør;

Spørsmål: «Vi har en båt av type US Boats Chaparral 2007. Det piper voldsomt når vi kjører. Hva gjør vi?»

Etter litt «prosessering» kommer svaret som følger:

SVAR FRA o1 START

Skjermdump fra GPT O1 under prosesseringen av båtspørsmålet. Det ser kanskje mer imponerende ut nå sekundene tikker avgårde, mens GPT O1 «tenker».

Hei!

Når båten din, en US Boats Chaparral fra 2007, gir fra seg en pipelyd under kjøring, er det vanligvis en indikasjon på at noe trenger oppmerksomhet. Her er noen mulige årsaker og hva du kan gjøre:

  1. Motoralarmer:
    • Overoppheting: Hvis motoren blir for varm, vil en alarm ofte utløses.
      • Løsning: Sjekk motortemperaturen. Kontroller kjølesystemet for blokkeringer eller lavt kjølevæskenivå.
    • Lavt oljetrykk: Kan utløse en alarm for å forhindre motorskade.
      • Løsning: Sjekk oljenivået og etterfyll om nødvendig. Hvis problemet vedvarer, kan det være en oljepumpefeil.
  2. Batterialarm:
    • Indikerer ofte lav spenning eller ladingsproblemer.
      • Løsning: Sjekk batteriene og lad om nødvendig. Kontroller også at generatoren fungerer korrekt.
  3. Brenselalarm:
    • Lavt drivstoffnivå eller problemer med drivstoffsystemet.
      • Løsning: Sjekk drivstoffnivået og filtrene. Sørg for at det ikke er blokkeringer i drivstofflinjene.
  4. Dybdemåler eller Navigasjonsalarmer:
    • Noen båter har alarmer for grunt vann eller kollisjon.
      • Løsning: Kontroller innstillingene på navigasjonsutstyret ditt. Juster alarmgrenser om nødvendig.
  5. Gear- eller Transmissionalarmer:
    • Problemer med girkassen eller propellsystemet kan utløse alarmer.
      • Løsning: Inspiser girsystemet for lekkasjer eller slitasje. Konsulter en mekaniker hvis du er usikker.
  6. Andre Systemalarmer:
    • Sensorfeil eller elektriske problemer kan forårsake falske alarmer.
      • Løsning: Gjennomfør en generell inspeksjon av elektriske systemer og sensorer.

Anbefalinger:

  • Les Brukermanualen: Start med å sjekke manualen for båten din. Den vil ofte ha en seksjon om alarmer og feilsøking.
  • Visuell Inspeksjon: Gjør en grundig sjekk av motorrommet og andre systemer for å se etter åpenbare problemer.
  • Kontakt en Fagperson: Hvis du ikke klarer å identifisere eller løse problemet selv, er det lurt å kontakte en autorisert båtmekaniker eller forhandler.
  • Unngå Videre Bruk: Inntil du har identifisert årsaken til pipelyden, bør du unngå å bruke båten for å forhindre potensielle skader eller sikkerhetsrisikoer.

Håper dette hjelper deg med å finne ut av problemet. Lykke til, og god seilas!

SVAR FRA o1 SLUTT

Konklusjon

Gode råd, men langt unna det helt konkrete svaret ChatGPT i sin tid, i følge artikkelforfatter Trond Albert Skjelbred, fremkom med. Og dette må jeg innrømme at jeg finner ytterst interessant. I artikkelen skriver Skjelbred at svaret «kom umiddelbart: «Det er sannsynligvis et varsel for vann i motorrommet.» Det stemte selvsagt

Svaret kom altså umiddelbart. Han foretok ingen form for «prompt engineering».

Vi vet at GPT O1, i likhet med ChatGPT og andre typer samtaleroboter, ikke forstår hva vi spør etter. Den foretar ingen form for tenkeprosess. Svaret som fremkommer er åpenbart stadig basert på statistiske beregninger og skal verktøyet overhodet kunne få frem et fornuftig svar, må det foreligge konkrete data – enten lagt inn i systemets database eller ligge lett tilgjengelig på Internett.

Men selv nå i september 2024 finner ikke en OpenAI-versjon som skal kunne resonere logisk, frem til det konkret svar som ikke bare fremkommer i en åpen artikkel på nettet, men som også er gjengitt i mine åpne innlegg tilknyttet min testing.

Legger vi ut spørsmålet fra artikkelen i Google, kommer det kjapt frem henvisninger til min bloggside «Test av båtproblem – Didaktiske betraktninger», deretter artikkelen «Kunstig intelligens: Fire konkrete erfaringer» og «Trond Albert Skjelbreds innlegg – Kunstig intelligens» (Linkedin), og så min side «Perplexity AI – Didaktiske betraktninger». Deretter kommer det henvisninger til «Baatplassen.no» og «Facebook · Båtmotorhjelpen», og så henvisninger til ulike andre sider med maritimt innhold.

Så hvor fant ChatGPT anno desember 2023 det klare svaret om at «Det er sannsynligvis et varsel for vann i motorrommet»? Og hvorfor har det siden vært umulig å få dette svaret gjengitt på nøyaktig samme spørsmål?

Jeg har ingen grunn til å tvile på det som fremkommer i artikkelen av desember 2023, så jeg antar at dette er et eksempel på hvor upålitelig de statistiske beregningene slike verktøy foretar er og at GPT O1 Preview er like lite intelligent i så måte som andre versjoner.

Er man utrolig heldig fremkommer et konkret og korrekt svar, men ut fra mine tester så langt er det åpenbart ikke noe man kan regne med.

Samlet konklusjon

«OpenAI O1 is not good at all. Not a new model, fine-tuned maybe. Slow, uses a crazy number of tokens and it’s not as useful as having an agent or straight up combing rag with agent with long term memory (sqlite)
– Daniel Merja, 2024 (6)

«It’s almost as if the model does not actually think, and instead was trained on a big dataset of problem-solving steps and knows how similar problems were solved before, applying the same patterns in its internal Chain of Thought
– Jose Antonio Lanz, 2024 (7)

«It’s impressive, but I think the improvement is not very significant. It’s better at certain problems, but you don’t have this across-the-board improvement
– Professor Ravid Shwartz Ziv, 2024 (8)

Dette verktøyet er like lite intelligent som de andre samtalerobotene. Det er meget mulig at det er nyttig innenfor naturfaglige og matematiske områder, men det har ingen synlig nytte innenfor mer samfunnsvitenskapelige/ humaniora-områder.

Forsøket med å få GPT til å utvikle et Kodu-spill var interessant. Og denne delen overlater jeg til mine studenter å teste ut, og fortelle meg hvordan det gikk.

Om vi noensinne kommer i en situasjon der påstanden om at «hjemmeeksamen må avvikles» faktisk vil holde vann (innenfor samfunnsvitenskapen og humaniora), så vil det ikke være på grunn av OpenAI og andre selskapers bruk av store språkmodeller i form av samtaleroboter.

Leseliste

  1. OpenAI Lied: o1-preview Cannot “Think” (Here’s How It Really Works)
  2. OpenAI o1: Et stort fremskritt eller bare et steg videre?
  3. Notes on OpenAI’s new o1 chain-of-thought models
  4. Analysis: OpenAI o1 vs GPT-4o
  5. GPT-o1
  6. Breaking News: OpenAI o1 just launched. How good is it?
  7. The Thinker: ChatGPT gets a serious brain upgrade
  8. Reverse engineering OpenAI’s o1
  9. OpenAI o1 System Card
<Tilbake til startTil øvrige tester >