Bruk av data i KI og trening

Prosjekt for å besvare USBL sine spørsmål om bruk av data i maskinlæring og AI-modelltrening — og etablere en felles styringsmodell for alle kunder.

🎯 Formål

Mål: Utforme retningslinjer for hvordan PivoCore bruker data i trening og KI fremover.

USBL sine krav

USBL ønsker en styringsmodell med følgende elementer:

KravBeskrivelse
Opt-in-rettUSBL skal ha rett til å velge INN (opt-in) FØR deres data brukes i KI/innsikt/AI
Gjelder alleStyringsmodellen må være felles for alle kunder der vi bruker data
UtgangspunktUSBL sin dialog = mal for hvordan vi formulerer dette for alle kunder

🔑 Prinsipp

“USBL sine data er utgangspunktet, men løsningen skal gjelde for alle.”

Vi bruker dialogen med USBL til å utvikle en styringsmodell som kan benyttes på tvers av alle boligbyggelag og kunder.

USBL sine spørsmål

#SpørsmålSvar
1Modelltrening: Bruker vi USBLs data til å trene fellesmodeller?Nei — kun anonymiserte data fra felles datasjø
2Forretningsinnsikt: Hvordan sikres anonymisert kryss-kundeinnsikt?Alle rapporter på felles anonymisert datasjø
3Datainnsjø/KI-trening: BekreftelseUSBL sin deanonymiserte datasjø brukes IKKE av PivoCore

🔄 Siste status (2026-03-31)

Julijas referat og oppfølgingspunkter — 30. mars 2026

Julija Molandsveen (Usbl) sendte skriftlig referat fra møtet 23. mars med presiseringer og 6 oppfølgingspunkter. E-post til Jon med kopi til Trond Ove Breivik og Tanja Weber Nordseth.

Julijas presiseringer fra møtet:

TemaJulijas oppsummering
Regnskap 2.0 (fakturatolkning)Tokenisering og anonymisering på treningsdata. Kontopredikering skjer på Usbls egen kontoplan/data — ingen deling på tvers. To separate modeller: linjetolkning + kontopredikering.
Snakk med PivoVektordatabase per BBL, fullstendig adskilt. Felles offentlige kilder (Lovdata) i separat database. LLM kjøres som Pivotals egen tenant i EU (enterprise-avtale med Google). Tilpasning via prompt engineering og tools — ingen trening på kundedata.
Volve (vannskade)Ikke påbegynt. Dialog med If om persondata i skaderapporter. Avklaring av persondata som del av prosjektoppstart.
LLM-bruk genereltKommersielle LLM-er (Google, Anthropic) med enterprise-avtaler. Ingen omtrening på kundedata.
Rapporter (kun Usbl-data)BBLX-rapport, Provisjonsrapport, Multikanal (medlemsfordeler/omsetning)
Rapporter (Usbl synlig for andre)Forretningsinnsikt — felles leverandører + långivere. Usbl typisk blant topp 5 pga størrelse.
DatainnsjøFullstendig isolert. Data fra HF, Lime, Unit4 m.fl. Tilgangsstyrt. Kun til rapportering, ikke modelltrening.
OvervåkningIngen automatisert overvåkning i dag. Manuelle rapporter per bruker mulig.

Oppfølgingspunkter fra Julija (6 stk):

#OppfølgingspunktAnsvarFrist
1Avklare bruk av Usbls data i Volve — før prosjektoppstartPivotalFør Volve-oppstart
2Skriftlig redegjørelse om anonymisering i Regnskap 2.0: hvilken standard, hvem utfører, er den irreversibel?PivotalUke 16 (forslag)
3Løsningsforslag for automatisk overvåkning av databruk/nedlasting i datasjøenPivotalUke 16 (forslag)
4Dele relevante utdrag/bekreftelse fra enterprise-avtaler (Google, Anthropic) som bekrefter at data ikke brukes til treningPivotalUke 16 (forslag)
5Utkast til DPA-vedlegg som regulerer KI og innsiktstjenester (nåværende DBA dekker ikke Jons område)Usbl (Julija)Etter påske
6Innkalle til data governance-møte for felles kjørereglerPivotalApril 2026

Oppfølgingsmøte 23. mars — Jon, Ludwig, Samuel + Julija, Tanja (Usbl)

Gjennomgang av alle leveranser:

  • Fakturatolking: Alt innhold kryptert, ikke mulig å reversere fra output. Lite personopplysninger.
  • Predikering regnskapskonto: Trenes på individuelle datasett per kunde. Ingen blanding.
  • Snakk med regnskapet: Ingen trening — bruker LLM direkte. Kundedata separat.
  • VOLVE/vannskade: Separate vektordatabaser. Tanja skeptisk til sannsynlighetsberegning på leilighetsnivå — kanskje aggregere til byggnivå. Uheldig om forsikring bruker til prising.
  • Konklusjon: Lite behandling av personopplysninger. Trening på individuelle datasett — ingen blanding.

Datainnsjø og tilgangsstyring:

  • Magnus Osberg (konsulent) håndterer teknisk drift. Tor-Johnny (Usbl) er kundens kontaktperson. Alt separert mellom BBL-er.
  • Traceability viktig for Usbl — vi har logger, men ingen varsling ved unormal nedlasting.
  • Alle bestillinger via autoriserte personer. Tanja er ansvarlig hos Usbl.
  • Ludwig avklarer med Tor-Johnny hvem som er autorisert.

Rapporter:

  • 2-3 rapporter inneholder sammenligninger mot topp 5 BBL-er — kan potensielt identifisere leverandører.
  • Ikke gjort noe med dette nå, kan komme tilbake til det.

Veien videre:

  1. Usbl lager forslag til avtalevedlegg som regulerer bruk av Usbls data i AI/modell
  2. Tanja tar initiativ til eget møte om data governance — styring og kontroll av leveranser/datahåndtering

Møte 17. mars (første møte)

Forberedende møte 12. mars — Jon, Ludwig, Samuel

  • Gikk gjennom svar på USBLs spørsmål
  • Behov for oversikt over alle rapporter som presenterer data fra USBL
  • Spesielt: Rapport over “største leverandører” må gjennomgås

📋 Handlingspunkter

Fullført

  • Christian: Lage oversikt over alle rapporter der USBL-data brukes ✅ 2026-03-17
  • Jon: Lage presentasjonsforslag til USBL-møtet ✅ 2026-03-17

Aktive — Oppfølging etter Julijas referat (31.03.2026)

#OppgaveAnsvarligFristStatus
1Besvare Julijas e-post — bekrefte referat + varsle leveranserJon📅 2026-04-01
2Skriftlig notat om anonymisering i Regnskap 2.0 (standard, hvem utfører, irreversibilitet)Samuel / Ludwig📅 2026-04-14 (uke 16)
3Løsningsforslag: automatisk overvåkning datasjø (nedlasting, tilgangslogg, varsling)Ludwig (Pivotal) + Tor-Johnny (Usbl)📅 2026-04-14 (uke 16)
4Oppsummering enterprise-avtaler (Google, Anthropic) — bekreftelse at kundedata ikke brukes til treningJon / Samuel📅 2026-04-14 (uke 16)
5Motta og vurdere Julijas utkast til DPA-vedlegg for KI/innsiktJon (mottar fra Julija)📅 Etter påske (uke 15-16)⬜ Venter på Usbl
6Kalle inn til data governance-møte med UsblJon📅 2026-04-30
7Avklare persondata i Volve-prosjektet med If SkadeforsikringSamuel📅 Før Volve-oppstart

Pågående (fra tidligere)

  • Utvikle styringsmodell: Basert på USBL-dialog → formulere felles retningslinjer for alle kunder
  • Vurdere rapporter som viser “største leverandører” — kan potensielt identifisere enkeltleverandører

🏛️ Styringsmodell (felles for alle kunder)

Her skal vi utvikle den felles styringsmodellen basert på USBL-dialog:

Elementer i modellen

  • Opt-in/mekanisme for at kunder aktivt velger inn bruk av sine data i KI/AI
  • Tydelig kommunikasjon om hva data brukes til
  • Anonymiseringskrav før bruk i modelltrening
  • Dokumentasjon per kunde

Kunder som vil omfattes

  • Usbl
  • Bate
  • Bonord
  • Nobl
  • (og fremtidige kunder)

💡 Notater

  • Alle rapporter ligger på PivoCore sin felles datasjø — ingen personopplysninger
  • USBL sin egen datasjø (deanonymisert) brukes ikke av PivoCore
  • Tilgangsstyring via Google-brukere — hver kunde ser kun egne data

Lenker:

  • USBL
  • Dataforvaltning