Bruk av data i KI og trening
Prosjekt for å besvare USBL sine spørsmål om bruk av data i maskinlæring og AI-modelltrening — og etablere en felles styringsmodell for alle kunder.
🎯 Formål
Mål: Utforme retningslinjer for hvordan PivoCore bruker data i trening og KI fremover.
USBL sine krav
USBL ønsker en styringsmodell med følgende elementer:
| Krav | Beskrivelse |
|---|---|
| Opt-in-rett | USBL skal ha rett til å velge INN (opt-in) FØR deres data brukes i KI/innsikt/AI |
| Gjelder alle | Styringsmodellen må være felles for alle kunder der vi bruker data |
| Utgangspunkt | USBL sin dialog = mal for hvordan vi formulerer dette for alle kunder |
🔑 Prinsipp
“USBL sine data er utgangspunktet, men løsningen skal gjelde for alle.”
Vi bruker dialogen med USBL til å utvikle en styringsmodell som kan benyttes på tvers av alle boligbyggelag og kunder.
USBL sine spørsmål
| # | Spørsmål | Svar |
|---|---|---|
| 1 | Modelltrening: Bruker vi USBLs data til å trene fellesmodeller? | Nei — kun anonymiserte data fra felles datasjø |
| 2 | Forretningsinnsikt: Hvordan sikres anonymisert kryss-kundeinnsikt? | Alle rapporter på felles anonymisert datasjø |
| 3 | Datainnsjø/KI-trening: Bekreftelse | USBL sin deanonymiserte datasjø brukes IKKE av PivoCore |
🔄 Siste status (2026-03-31)
Julijas referat og oppfølgingspunkter — 30. mars 2026
Julija Molandsveen (Usbl) sendte skriftlig referat fra møtet 23. mars med presiseringer og 6 oppfølgingspunkter. E-post til Jon med kopi til Trond Ove Breivik og Tanja Weber Nordseth.
Julijas presiseringer fra møtet:
| Tema | Julijas oppsummering |
|---|---|
| Regnskap 2.0 (fakturatolkning) | Tokenisering og anonymisering på treningsdata. Kontopredikering skjer på Usbls egen kontoplan/data — ingen deling på tvers. To separate modeller: linjetolkning + kontopredikering. |
| Snakk med Pivo | Vektordatabase per BBL, fullstendig adskilt. Felles offentlige kilder (Lovdata) i separat database. LLM kjøres som Pivotals egen tenant i EU (enterprise-avtale med Google). Tilpasning via prompt engineering og tools — ingen trening på kundedata. |
| Volve (vannskade) | Ikke påbegynt. Dialog med If om persondata i skaderapporter. Avklaring av persondata som del av prosjektoppstart. |
| LLM-bruk generelt | Kommersielle LLM-er (Google, Anthropic) med enterprise-avtaler. Ingen omtrening på kundedata. |
| Rapporter (kun Usbl-data) | BBLX-rapport, Provisjonsrapport, Multikanal (medlemsfordeler/omsetning) |
| Rapporter (Usbl synlig for andre) | Forretningsinnsikt — felles leverandører + långivere. Usbl typisk blant topp 5 pga størrelse. |
| Datainnsjø | Fullstendig isolert. Data fra HF, Lime, Unit4 m.fl. Tilgangsstyrt. Kun til rapportering, ikke modelltrening. |
| Overvåkning | Ingen automatisert overvåkning i dag. Manuelle rapporter per bruker mulig. |
Oppfølgingspunkter fra Julija (6 stk):
| # | Oppfølgingspunkt | Ansvar | Frist |
|---|---|---|---|
| 1 | Avklare bruk av Usbls data i Volve — før prosjektoppstart | Pivotal | Før Volve-oppstart |
| 2 | Skriftlig redegjørelse om anonymisering i Regnskap 2.0: hvilken standard, hvem utfører, er den irreversibel? | Pivotal | Uke 16 (forslag) |
| 3 | Løsningsforslag for automatisk overvåkning av databruk/nedlasting i datasjøen | Pivotal | Uke 16 (forslag) |
| 4 | Dele relevante utdrag/bekreftelse fra enterprise-avtaler (Google, Anthropic) som bekrefter at data ikke brukes til trening | Pivotal | Uke 16 (forslag) |
| 5 | Utkast til DPA-vedlegg som regulerer KI og innsiktstjenester (nåværende DBA dekker ikke Jons område) | Usbl (Julija) | Etter påske |
| 6 | Innkalle til data governance-møte for felles kjøreregler | Pivotal | April 2026 |
Oppfølgingsmøte 23. mars — Jon, Ludwig, Samuel + Julija, Tanja (Usbl)
Gjennomgang av alle leveranser:
- Fakturatolking: Alt innhold kryptert, ikke mulig å reversere fra output. Lite personopplysninger.
- Predikering regnskapskonto: Trenes på individuelle datasett per kunde. Ingen blanding.
- Snakk med regnskapet: Ingen trening — bruker LLM direkte. Kundedata separat.
- VOLVE/vannskade: Separate vektordatabaser. Tanja skeptisk til sannsynlighetsberegning på leilighetsnivå — kanskje aggregere til byggnivå. Uheldig om forsikring bruker til prising.
- Konklusjon: Lite behandling av personopplysninger. Trening på individuelle datasett — ingen blanding.
Datainnsjø og tilgangsstyring:
- Magnus Osberg (konsulent) håndterer teknisk drift. Tor-Johnny (Usbl) er kundens kontaktperson. Alt separert mellom BBL-er.
- Traceability viktig for Usbl — vi har logger, men ingen varsling ved unormal nedlasting.
- Alle bestillinger via autoriserte personer. Tanja er ansvarlig hos Usbl.
- Ludwig avklarer med Tor-Johnny hvem som er autorisert.
Rapporter:
- 2-3 rapporter inneholder sammenligninger mot topp 5 BBL-er — kan potensielt identifisere leverandører.
- Ikke gjort noe med dette nå, kan komme tilbake til det.
Veien videre:
- Usbl lager forslag til avtalevedlegg som regulerer bruk av Usbls data i AI/modell
- Tanja tar initiativ til eget møte om data governance — styring og kontroll av leveranser/datahåndtering
Møte 17. mars (første møte)
- PivoCore bekreftet: trening skjer kun på anonymiserte datasett fra felles datasjø
- Alle standardrapporter kjøres mot felles anonymisert datasjø
- Usbls deanonymiserte datasjø brukes IKKE av PivoCore
- Rapportoversikt: https://lookerstudio.google.com/u/0/reporting/24ceab26-327f-4b0a-9134-877a6acde568/page/ICLsF
- Christian ferdigstilte rapportoversikt ✅ 2026-03-17
Forberedende møte 12. mars — Jon, Ludwig, Samuel
- Gikk gjennom svar på USBLs spørsmål
- Behov for oversikt over alle rapporter som presenterer data fra USBL
- Spesielt: Rapport over “største leverandører” må gjennomgås
📋 Handlingspunkter
Fullført
- Christian: Lage oversikt over alle rapporter der USBL-data brukes ✅ 2026-03-17
- Jon: Lage presentasjonsforslag til USBL-møtet ✅ 2026-03-17
Aktive — Oppfølging etter Julijas referat (31.03.2026)
| # | Oppgave | Ansvarlig | Frist | Status |
|---|---|---|---|---|
| 1 | Besvare Julijas e-post — bekrefte referat + varsle leveranser | Jon | 📅 2026-04-01 | ⬜ |
| 2 | Skriftlig notat om anonymisering i Regnskap 2.0 (standard, hvem utfører, irreversibilitet) | Samuel / Ludwig | 📅 2026-04-14 (uke 16) | ⬜ |
| 3 | Løsningsforslag: automatisk overvåkning datasjø (nedlasting, tilgangslogg, varsling) | Ludwig (Pivotal) + Tor-Johnny (Usbl) | 📅 2026-04-14 (uke 16) | ⬜ |
| 4 | Oppsummering enterprise-avtaler (Google, Anthropic) — bekreftelse at kundedata ikke brukes til trening | Jon / Samuel | 📅 2026-04-14 (uke 16) | ⬜ |
| 5 | Motta og vurdere Julijas utkast til DPA-vedlegg for KI/innsikt | Jon (mottar fra Julija) | 📅 Etter påske (uke 15-16) | ⬜ Venter på Usbl |
| 6 | Kalle inn til data governance-møte med Usbl | Jon | 📅 2026-04-30 | ⬜ |
| 7 | Avklare persondata i Volve-prosjektet med If Skadeforsikring | Samuel | 📅 Før Volve-oppstart | ⬜ |
Pågående (fra tidligere)
- Utvikle styringsmodell: Basert på USBL-dialog → formulere felles retningslinjer for alle kunder
- Vurdere rapporter som viser “største leverandører” — kan potensielt identifisere enkeltleverandører
🏛️ Styringsmodell (felles for alle kunder)
Her skal vi utvikle den felles styringsmodellen basert på USBL-dialog:
Elementer i modellen
- Opt-in/mekanisme for at kunder aktivt velger inn bruk av sine data i KI/AI
- Tydelig kommunikasjon om hva data brukes til
- Anonymiseringskrav før bruk i modelltrening
- Dokumentasjon per kunde
Kunder som vil omfattes
- Usbl
- Bate
- Bonord
- Nobl
- (og fremtidige kunder)
💡 Notater
- Alle rapporter ligger på PivoCore sin felles datasjø — ingen personopplysninger
- USBL sin egen datasjø (deanonymisert) brukes ikke av PivoCore
- Tilgangsstyring via Google-brukere — hver kunde ser kun egne data
Lenker:
- USBL
- Dataforvaltning