Ziekenhuiscase: Lokale AI op Lenovo-hardware

Case Study Zorg Lenovo ThinkStation & ThinkPad
Sneller verslagleggen, minder administratiedruk en volledige datacontrole met on-device LLM's (Llama.cpp). Artsen besteden tot 2 uur minder per dag aan administratie dankzij realtime transcriptie en samenvattingen tijdens consulten, met volledige controle via human-in-the-loop. Geen cloud-tokens of variabele kosten voor AI-inferentie en gevoelige patiëntdata blijft binnen het ziekenhuisnetwerk.

Samenvatting resultaten (pilot)

  • Tot 2 uur minder administratie per arts per dag (gemeten in de pilot, afhankelijk van specialisme).
  • Realtime transcriptie en samenvattingen tijdens consulten; arts behoudt regie via human-in-the-loop.
  • Geen cloud-tokens of variabele kosten voor AI-inferentie; voorspelbare TCO.
  • Gevoelige patiëntdata blijft binnen het ziekenhuisnetwerk (on-device en on-prem).

Uitdaging

Artsen en verpleegkundigen besteden een fors deel van hun tijd aan verslaglegging en administratieve taken. Dat gaat ten koste van directe patiënttijd en vergroot de werkdruk. Bestaande cloud-AI-diensten lossen dit deels op, maar roepen vragen op over AVG, datadeling buiten de EU en onvoorspelbare kosten. Het ziekenhuis zocht een oplossing die privacy-zeker, snel en schaalbaar is—zonder de zorgprocessen te verstoren.

Oplossing in het kort

  • On-device LLM's via Llama.cpp op Lenovo ThinkStation P-workstations en Lenovo ThinkPad P-laptops in spreekkamers.
  • RAG-opzet: de modellen krijgen context uit protocollen, richtlijnen en interne documenten (veilig geïndexeerd).
  • Batch- en zware taken op on-prem Lenovo ThinkSystem GPU-servers, met NVIDIA AI Enterprise voor beheer en veiligheid.
  • Integratie met het EPD (HIX/Epic): samenvatting en transcriptie worden na akkoord van de arts direct opgeslagen.
  • Human-in-the-loop: de arts controleert en accordeert, met duidelijke disclaimers ("AI-ondersteund, geen diagnose").

Architectuur en werking

Edge (spreekkamer): microfoon → on-device spraak-naar-tekst → samenvatting/actielijst → akkoord arts → EPD.

Datacenter (on-prem): grotere modellen en batchverwerking, modelbeheer, monitoring en auditlog.

Beveiliging: alle data blijft binnen het ziekenhuisnetwerk; versleuteling in rust en tijdens transport.

Resilience: offline-modus in spreekkamers; synchronisatie zodra verbinding beschikbaar is.

Integratie met het EPD

  • Ondersteuning voor HIX/Epic-koppelingen (HL7/FHIR) voor het wegschrijven van samenvattingen en coderingen.
  • Single Sign-On (SSO) en rol-gebaseerde toegang; logs gaan mee naar het EPD-eventlog/audittrail.
  • Automatische highlights (medicatie, allergieën, ICPC/SNOMED-suggesties) ter ondersteuning van dossierkwaliteit.

Privacy & compliance (AVG)

DPIA uitgevoerd en datastromen gedocumenteerd (on-device, on-prem; geen data naar publieke clouds).

Voldoet aan NEN 7510 en ISO 27001-kaders: encryptie at-rest/in-transit; bewaartermijnen conform beleid.

Strikte rol- en rechtenstructuur: periodieke audits en pentests; geautomatiseerde PII-masking waar passend.

Implementatie & adoptie

  1. Fase 1 (pilot, 4–6 spreekkamers): inrichting, datakoppelingen, meetplan en training key users.
  2. Fase 2 (opschaling): uitrol per poli/afdeling, monitoring van KPI's en continue model-tuning.
  3. Training & change: korte, rolgebonden sessies; duidelijke richtlijnen voor gebruik en grenzen van AI.
  4. Support: 24/7 monitoring van diensten, heldere escalaties, en fallback-scenario's.

Risico's & mitigaties

  • Hallucinaties: human-in-the-loop en bronverwijzingen (context) zijn standaard; geen autonoom wegschrijven.
  • Bias en veiligheid: periodieke evaluaties van output en dataset-updates; klinische validatie waar nodig.
  • Continuïteit: rollback-plan per afdeling; duidelijke fallback naar handmatige werkwijze.

Resultaten & meetplan

Het meetplan volgt vóór/na-metingen per afdeling. De KPI-tabel hieronder dient als sjabloon voor rapportage:

KPI Nulmeting Na 12 weken Opmerking
Admin. tijd per arts per dag Doel: tot −2 uur
Doorlooptijd verslaglegging Minuten/consult
Patiënttevredenheid (NPS/CSAT) Poli/afdeling
EPD-dossierkwaliteit Regelmatige steekproeven
Cloudkosten AI/maand Doel: €0 voor inferentie

Ervaringen uit de praktijk

"Dankzij lokale AI kan ik mijn aandacht bij de patiënt houden; de samenvatting staat klaar in het EPD tegen de tijd dat ik het consult afrond."

— Cardioloog

Over de hardware

Spreekkamers: Lenovo ThinkPad P-laptops of ThinkStation P-workstations met NPU-ondersteuning voor on-device AI.

Datacenter: Lenovo ThinkSystem GPU-servers met NVIDIA AI Enterprise voor schaalbare, beheerde inferentie.

Beheer: centraal modelbeheer, versie-controle en monitoring; updates via change-vensters.

Waarom lokale AI in de zorg (Nederland)

  • Dataminimalisatie en soevereiniteit: patiëntdata blijft binnen Nederlandse/EU-jurisdictie.
  • Lagere latency en hogere beschikbaarheid aan het bed of in de spreekkamer.
  • Voorspelbare kostenstructuur en geen afhankelijkheid van externe token-prijzen.

Volgende stap

Wil je weten hoe dit binnen jouw ziekenhuis werkt? Vraag de referentie-architectuur (PDF) en het pilot-plan op maat aan. We delen graag de lessons learned en het meetkader.

WhatsApp Chat WhatsApp Chat