SCORM → RAG

Maak van dode SCORM-cursussen een levende kennisbank

Je organisatie heeft honderden SCORM-pakketten die stof verzamelen in een LMS. Daarin zit precies de domeinkennis die je RAG pipeline nodig heeft — trainingsprocedures, compliance-regels, productspecificaties. ScormParser kraakt ze open en geeft je gestructureerde, embedding-ready content. Geen handwerk. Eén API-call.

Waarom SCORM-pakketten RAG-goudmijnen zijn

Enterprise trainingsbibliotheken bevatten decennia aan opgebouwde domeinkennis — veiligheidsprocedures, compliance-vereisten, productspecificaties, onboardingprocessen. Deze content is gemaakt door vakexperts tegen aanzienlijke kosten. Maar het zit opgesloten in SCORM-pakketten die ontworpen zijn voor LMS-interoperabiliteit, niet voor AI pipelines.

ScormParser overbrugt de kloof. Onze AI-engine begrijpt SCORM's interne structuur, extraheert elk content-asset, transcribeert audio en video, en levert voorgestructureerde content klaar voor embedding.

Hoe het werkt

Upload een SCORM ZIP-pakket via onze API. ScormParser's AI verwerkt het volledige pakket — extraheert tekstcontent, transcribeert audio en video met speech-to-text, en structureert alles in schone Markdown of JSON. De output bevat voorberekende chunk-grenzen geoptimaliseerd voor populaire embedding-modellen.

Chunk-strategieën voor verschillende embedding-modellen

Verschillende embedding-modellen hebben verschillende context windows en presteren het best met verschillende chunkgroottes. ScormParser laat je chunk-strategieën configureren die passen bij je model — of je nu OpenAI's text-embedding-3-large, Cohere's embed-v3 of open-source modellen zoals BGE of E5 gebruikt. Elke chunk bevat cursushiërarchie-metadata zodat je retrieval pipeline context behoudt.

chunk-output.json
{
  "text": "All forklift operators must complete...",
  "metadata": {
    "course": "Warehouse Safety 2024",
    "module": "Equipment Operation",
    "slide": 7
  }
}

Integratie met populaire vector databases

ScormParser's chunked output is ontworpen voor directe opname in populaire vector databases. Laad chunks rechtstreeks in Pinecone, Weaviate, Qdrant of ChromaDB zonder custom transformatiecode te schrijven. Het outputformaat sluit aan bij wat deze databases verwachten, zodat je in minuten van SCORM naar doorzoekbare kennis gaat.

Veelgestelde vragen

Welke chunkgroottes gebruikt ScormParser voor RAG-output?

+

ScormParser gebruikt slimme standaardwaarden geoptimaliseerd voor populaire embedding-modellen. Je kunt chunkgroottes en overlap volledig aanpassen via de API om aan te sluiten bij het optimale context window van je specifieke model.

Kan ik de chunk-strategie aanpassen?

+

Ja. De API biedt volledige controle over chunking — grootte, overlap en splitstrategie. Je kunt ook splitsen per cursusmodule om chunks thematisch beperkt te houden tot één onderwerp.

Wordt de cursushiërarchie behouden in de chunk-metadata?

+

Elke chunk bevat metadata met de volledige cursushiërarchie: cursustitel, modulenaam, slidenummer en contenttype (tekst, transcript, quiz). Dit laat je RAG pipeline resultaten filteren en wegen op basis van waar de content in de originele cursusstructuur verscheen.

Hoe gaat ScormParser om met multimediacontent in RAG-output?

+

Audio- en videocontent wordt getranscribeerd door AI en als tekstchunks met bijbehorende metadata opgenomen. Afbeeldingen met alt-tekst worden ook meegenomen. Dit zorgt ervoor dat alle cursuskennis — niet alleen tekstslides — beschikbaar is voor retrieval.

Gerelateerde oplossingen

Begin vandaag met SCORM naar RAG converteren

Doe mee met de beta en krijg 5 gratis pakketconversies per maand.

  • Gratis tier beschikbaar
  • Geen creditcard nodig
  • Volledige API-toegang

Reserveer je plek

Vul je e-mailadres in en we laten je weten wanneer ScormParser live gaat.