Een operationele data store (ODS) is een centrale database die een momentopname biedt van de recentste gegevens uit meerdere transactiesystemen voor operationele rapportage. Operationele data stores zijn ontworpen om gegevens uit verschillende bronnen te integreren voor lichte dataverwerkingsactiviteiten, zoals operationele rapportage en real-time analyse.
In het ODS kunnen data worden gescrubd, ontdubbeld en gecontroleerd op naleving van de bijbehorende bedrijfsregels. Een ODS kan worden gebruikt om gegevens uit verschillende bronnen te integreren, zodat tijdens de bedrijfsvoering analyses en rapportages kunnen worden uitgevoerd.
Hier worden de meeste gegevens die in de huidige operaties worden gebruikt, opgeslagen voordat ze naar het datawarehouse worden verplaatst voor opslag of langdurige archivering.
Een operationele data store (ODS) slaat gegevens meestal in realtime op en verwerkt deze. Het is verbonden met meerdere gegevensbronnen en haalt gegevens naar een centrale locatie. De manier waarop operationele data stores werken, is vergelijkbaar met het extraction, transform en load (ETL) proces.
Wanneer een ETL-gestuurde datapijplijn een datawarehouse van gegevens voorziet, heeft het opnameproces drie fasen: extractie van bronsystemen, datatransformatie en laden in de bestemming. De transformatielaag gebruikt een staging-database die ruwe gegevens uit de productiedatabases bevat. Deze kleine en lichte staging-database bevat alleen de recentst geïmporteerde gegevens.
ODS-systemen importeren ruwe gegevens uit productiesystemen en slaan deze op in hun oorspronkelijke vorm. Waar ETL-transformatie toepast in de tweede fase, maakt de ODS de ruwe gegevens beschikbaar voor analyse door Business Intelligence (BI) tools.
Soms kan de onderneming gegevens repliceren in een ODS voor BI-doeleinden en vervolgens een ETL-proces gebruiken om de ODS-gegevens naar een warehouse te verplaatsen. Deze aanpak kan de belasting op de productiedatabases die de ruwe gegevens leveren, verminderen.
Wanneer operationele data stores gegevens opnemen, overschrijven nieuwe binnenkomende gegevens de bestaande gegevens.
Net als datawarehouses en datalakes kunnen operationele data stores worden gebruikt als een opslagplaats voor het importeren en consolideren van verschillende soorten operationele gegevens uit verschillende locaties en systemen. Er zijn echter belangrijke verschillen.
Een ODS kan worden gebruikt binnen een datawarehousing-strategie. Het kan zitten tussen gegevensbronnen en enterprise data warehouses, die kunnen worden gebruikt om gegevens voor opslag in het datawarehouse voor te bereiden. De ODS kan een gegevensbron voor data warehouses worden.
Hieronder staan de belangrijkste verschillen tussen operationele data stores en data warehouses.
Het grootste verschil tussen de twee is de volatiliteit van de gegevens. ODS-gegevens zijn zeer volatiel, met waarden die bijna in realtime veranderen. De inhoud van een ODS kan van het ene moment op het andere dramatisch veranderen.
Een datawarehouse is veel stabieler. Het behoudt historische waarden en integreert deze met nieuwe binnenkomende waarden. Updates in het datawarehouse gebeuren meestal in geplande batches, waardoor de inhoud van het warehouse slechts enkele keren per dag kan veranderen.
Datawarehouses hebben een vast schema en vereisen een ETL-proces om de gegevens volgens dat schema te reinigen, te harmoniseren en te organiseren. Operationele data stores slaan gegevens op volgens hun schema voordat ze worden opgeslagen. Daarom kunnen operationele data stores alleen gestructureerde gegevens opslaan.
Datawarehouses slaan meer historische en cross-functionele gegevens op die beslissers kunnen gebruiken voor strategische analyse. Terwijl ODS-systemen nieuwe gegevens opnemen, overschrijven ze oudere gegevens, wat de reikwijdte van de gegevens beperkt. Dit maakt ODS-systemen geschikter voor gegevens op basis van de huidige staat in plaats van voor langdurige strategische planning.
Het is belangrijk op te merken dat hoewel een ODS een efficiënte opslagoplossing is voor kleine tot middelgrote datasets, er betere opties zijn voor het omgaan met grote hoeveelheden gegevens, vaak aangeduid als big data.
Alternatieve oplossingen zoals Hadoop of datawarehouses zijn geschikter voor big data-opslag en -verwerking. Deze oplossingen zijn ontworpen om grootschalige datasets te beheren en bieden de benodigde infrastructuur om gegevens effectief op te slaan en te verwerken.
Datawarehouses zijn ontworpen om big data te verwerken, geoptimaliseerd voor complexe query's en analyses. Ze kunnen gegevens uit meerdere bronnen integreren en een enkel, verenigd overzicht van de gegevens bieden.
Een datawarehouse kan enorme hoeveelheden gegevens opslaan en snel en efficiënt worden doorzocht. Bovendien kan het afhankelijk van je behoeften worden opgeschaald of afgeschaald, waardoor het een flexibele oplossing is.
Een ODS is ontworpen voor relatief eenvoudige query's op kleine hoeveelheden gegevens, zoals het vinden van de status van een klantbestelling. Datawarehouses zijn ontworpen voor complexe query's op grote hoeveelheden gegevens.
Een ODS is vergelijkbaar met kortetermijngeheugen, aangezien het alleen zeer recente informatie opslaat; in vergelijking daarmee lijkt het datawarehouse meer op langetermijngeheugen, aangezien het relatief permanente informatie opslaat.
Een Operationele Data Store (ODS) is een type database dat organisaties helpt operationele gegevens uit meerdere bronnen op één locatie op te slaan en te beheren. Het ondersteunt realtime operationele rapportage, Business Intelligence en analyses.
Een ODS is ontworpen voor realtime of bijna realtime gegevensverwerking en -analyse, terwijl een traditioneel datawarehouse is geoptimaliseerd voor historische gegevensanalyse. Een ODS wordt meestal gebruikt ter ondersteuning van operationele rapportage en analyses, terwijl een datawarehouse wordt gebruikt voor strategische besluitvorming.
Het gebruik van een ODS kan organisaties helpen de operationele efficiëntie te verbeteren, de besluitvormingscapaciteiten te versterken en gegevensredundantie te verminderen. Het kan ook helpen om een enkele bron van waarheid voor operationele gegevens te bieden, waardoor de datakwaliteit en consistentie verbeteren.
Een ODS moet realtime of bijna realtime gegevensverwerking en -analyse ondersteunen. Het moet gegevens uit meerdere bronnen kunnen integreren, een enkele bron van waarheid voor operationele gegevens bieden en operationele rapportage en analyses ondersteunen.
Organisaties met grote hoeveelheden operationele gegevens uit meerdere bronnen kunnen profiteren van het gebruik van een ODS. Dit omvat organisaties in de gezondheidszorg, financiën, detailhandel en productie.