En illustration av en digital finanspanel med mobilapp i centrum, omgiven av diagram, stapeldiagram, säkerhetsikon och ekonomiska symboler som visar transaktioner och analyser.

 

Vad är syntetiska data?

Syntetiska data är genererad artificiellt, till skillnad från data insamlad från verkliga händelser. Den har samma statistiska egenskaper och ger därför samma slutsatser och resultat som verkliga data. Syntetiska data kan skapas i önskad mängd, vilket löser databristen och kan förse er med stora mängder testdata. Den är också helt anonymiserad, utan personuppgifter, för att säkerställa regelefterlevnad.

Med syntetiska data är det möjligt att bestämma vilken typ av data ni behöver och dess kvalitet. Det gör det enkelt att snabbt få tillgång till stora mängder data, från enkla tabelldata och testdata för utveckling av system till mer avancerade datatyper som bild, text och tal.

DataEcho är en plattform som genererar syntetiska data i den mängd och av den kvalitet ni behöver för att möjliggöra er AI-innovation, utan att äventyra datasäkerhet eller kvaliteten i era resultat. Plattformen ger er tillgång till stora mängder testdata som är helt anonymiserad. Den är också skalbar och har hög säkerhet då den hanteras i CGI:s högsäkerhetsdatacenter belägna i Sverige. 
 

En ikon med en diamant i mitten, omgiven av en cirkel med färgövergång från rött till blått, symboliserande exklusivitet eller premiuminnehåll.

Syntetiska och anonyma data i den mängd och kvalitet ni behöver

En ikon med ett lås inuti en sköld, omgiven av en cirkel med färgövergång från rött till blått, som symboliserar säkerhet eller skyddat innehåll.

Uppfyller lagar och regler kring dataskydd

En ikon med en våg inuti en cirkel med färgövergång från rött till blått, som symboliserar rättvisa, balans eller etiska principer.

Datagenerering med mycket hög säkerhet i Sverige

Dataanvändning har en enorm potential, men omfattas också av en rad utmaningar. Lagar och regler styr hur känslig och personlig information kan samlas in, sparas och användas. För att kunna skapa AI-innovation med sådana data krävs ofta en omfattande anonymisering, som är både komplicerat och dyrt.

Verkliga verksamhetsdata kan innehålla fel, vara partisk eller inte ha den kvalitet som krävs för att göra verksamheter mer datadrivna. Samtidigt kan upphovsrättsskyddet begränsa användningen av viss typ av data.

I många fall är det både opraktiskt eller juridiskt omöjligt att testa system med känsliga data, vilket begränsar innovation och utveckling. För att hantera alla dessa utmaningar kan syntetiska data vara ett mycket bra alternativ.

Vi på CGI har stort fokus på AI- och maskininlärningsprojekt och hjälper kunder både med datatillförsel och hela projekt. Inom dataområdet samarbetar vi också med forskare och universitet, bland annat inom området datakvalitet för syntetiska data. Vill ni diskutera datautnyttjande, AI-projekt eller bara uppdatera er kring hur ni kan accelerera agila utvecklingsprocesser och innovation, kontakta gärna någon av våra experter.