Blog

Stopercentná kvalita je len ilúzia. Prečo je to tak?

19.11.2015

autor:   Miloš Duchoslav

Na otázku „Akú kvalitu údajov potrebujete?“ zvyčajne dostávam bez zaváhania odpoveď: „Samozrejme 100 %.“ Je to celkom prirodzená reakcia. Nikto predsa nechce údaje, ktoré obsahujú chyby.

Avšak každá minca má dve strany. Inak to nie je ani pri spracovaní údajov z papierových dokumentov. Technológie, ktoré sa využívajú pri takomto spracovaní, bohužiaľ, negarantujú kvalitu spracovania. Preto ak chceme dosiahnuť stopercentnú kvalitu, nezostáva nám nič iné ako údaje spracované technológiami ešte verifikovať. Tam, kde je to možné, využívame automatizované logické kontroly údajov. Sú veľmi efektívne najmä pri verifikovaní číselných údajov, ktoré sú navzájom previazané krížovými kontrolami, ako napr. v daňových priznaniach. Pre mnohé typy údajov je však jediným spôsobom verifikácie ich vizuálna kontrola ľudským okom. A vieme, že napriek úprimnému úsiliu človek je tvor omylný. Našťastie, pracovné postupy vieme navrhnúť tak, aby sme eliminovali aj tieto omyly. Ale predtým, než vynaložíme úsilie na to, aby sme sa priblížili k dokonalosti, si skúste zodpovedať dve otázky.

Skutočne potrebujete kvalitu údajov 100 %?
Samozrejme, na túto otázku môžete zodpovedne odpovedať len vy sami. Ale pozrime sa spolu na to, čo takáto požiadavka znamená v praxi. Jednostupňová vizuálna kontrola nikdy nezabezpečí stopercentnú presnosť. Preto potrebujeme pridať ďalšieho operátora, ktorý bude rovnakú sadu údajov spracovávať paralelne: zavádzame tzv. princíp štyroch očí. Následne sú dva nezávisle získané údaje porovnané a v prípade nesúladu systém vyzve operátora na ich korekciu. V prípade, že sú zhodné, ich považujeme za overené. Zjednodušene povedané dvojnásobným úsilím získame garanciu kvality blížiacu sa k 100 %.

Stačí vám kvalita 99 %?
Táto kvalita je zvyčajne dosiahnuteľná jednostupňovým spracovaním. Vieme ju získať s vynaložením len polovičného úsilia v porovnaní s predchádzajúcim prípadom.

Zjednodušene by sa dalo povedať, že 99 % sa už takmer blíži k 100 %, a teda kvalita je dostatočná. Čo však v skutočnosti dostaneme? 99 % pre znakovú kvalitu znamená, že zo 100 spracovaných znakov môže byť 1 znak chybný. Pokiaľ text, ktorý spracovávam, slúži na fulltextové vyhľadávanie, táto kvalita môže byť dostatočná lebo zvyčajne vedie k úspešnému vyhľadaniu požadovaného dokumentu. Ale čo v prípade, ak toto pole je jediným identifikátorom? Vtedy je táto kvalita neakceptovateľná.

Úroveň kvality je dôležitý parameter pri spracovaní údajov. Ovplyvňuje využiteľnosť týchto údajov na jednej strane, ale aj náklady na ich získanie na strane druhej. Je dôležité určiť túto úroveň pred samotným spracovaním, pretože zásadne ovplyvňuje návrh vhodného pracovného postupu. Ak máte údaje už spracované, ale ich kvalita je nedostatočná, vieme vám tieto údaje zverifikovať („opraviť“) a zvýšiť ich hodnotu.

Páčil sa Vám tento článok?

Napíšte Nám