Big data: Môžu nové technológie pomôcť pri prenasledovaní daňových podvodov?

, the conversation Foto: getty images

Španielski daniari začiatkom februára oznámili, že nasadzujú analytický systém založený na veľkých dátach s cieľom odhaliť rôzne typy daňových podvodov.

Cyprus začal pracovať na odhaľovaní skutočných majiteľov, ktorí si svoje firmy zaregistrovali na ostrove a v najbližších mesiacoch chce spustiť register, v ktorom budú títo vlastníci prehľadne menovaní. Vznik tohto registra vyžaduje Európska únia v rámci boja proti praniu špinavých peňazí. Situácia v Španielsku je ale úplne iná. Každé autonómne spoločenstvo si okrem daní od centrálnej vlády môže uplatňovať aj dane vlastné. Špecifických autonómnych daní je asi 80, súčasťou komplikovaného daňového systému je aj viac ako 200 rôznych typov odpočtov.

Správa, že španielski daniari nasadzujú analytický systém na odhaľovanie daňových podvodov vyvolala rozruch z dvoch dôvodov. Na jednej strane šlo o nasadenie aplikácie inovatívnych technológií, o niečo, čo ovplyvňuje všetkých. Na druhej strane sa to časovo zhodovalo s oznámením známeho youtubera El Rubiusa s veľkým mediálnym ohlasom, že presúva svoje bydlisko do Andorry, kde je daň z príjmu fyzických osôb nižšia ako v Španielsku.

Je daňovým podvodom presun daňovej rezidencie do Andorry? Nie, pokiaľ sa zhoduje so  skutočným bydliskom danej osoby. Ak však tieto dve adresy nesúhlasia, mohlo by ísť o daňový podvod. Skúsený vyšetrovateľ, ktorý podrobne analyzuje daňovníka, bude vedieť, ako hľadať dôkazy na usvedčenie. Každá vystavená faktúra odhaľuje bydlisko zákazníka. Normálne je, že má svoju ekonomickú aktivitu vo svojej blízkosti. Ďalším kľúčom môže byť žiadosť o granty a dotácie spojené s konkrétnym miestom alebo obvyklý prenájom služieb na konkrétnom mieste. Aj keď to všetko sú iba orientačné údaje a nepredstavujú dôkaz o pobyte, ich prítomnosť zvyšuje podozrenie z podvodu a dôvod na „preklepnutie“. Takýto výskumný proces je však veľmi drahý a nedostupný pre nasadenie vo veľkom rozsahu. Správca dane však dostal nástroj ako procesy zautomatizovať. Nástroje založené na spracovaní „big data“ umožnili systematicky analyzovať pobyt osoby s cieľom zistiť jej prítomnosť na španielskom území prekračujúci 183 dní.

Mediálny dopad tejto správy bol evidentný. Vynorila sa otázka, či vôbec existuje reálna možnosť použitia veľkých objemov dát na tento cieľ. Inými slovami, akým výzvam je potrebné čeliť, aby sa mohla vo veľkej miere automatizovať analýza, ktorej sa doteraz mohol venovať iba skúsený inšpektor. Ako pri každom projekte analýzy údajov pre rozhodovanie, aj v tomto prípade je potrebné zohľadniť niekoľko technologických výziev, aby sa zaručil úspech. V tomto prípade sú to dostupnosť a správa údajov, analýza či infraštruktúra. Rozoberme si to na drobné.

Dostupnosť údajov a riadenie
Dostupnosť údajov je vždy základným kameňom každého projektu. Cieľom je zistiť, či sú údaje k dispozícii alebo je možné ich sprístupniť pomocou vhodnej metodiky, aby bolo možné spustiť plánované analýzy. Správca dane má veľké množstvo údajov vo forme vyhlásení o príjmoch a majetku pre veľkú väčšinu daňových poplatníkov. Kríženie týchto údajov umožňuje identifikovať „čudné veci“. Prečo daňový poplatník s bydliskom vo Valencii požadoval pomoc pri vzdelávaní detí v A Coruña v Galícii na severe Španielska? Prečo je väčšina klientov tohto daňovníka v A Coruňa? Údaje sú k dispozícii ale to nestačí. Je potrebné vedieť, ako ich spravovať, aby sa rôzne databázy správne prelínali. Je predovšetkým dôležité, aby katalógy údajov prešli procesom čistenia, známym ako správa údajov. Aj keď je pravda, že ide o veľmi zložitú úlohu, je to realizovateľný projekt ak je naň vyčlenená dostatočná investícia. V Španielsku ohlásili daniari tento nástroj v roku 2021, ale vopred museli mať vyriešenú správu údajov, na ktorej pravdepodobne pracovali už roky.

Analýza údajov
Zoberme si ako základ indikácie obvyklého pobytu faktory uvedené v predchádzajúcom príklade. Analýza založená na umelej inteligencii automaticky replikuje výskum, ktorý by inak musel robiť prácne odborník. Je možné vymeniť skúseného vyšetrovateľa za stroj, ktorý spoľahlivo zanalyzuje dokumentáciu? Techniky detekcie podvodov sú výskumnou témou s množstvom publikácií vo vedeckých časopisoch. Tieto techniky siahajú od jednoduchej aplikácie pravidiel filtrovania po zložité systémy neurónových sietí schopné detegovať anomálie s veľkou presnosťou. Napríklad práca zverejnená cez UNIR preukázala, že na zistenie podvodov pri dovoze a vývoze tovaru živočíšneho pôvodu je možné použiť techniky strojového učenia. Výskum preukázal 90 percentnú mieru skutočných pozitív, je teda plne možné použiť umelú inteligenciu pre tento typ analýzy údajov.

Infraštruktúra
Je ľahké analyzovať stovky záznamov, ale analyzovať státisíce už tak jednoduché nie je. Reakcia analytického systému musí byť rýchla a ak hovoríme o big data, musí sa správne nastaviť infraštruktúra. V Španielsku existuje okolo 20 miliónov daňovníkov, z ktorých každý má svoje bankové účty, ekonomické aktivity, nehnuteľnosti, dotácie… To znamená obrovské množstvo údajov. Toto množstvo údajov navyše rastie, ak vezmeme do úvahy vzťahy medzi nimi. Napríklad faktúra má vystaviteľa a platiteľa, čo znamená vzťah medzi dvoma protistranami. Problém je analyzovať 20 miliónov záznamov, zamerať sa vždy na osobitosti každého daňovníka a získať výsledok včas. Tento problém je zdá sa už vyriešený. Systém založený na technológii Apache Spark umožňuje distribuované spracovanie údajov a dáva systému škálovateľnosť potrebnú na riešenie problému, ako je analýza správania daňových poplatníkov v krajine.

Technológie a big data sú dobré argumenty, aby sme sa mohli domnievať, že správca dane má v rukách silný nástroj, ktorým určité problémy dokáže vyriešiť. Odhaľovanie podvodov prostredníctvom zozbieraných údajov je realitou a okrem iného umožní vystopovať nekalé činnosti spojené s falošnou daňovou rezidenciou.

 

Súvisiace články

Aktuálne správy