CostPocketi digiteerimise protsess võtab aega kõigest 2-3 sekundit (võttes sellest maha dokumendi üleslaadimise aja, kuna see sõltub kasutaja seadmest ja interneti ühendusest) ja see sisaldab järgmisi tegevusi:
> Dokumendi eeltöötlemine- CostPocketi toetab mitmeid failiformaate: PDF, TIF, XML, DOCX, JPG, PNG, HTML. Digiteerimise sujuvaks toimimiseks salvestatakse dokumendid robotile sobivasse formaati.
> Optiline märgituvastus (OCR) - pildilt loetakse välja kogu tekst koos metaandmetega ehk teostatakse andmete positsioneerimine;
> OCR väljundi analüüsimine - CostPocketi nutikas mudel analüüsib ja otsib dokumendilt äratuntavaid andmestruktuure;
> Dokumendi päritolu ja keele tuvastamine - Andmestruktuur on sageli tulenevalt dokumendi väljastanud riigist erinev ning sellest tulenevalt üritab robot dokumendi päritolust ja keelest täpsemalt aru saada;
> Raamatupidamislike andmete leidmine - CostPocketi robot tuvastab andmeväljad tänu andmestruktuuri mustritele ja AI poolt genereeritud reeglitele, mis on spetsiifilised vastavalt kuludokumendi formaadile ja tema päritoluriigile;
> Andmete valideerimine - Robot kontrollib mõned andmeväljad (ettevõtte info, registrikood ja KMKR, käibemaksu protsendi, jne.), kasutades selleks liidestusi avalike andmebaasidega;
> Tulemuste tagastamine - Roboti poolt digiteeritud tulemused kuvatakse dokumendi sisestajale, kes saab andmed üle vaadata, kinnitada ning edastada need raamatupidamisprogrammi;
Meie robot õpib järhepidevalt uute andmete pealt, et täpsemaks muutuda. Söödame CostPocketi robotile iganädalaselt ette inimese poolt kinnitatud andmeid, et ta saaks õppida vigadest ja andmete tuvastust täiendada.
Näide sisendist: