Digitalisointiprosessi CostPocketilla kestää keskimäärin 2-3 sekuntia (pois lukien asiakirjan latausaika, joka riippuu käyttäjän laitteesta ja yhteydestä) ja jaetaan seuraaviin vaiheisiin:
1. Esimuotoiltu syöttö – kun useita tiedostotyyppejä tuetaan, syöttötiedosto esikäsitellään, jotta se on valmis digitointia varten {miten esimuotoilu tapahtuu, mitkä ovat erityisiä asioita?}
2. Optinen merkintunnistus (OCR) - kaikki metatiedot sisältävä teksti (paikannus) poimitaan kuvasta
3. OCR-tuloksen jäsentäminen – CostPocketin sisäinen tekoälymalli analysoi ja merkitsee tunnistettavat tietorakenteet
4. Asiakirjan alkuperän ja kielen tunnistaminen – tietorakenteet noudattavat usein erilaisia kaavoja asiakirjan alkuperämaan mukaan. Tekoälymme on vuosien aikana oppinut paljon maakohtaisia tapauksia ja poikkeuksia
5. Kirjanpitotietojen purkaminen - CostPocket-tekoäly tunnistaa tietokentät yhdistämällä globaaleja tietorakennemalleja ja tekoälyn luomia sääntöjä, jotka liittyvät asiakirjan muotoon ja alkuperään.
6. Tietojen validointi - vahvistamme osan tietokentistä (yritystiedot, rekisteröinti- ja ALV-koodit, ALV-kanta jne.) julkisilla tietokannoilla
7. Tulosten palauttaminen - lähettäjä vahvistaa digitoidut tiedot ja tiedot lähetetään valittuun kirjanpito-ohjelmistoon
Huomaa, että algoritmisarjat tietojen tunnistukseen vaiheessa #3 kehittyvät jatkuvasti. Joka viikko syötämme tekoälyllemme ihmisen vahvistamia tietoja, jotta se voi oppia virheistään ja parantaa tunnistamistaan tulevaisuudessa.
Esimerkki ladatusta kuitista ja tuloksista
Yllä olevasta kuitista CostPocketin tekoäly löysi ja digitoi seuraavat tiedot:
• Kuitin päivä: 2020-08-23
• Kokonaismäärä: 38.08
• ALV: 6,61
• Kuitin numero: 1434421
• Valuutta: EUR
• Toimittaja
○ Nimi: Circle K Latvia SIA
○ Osoite: Riika, Duntes iela 6
○ Postinumero: LV-1013
○ Rekisteröintikoodi: 40003064094
○ ALV-koodi: LV40003064094