
Luotettava, tarkka ja nopea tiedon poiminta toimitetuista PDF-dokumenteista ja kuvista vaatii paljon työtä ja erikoistuneita työkaluja. CostPocketilla olemme kehittäneet robotin, joka hyödyntää useita edistyneitä teknologioita – kuten OCR:ää (optinen tekstintunnistus), koneoppimista, algoritmeja, yritystietokantoja, kielikohtaisia sääntöjä ja mallipohjia sekä tekoälyä – käsitellessään satojatuhansia dokumentteja joka kuukausi.
Vaikka CostPocket-sovellus tarjoaa paljon muutakin kuin pelkkää tiedon digitointia, voit integroida DIGI-palvelumme suoraan omiin järjestelmiisi, jos yrityksesi tarvitsee ainoastaan tiedon poimintaa. Lue lisää osoitteessa digi.costpocket.com.
CostPocketin digitointiprosessi kestää yleensä 3–5 sekuntia, pois lukien dokumentin latausaika, joka riippuu käytettävästä laitteesta ja internet-yhteydestä. Mikäli rivikohtainen digitointi on käytössä (laskuissa), tiedon poiminta voi kestää huomattavasti pidempään. Digitoinnin vakiovaiheet ovat:
Digitalisointiprosessi CostPocketilla kestää keskimäärin 2-3 sekuntia (pois lukien asiakirjan latausaika, joka riippuu käyttäjän laitteesta ja yhteydestä) ja jaetaan seuraaviin vaiheisiin:
1. Esimuotoiltu syöttö – kun useita tiedostotyyppejä tuetaan, syöttötiedosto esikäsitellään, jotta se on valmis digitointia varten (miten esimuotoilu tapahtuu, mitkä ovat erityisiä asioita).
2. Optinen merkintunnistus (OCR) - kaikki metatiedot sisältävä teksti (paikannus) poimitaan kuvasta
3. OCR-tuloksen jäsentäminen – CostPocketin sisäinen tekoälymalli analysoi ja merkitsee tunnistettavat tietorakenteet
4. Asiakirjan alkuperän ja kielen tunnistaminen – tietorakenteet noudattavat usein erilaisia kaavoja asiakirjan alkuperämaan mukaan. Tekoälymme on vuosien aikana oppinut paljon maakohtaisia tapauksia ja poikkeuksia
5. Kirjanpitotietojen purkaminen - CostPocket-tekoäly tunnistaa tietokentät yhdistämällä globaaleja tietorakennemalleja ja tekoälyn luomia sääntöjä, jotka liittyvät asiakirjan muotoon ja alkuperään.
6. Tietojen validointi - vahvistamme osan tietokentistä (yritystiedot, rekisteröinti- ja ALV-koodit, ALV-kanta jne.) julkisilla tietokannoilla
7. Tulosten palauttaminen - lähettäjä vahvistaa digitoidut tiedot ja tiedot lähetetään valittuun kirjanpito-ohjelmistoon
Tiedon tunnistamiseen käytettävät algoritmimme (vaihe 3) kehittyvät jatkuvasti. Päivitämme CostPocket-robottia viikoittain ihmisen varmentamalla datalla, jotta se voi oppia aiemmista virheistä ja parantaa tarkkuuttaan ajan myötä.
Esimerkki ladatusta kuitista ja tuloksista

Yllä olevasta kuitista CostPocketin tekoäly löysi ja digitoi seuraavat tiedot:
• Kuitin päivä: 2023-08-23
• Kokonaismäärä: 3,70
• ALV: 0,45
• Kuitin numero: 14099201
• Valuutta: EUR
• Toimittaja
○ Nimi: Scandic Hotels OY - Marski by Scandic
○ Osoite: Mannerheimintie 10
○ Postinumero: 00100
○ Yritystunnus: 1447914-7