Pokud podnikáte, ručně přepisujete data z přijatých faktur. Datum, částka, IČ, variabilní symbol, splatnost. U 30 faktur měsíčně to je hodina práce navíc – a nejhorší je, že je to nudná, repetitivní práce, ze které se nikdo nepoučí. AI to dnes umí za vteřinu a často s vyšší přesností než unavený člověk. Pojďme se podívat, jak to funguje.
Jak vypadá tradiční zpracování přijaté faktury
- Dodavatel pošle PDF e-mailem.
- Stáhnete soubor na disk.
- Otevřete fakturační systém, kliknete "Nová přijatá faktura".
- Z PDF ručně opíšete: dodavatele, IČ, DIČ, číslo dokladu, datum vystavení, datum splatnosti, datum zdanitelného plnění, VS, KS, částku bez DPH, sazbu, DPH, celkem, kategorii.
- Nahrajete PDF jako přílohu.
- Uložíte.
Jedna faktura: 2–3 minuty. Třicet faktur měsíčně: 60–90 minut. Ročně: 12–18 hodin. A to počítáme, že vás nic nevyruší.
Jak fungují tradiční OCR řešení (a proč nejsou ono)
OCR (Optical Character Recognition) existuje desítky let a umí převést obrázek textu na text. Ale OCR samo o sobě nepřemýšlí – jenom čte písmena. Pokud na faktuře stojí:
Datum vystavení: 15. 3. 2026 Datum splatnosti: 29. 3. 2026 DUZP: 15. 3. 2026
OCR vám vrátí ten samý text. Stejně si pak musíte ručně rozhodnout, kde je VS, kde je číslo faktury a kde je datum. OCR nerozumí struktuře dokumentu, jen čte. Proto starší automatické OCR nástroje měly přesnost 60–70 % – polovinu jste si stejně musel opravit a často byste to ručně napsal rychleji.
Co změnily moderní LLM (GPT, Claude)
Velké jazykové modely (LLM) – GPT-4, Claude, Gemini – posunuly hru o dvě úrovně. Místo "převádím obrázek na text" tyto modely "rozumí obsahu textu". Když jim dáte fakturu, nečtou pixely – rozumí, že "Datum vystavení" je metadat o vystavení, "Datum splatnosti" je termín platby, IČ je 8 čísel, DIČ začíná na CZ. Z neuspořádaného textu vytáhnou strukturovaná data.
Co AI v moderním fakturačním systému dělá:
- Z PDF extrahuje text (běžné OCR nebo přímo text vrstvu PDF).
- Pošle ho LLM s instrukcí: "Vytáhni z této faktury dodavatele, IČ, číslo dokladu, datum, částku, VS, splatnost. Vrať mi to ve struktuře JSON."
- LLM vrátí pole s daty.
- Systém je předvyplní do formuláře, vy jen zkontrolujete a potvrdíte.
Reálná přesnost je u dobře navrženého systému 92–98 %. To znamená, že u 9 z 10 faktur stačí jen kliknout "Uložit". U té desáté zkontrolujete a opravíte jeden údaj. Úspora času: 2 minuty na fakturu → 10 sekund.
Speciální případ: ISDOC příloha v PDF
Část českých fakturačních systémů (Pohoda, Money S3, Helios) umí do PDF přibalit XML strukturu ve formátu ISDOC. To je strukturovaná verze faktury – přesný popis položek, sazeb a částek bez nutnosti čtení textu. Když faktura má embedded ISDOC, parsing je 100% přesný a okamžitý – AI v tomto případě ani není potřeba. Moderní systém tohle automaticky detekuje a preferuje ISDOC před AI.
Co s GDPR? Kam se posílá obsah faktury?
Toto je zásadní otázka. AI modely jako GPT-4 běží na serverech v USA a Irsku. Když systém pošle obsah faktury OpenAI, technicky tam ten dokument odešle přes internet. Co s tím:
- Žádná osobní data – faktura mezi B2B (firma → firma) typicky neobsahuje osobní údaje fyzických osob. Obsahuje IČ, název firmy, částku. To není osobní údaj v GDPR smyslu.
- OpenAI Data Privacy – OpenAI ve svých business termínech garantuje, že vstupní data nepoužívá pro trénink modelu a po krátké době je maže.
- Možnost vypnout – v dobrém systému máte možnost AI parsing vypnout úplně. Pak data zůstávají jen u vás a faktury si zpracujete ručně.
- Datacentrum aplikace v ČR – samotný fakturační systém by měl běžet v Evropě/ČR. Daturo provozuje databázi v datacentru vshosting~ v České republice.
Pokud zpracováváte faktury obsahující osobní údaje (B2C s jménem konkrétní fyzické osoby), AI parsing zvažujte opatrněji. Pro většinu B2B fakturace je to bezpečné.
Kde má AI hranice a kdy to neudělá
- Velmi rozbité PDF – pokud je PDF skenované z papíru pod ostrým úhlem, OCR předtím zvládne jen 50 % textu. AI z toho pak vyčte málo.
- Cizojazyčné faktury – modely zvládnou angličtinu, němčinu, slovenštinu skvěle. Exotičtější jazyky méně.
- Atypické formáty – ručně psané dodací listy, paragony z restaurací, faktury bez standardní hlavičky. Tady AI tipuje, ne extrahuje.
- Více faktur v jednom PDF – některé systémy posílají 5 faktur v jednom PDF jako přílohu. Většina parserů zachytí jen první.
Kolik konkrétně ušetříte
| Měsíční počet přijatých faktur | Bez AI | S AI | Úspora |
|---|---|---|---|
| 10 | 20–30 min | 2 min | ~25 min/měsíc |
| 30 | 60–90 min | 5 min | ~75 min/měsíc |
| 100 | 3–5 h | 20 min | ~4 h/měsíc |
| 300 | 10–15 h | 1 h | ~12 h/měsíc |
Závěr
AI rozpoznávání přijatých faktur není sci-fi ani drahá hračka – je to dnes základní funkce, kterou by měl mít každý moderní fakturační systém. U 30 faktur měsíčně ušetří hodinu, u 100 faktur čtyři hodiny. Klíč je vybrat systém, který:
- Má AI integrovanou nativně, ne jako placený doplněk.
- Nejprve zkusí ISDOC (přesnost 100 %) a teprve pak AI.
- Umožňuje AI vypnout, pokud chcete data držet jen u sebe.
- Provozuje aplikaci samotnou v EU/ČR datacentru.
Daturo splňuje všechna čtyři. V tarifu Basic máte 30 AI parsování měsíčně, v Pro neomezeně. Provozujeme v Karlových Varech, data v ČR, plná GDPR compliance. Když si k tomu přidáte automatické párování plateb z banky, máte celou administrativu pokrytou.