Pokud podnikáte, ručně přepisujete data z přijatých faktur. Datum, částka, IČ, variabilní symbol, splatnost. U 30 faktur měsíčně to je hodina práce navíc – a nejhorší je, že je to nudná, repetitivní práce, ze které se nikdo nepoučí. AI to dnes umí za vteřinu a často s vyšší přesností než unavený člověk. Pojďme se podívat, jak to funguje.

Jak vypadá tradiční zpracování přijaté faktury

  1. Dodavatel pošle PDF e-mailem.
  2. Stáhnete soubor na disk.
  3. Otevřete fakturační systém, kliknete "Nová přijatá faktura".
  4. Z PDF ručně opíšete: dodavatele, IČ, DIČ, číslo dokladu, datum vystavení, datum splatnosti, datum zdanitelného plnění, VS, KS, částku bez DPH, sazbu, DPH, celkem, kategorii.
  5. Nahrajete PDF jako přílohu.
  6. Uložíte.

Jedna faktura: 2–3 minuty. Třicet faktur měsíčně: 60–90 minut. Ročně: 12–18 hodin. A to počítáme, že vás nic nevyruší.

Jak fungují tradiční OCR řešení (a proč nejsou ono)

OCR (Optical Character Recognition) existuje desítky let a umí převést obrázek textu na text. Ale OCR samo o sobě nepřemýšlí – jenom čte písmena. Pokud na faktuře stojí:

Datum vystavení: 15. 3. 2026
Datum splatnosti: 29. 3. 2026
DUZP: 15. 3. 2026

OCR vám vrátí ten samý text. Stejně si pak musíte ručně rozhodnout, kde je VS, kde je číslo faktury a kde je datum. OCR nerozumí struktuře dokumentu, jen čte. Proto starší automatické OCR nástroje měly přesnost 60–70 % – polovinu jste si stejně musel opravit a často byste to ručně napsal rychleji.

Co změnily moderní LLM (GPT, Claude)

Velké jazykové modely (LLM) – GPT-4, Claude, Gemini – posunuly hru o dvě úrovně. Místo "převádím obrázek na text" tyto modely "rozumí obsahu textu". Když jim dáte fakturu, nečtou pixely – rozumí, že "Datum vystavení" je metadat o vystavení, "Datum splatnosti" je termín platby, IČ je 8 čísel, DIČ začíná na CZ. Z neuspořádaného textu vytáhnou strukturovaná data.

Co AI v moderním fakturačním systému dělá:

  1. Z PDF extrahuje text (běžné OCR nebo přímo text vrstvu PDF).
  2. Pošle ho LLM s instrukcí: "Vytáhni z této faktury dodavatele, IČ, číslo dokladu, datum, částku, VS, splatnost. Vrať mi to ve struktuře JSON."
  3. LLM vrátí pole s daty.
  4. Systém je předvyplní do formuláře, vy jen zkontrolujete a potvrdíte.

Reálná přesnost je u dobře navrženého systému 92–98 %. To znamená, že u 9 z 10 faktur stačí jen kliknout "Uložit". U té desáté zkontrolujete a opravíte jeden údaj. Úspora času: 2 minuty na fakturu → 10 sekund.

Speciální případ: ISDOC příloha v PDF

Část českých fakturačních systémů (Pohoda, Money S3, Helios) umí do PDF přibalit XML strukturu ve formátu ISDOC. To je strukturovaná verze faktury – přesný popis položek, sazeb a částek bez nutnosti čtení textu. Když faktura má embedded ISDOC, parsing je 100% přesný a okamžitý – AI v tomto případě ani není potřeba. Moderní systém tohle automaticky detekuje a preferuje ISDOC před AI.

Co s GDPR? Kam se posílá obsah faktury?

Toto je zásadní otázka. AI modely jako GPT-4 běží na serverech v USA a Irsku. Když systém pošle obsah faktury OpenAI, technicky tam ten dokument odešle přes internet. Co s tím:

  • Žádná osobní data – faktura mezi B2B (firma → firma) typicky neobsahuje osobní údaje fyzických osob. Obsahuje IČ, název firmy, částku. To není osobní údaj v GDPR smyslu.
  • OpenAI Data Privacy – OpenAI ve svých business termínech garantuje, že vstupní data nepoužívá pro trénink modelu a po krátké době je maže.
  • Možnost vypnout – v dobrém systému máte možnost AI parsing vypnout úplně. Pak data zůstávají jen u vás a faktury si zpracujete ručně.
  • Datacentrum aplikace v ČR – samotný fakturační systém by měl běžet v Evropě/ČR. Daturo provozuje databázi v datacentru vshosting~ v České republice.

Pokud zpracováváte faktury obsahující osobní údaje (B2C s jménem konkrétní fyzické osoby), AI parsing zvažujte opatrněji. Pro většinu B2B fakturace je to bezpečné.

Kde má AI hranice a kdy to neudělá

  • Velmi rozbité PDF – pokud je PDF skenované z papíru pod ostrým úhlem, OCR předtím zvládne jen 50 % textu. AI z toho pak vyčte málo.
  • Cizojazyčné faktury – modely zvládnou angličtinu, němčinu, slovenštinu skvěle. Exotičtější jazyky méně.
  • Atypické formáty – ručně psané dodací listy, paragony z restaurací, faktury bez standardní hlavičky. Tady AI tipuje, ne extrahuje.
  • Více faktur v jednom PDF – některé systémy posílají 5 faktur v jednom PDF jako přílohu. Většina parserů zachytí jen první.

Kolik konkrétně ušetříte

Měsíční počet přijatých fakturBez AIS AIÚspora
1020–30 min2 min~25 min/měsíc
3060–90 min5 min~75 min/měsíc
1003–5 h20 min~4 h/měsíc
30010–15 h1 h~12 h/měsíc

Závěr

AI rozpoznávání přijatých faktur není sci-fi ani drahá hračka – je to dnes základní funkce, kterou by měl mít každý moderní fakturační systém. U 30 faktur měsíčně ušetří hodinu, u 100 faktur čtyři hodiny. Klíč je vybrat systém, který:

  • Má AI integrovanou nativně, ne jako placený doplněk.
  • Nejprve zkusí ISDOC (přesnost 100 %) a teprve pak AI.
  • Umožňuje AI vypnout, pokud chcete data držet jen u sebe.
  • Provozuje aplikaci samotnou v EU/ČR datacentru.

Daturo splňuje všechna čtyři. V tarifu Basic máte 30 AI parsování měsíčně, v Pro neomezeně. Provozujeme v Karlových Varech, data v ČR, plná GDPR compliance. Když si k tomu přidáte automatické párování plateb z banky, máte celou administrativu pokrytou.