Nedávno mě pan ředitel oslovil s problémem, že musí řešit zveřejňování smluv v novém registru a že je potřeba, aby smlouvy byly v otevřeném a strojově čitelném formátu.
Dle metodiky jsou povoleny tyto formáty:
Portable Document Format | |
Word 97-2003 | .doc |
Office Open XML | .docx |
Rich Text Format | .rtf |
OpenDocument Text | .odt |
Plain Text | .txt |
Já jsem se rozhodl využívat formáty . docx a .pdf . Zadaný úkol má dvě roviny, a to jak publikovat nové smlouvy a jak publikovat staré smlouvy, případně smlouvy, které nemáme v původní elektronické podobě.
1) Nové smlouvy
Vyřešení tohoto problému je velice jednoduché, Microsoft Word 2016, případně jiná verze, zde menu Soubor – Exportovat – Vytvořit soubor PDF/XPS
Jako ukázku uvádím psaní tohoto článku, kdy jsem vytvořil pdf formát ve strojově čitelném formátu. Zkusil jsem v prohlížeči Edge najít slovo Nové a byly nalezeny tři výskyty.
Dle požadavků nemusí smlouva obsahovat podpisy, ale musí být ve stejném znění jako podepsaná. Podpisy bychom i tak mohli přidat, například jejich naskenováním do stávajícího dokumentu.
2) Stávající smlouvy či smlouvy, kde nemáme zdrojový text.
Zde již budeme muset využít i aplikace třetích stran, nicméně jsme schopni problém vyřešit i freewarem. Použil jsem aplikaci PDF-XChange Editor, který jsem stáhl ze Slunečnice viz. odkaz http://www.slunecnice.cz/sw/pdf-xchange-viewer/ Důležitá vlastnost jakéhokoliv takového nástroje je OCR, které umí rozpoznat písmo a udělat převod na text.
Původní smlouva byla naskenována jako obrazek a výstup byl pdf formát, ale grafický, tzn. nebylo možné vyhledávat strojově text. Po otevření v PDF-XChange menu Dokument a volba OCR jsem zvolil jazyk Czech a typ výstupu Zachovat původní obsah a přidat textovou vrstvu.
Ukázka smlouvy, kde není možné označit text:
Dále tlačítko OK. Objeví se okénko s rozpoznáváním textu.
Poté je již dokument připraven a má textovou vrstvu.
Takto upravenou smlouvu je možné nahrát do Registru smluv.
Karel Rejthar – MIE Expert