Digitalizace knihovních fondů dle standardů


KAITOS dává paměťovým a dalším institucím do rukou nástroj, který zefektivní, zautomatizuje, zpřesní a standardizuje podstatnou část dnes ručně či polo-automaticky prováděné práce. Pro vytěžování informací využívá neuronové sítě, díky kterým se zvýší nejen množství informací, ale také spolehlivost jejich detekce. Jádrem jsou neuronové sítě, které digitalizují, označují a extrahují informace z archiválií kulturního dědictví. Umělá inteligence celý proces automatizuje. Nahrazuje činnosti, které dříve byly zpracovány zásadně manuálně.


Klíčové vlastnosti

✔ Detekce a předzpracování skenů, klasifikace a rozpoznání typů stran (preprocessing) a analýza rozložení obsahu dokumentu.

✔ Zařazení digitalizovaných předloh do předem definovaných tříd (např. obsahová stránka knihy, ilustrace, titulní strana novin apod.).

Rozpoznání logických bloků (záhlaví, zápatí či grafické elementy).

✔ Úprava ořezu a vyrovnání, vytěžení textového obsahu strany (Sémantické OCR).

Indexace obsahu strany (OLR) zaručující efektivnější vyhledávání.

✔ Strukturování a uložení vytěžených informací do standardních formátů.

Generování PSP balíčků (Producer Submission Package) pro následný export do digitální knihovny.


Rozpoznání pozice logických bloků

Klasifikace typu stran, vytěžení a automatická detekce textu.


KAITOS poskytuje kompletní nástroje pro digitalizaci knihovních, archivních a muzejních sbírek podle aktuálních standardů a lze jej snadno přizpůsobit konkrétním potřebám jednotlivých institucí. Vestavěná workflow a řada automatizačních prvků předurčují systém pro produktivní využití v digitalizačních projektech libovolného rozsahu.


3 základní moduly


Umělá inteligence nahrazuje manuální práci

Kaitos zastupuje ořez, rovnání textu, klasifikuje typy stran, zpracování metadat (OCR) automatizovanými procesy. Umělá inteligence umožní vytvořit velké množství metadat v krátkém čase. Výstupem je exportovaný PSP balíček (Producer Submission Package) dle standardů NDK (Národní digitální knihovny). KAITOS je vyvíjen pro potřeby univerzit, knihoven, muzeí nebo digitalizačních jednotek po celém světě.


Operátor přechází do role manažera

Veškerá časově náročná ruční práce (ořez a narovnání, klasifikace stran, generování balíčků …) je zcela nahrazena umělou inteligencí.


Konvoluční a rekurenční neuronové sítě

Konvoluční neuronové sítě dosahují v oblasti rozpoznávání obrazu nevídaných výsledků: klasifikace obrázků, detekce objektů, čtení textů či rozpoznávání obličejů a dalších.

Pro účely čtení textů jsou využity rekurentní neuronové sítě, které jsou díky vnitřní reprezentaci stavu vhodné pro rozpoznávání sekvencí.


Vyvíjené společně s vědeckými institucemi

Vývoj KAITOS zabezpečuje společnost EXON ve spolupráci se Západočeskou univerzitou a společností AMITIA.


Kontaktujte nás