Revoluční nástroj pro digitalizaci knihovních fondů


KAITOS je moderní řešení postavené na nejnovějších poznatcích v oblasti umělé inteligence (artificial intelligence) pro zpracování digitalizovaných předloh a generování PSP – balíčků metadat (Producer Submission Package) dle standardů. KAITOS je vyvíjen pro potřeby univerzit, knihoven, muzeí nebo digitalizačních jednotek po celém světě.

KAITOS dává paměťovým a dalším institucím do rukou nástroj, který zefektivní, zautomatizuje, zpřesní a standardizuje podstatnou část dnes ručně či polo-automaticky prováděné práce. Pro vytěžování informací využívá neuronové sítě, díky kterým se zvýší nejen množství informací, ale také spolehlivost jejich detekce.


Jádrem jsou neuronové sítě, které digitalizují, označují a extrahují informace z archiválií kulturního dědictví. Umělá inteligence celý proces automatizuje. Nahrazuje činnosti, které dříve byly zpracovány zásadně manuálně.

Schéma zpracování dat kulturního dědictví v software KAITOS. Od naskenování předloh, přes ořez, narovnání, OCR, strukturování metadat, generování PSP balíčků až po export do digitální knihovny.

KAITOS poskytuje kompletní nástroje pro digitalizaci knihovních, archivních a muzejních sbírek podle aktuálních standardů a lze jej snadno přizpůsobit konkrétním potřebám jednotlivých institucí. Vestavěná workflow a řada automatizačních prvků předurčují systém pro produktivní využití v digitalizačních projektech libovolného rozsahu.


Klíčové vlastnosti

✔ Detekce a předzpracování skenů, klasifikace a rozpoznání typů stran (preprocessing) a analýza rozložení obsahu dokumentu.

✔ Zařazení digitalizovaných předloh do předem definovaných tříd (např. obsahová stránka knihy, ilustrace, titulní strana novin apod.).

Rozpoznání logických bloků (záhlaví, zápatí či grafické elementy).

✔ Úprava ořezu a vyrovnání, vytěžení textového obsahu strany (Sémantické OCR).

Indexace obsahu strany (OLR) zaručující efektivnější vyhledávání.

✔ Strukturování a uložení vytěžených informací do standardních formátů.

Generování PSP balíčků (Producer Submission Package) pro následný export do digitální knihovny.


Rozpoznání pozice logických bloků

Klasifikace typu stran, vytěžení a automatická detekce textu.


Umělá inteligence nahrazuje manuální práci

Kaitos zastupuje ořez, rovnání textu, klasifikuje typy stran, zpracování metadat (OCR) automatizovanými procesy. Umělá inteligence umožní vytvořit velké množství metadat v krátkém čase. Výstupem je exportovaný PSP balíček dle standardů NDK (Národní digitální knihovny).


Operátor přechází do role manažera

Veškerá časově náročná ruční práce (ořez a narovnání, klasifikace stran, generování balíčků …) je zcela nahrazena umělou inteligencí.


Konvoluční a rekurenční neuronové sítě

Konvoluční neuronové sítě dosahují v oblasti rozpoznávání obrazu nevídaných výsledků: klasifikace obrázků, detekce objektů, čtení textů či rozpoznávání obličejů a dalších.

Pro účely čtení textů jsou využity rekurentní neuronové sítě, které jsou díky vnitřní reprezentaci stavu vhodné pro rozpoznávání sekvencí.


Vývoj zabezpečuje společnost EXON

Vývojářem KAITOS je společnost EXON ve spolupráci se Západočeskou univerzitou a společností AMITIA. Digitalizace kulturního dědictví s důrazem na bezpečnost a kvalitu skenování. Využití nejmodernějších technologií pro digitalizaci. Skenování zabezpečují knižní skenery značky i2S.


Kontaktujte nás