KAITOS

Umělá inteligence pro digitalizaci kulturního dědictví


KAITOS je moderní řešení postavené na nejnovějších poznatcích v oblasti umělé inteligence (artificial intelligence) pro zpracování digitalizovaných předloh a generování PSP – balíčků metadat (Producer Submission Package) dle standardů. KAITOS je vyvíjen pro potřeby univerzit, knihoven, muzeí nebo digitalizačních jednotek po celém světě.

KAITOS dává paměťovým a dalším institucím do rukou nástroj, který zefektivní, zautomatizuje, zpřesní a standardizuje podstatnou část dnes ručně či polo-automaticky prováděné práce. Pro vytěžování informací využívá neuronové sítě, díky kterým se zvýší nejen množství informací, ale také spolehlivost jejich detekce.


Jádrem jsou neuronové sítě, které digitalizují, označují a extrahují informace z archiválií kulturního dědictví. Umělá inteligence celý proces automatizuje. Nahrazuje činnosti, které dříve byly zpracovány zásadně manuálně.

Schéma zpracování dat kulturního dědictví v software KAITOS. Od naskenování předloh, přes ořez, narovnání, OCR, strukturování metadat, generování PSP balíčků až po export do digitální knihovny.

KAITOS poskytuje kompletní nástroje pro digitalizaci knihovních, archivních a muzejních sbírek podle aktuálních standardů a lze jej snadno přizpůsobit konkrétním potřebám jednotlivých institucí. Vestavěná workflow a řada automatizačních prvků předurčují systém pro produktivní využití v digitalizačních projektech libovolného rozsahu.


Klíčové vlastnosti

✔ Detekce a předzpracování skenů, klasifikace a rozpoznání typů stran (preprocessing) a analýza rozložení obsahu dokumentu.

✔ Zařazení digitalizovaných předloh do předem definovaných tříd (např. obsahová stránka knihy, ilustrace, titulní strana novin apod.).

Rozpoznání logických bloků (záhlaví, zápatí či grafické elementy).

✔ Úprava ořezu a vyrovnání, vytěžení textového obsahu strany (Sémantické OCR).

Indexace obsahu strany (OLR) zaručující efektivnější vyhledávání.

✔ Strukturování a uložení vytěžených informací do standardních formátů.

Generování PSP balíčků (Producer Submission Package) pro následný export do digitální knihovny.


Rozpoznání pozice logických bloků

Klasifikace typu stran, vytěžení a automatická detekce textu.


Umělá inteligence nahrazuje manuální práci

Kaitos zastupuje ořez, rovnání textu, klasifikuje typy stran, zpracování metadat (OCR) automatizovanými procesy. Umělá inteligence umožní vytvořit velké množství metadat v krátkém čase. Výstupem je exportovaný PSP balíček dle standardů NDK (Národní digitální knihovny).


Operátor přechází do role manažera

Veškerá časově náročná ruční práce (ořez a narovnání, klasifikace stran, generování balíčků …) je zcela nahrazena umělou inteligencí.


Konvoluční a rekurenční neuronové sítě

Konvoluční neuronové sítě dosahují v oblasti rozpoznávání obrazu nevídaných výsledků: klasifikace obrázků, detekce objektů, čtení textů či rozpoznávání obličejů a dalších.

Pro účely čtení textů jsou využity rekurentní neuronové sítě, které jsou díky vnitřní reprezentaci stavu vhodné pro rozpoznávání sekvencí.


Vývoj zabezpečuje společnost EXON

Digitalizační oddělení EXON v Plzni. Digitalizace kulturního dědictví s důrazem na bezpečnost a kvalitu skenování. Využití nejmodernějších technologií pro digitalizaci. Skenování zabezpečují knižní skenery značky i2S.


Kontaktujte nás