Projekt APVV-24-0049

Digitalizácia a inteligentná obsahová analýza historických dokumentov pre odbornú archívnu činnosť a historickú vedu

Trvanie projektu: 1. 9. 2025 – 31. 8. 2029

Univerzita Mateja Bela v banskej Bystrici, Filozofická fakulta

Riešiteľské organizácie:

Univerzita Mateja Bela v Banskej Bystrici, Štátny archív v Košiciach, Fórum inštitút pre výskum menšín v Šamoríne, Slovenská národná knižnica v Martine, Štátna vedecká knižnica v Banskej Bystrici

Zodpovedný riešiteľ:

doc. Mgr. Imrich Nagy (Filozofická fakulta UMB v Banskej Bystrici)

Spoluriešiteľ za ŠVKBB:

prof. PhDr. Dušan Katuščák, PhD.

Anotácia projektu:

Projekt DIGINARCH-AI nadväzuje na výsledky projektu APVV-19-0456 SKRIPTOR, ktorý overil možnosti využitia a úspešnosti nástroja AI Transkribus na automatickú transkripciu historických rukopisných a tlačených dokumentov z územia Slovenska a chce ponúknuť konkrétne riešenia pre zámery definované v oblasti ochrany archívneho dedičstva a digitalizácie štátnych archívov v rámci Národnej koncepcie rozvoja štátnych archívov s výhľadom do roku 2028 schválenej vládou Slovenskej republiky v roku 2022. DIGINARCH-AI sa zameria na oblasť modernizácie služieb bádateľom v štátnych archívoch prostredníctvom digitalizácie vybraných archívnych fondov a sprístupnenia ich obsahu pomocou nástrojov AI. Výstupmi projektu budú:

  • digitalizované a konzervované fondy pobočiek Slovenského osídľovacieho úradu deponované v Štátnych archívoch v Košiciach a Banskej Bystrici (sumárne v rozsahu približne 58 bežných metrov);
  • univerzálny model pre automatickú transkripciu historických strojopisných dokumentov slovacikálnej proveniencie z polovice 20. storočia s chybovosťou pod 3 % na úrovni znakov pomocou nástroja AI Transkribus;
  • digitalizovaný prepis približne 232 000 strán dokumentov;
  • inteligentný model sumarizácie kľúčových častí historických textov a ich následné prezentovanie prostredníctvom špecificky navrhnutej aplikácie;
  • obsahová analýza týchto dokumentov v historickom kontexte v podobe konferenčných a publikačných výstupov. Priamym odberateľom výsledkov projektu bude Ministerstvo vnútra SR. Impakt projektu však prostredníctvom plánovaných vzdelávacích, popularizačných a implementačných výstupov bude smerovať aj na ďalšie cieľové skupiny: odborných pracovníkov archívov, výskumníkov a študentov v oblasti historických vied, ako aj na širšiu verejnosť na Slovensku a v Maďarsku.

Projekt APVV-22-0130

Šľachtické knižnice 18. a 19. storočia na západnom a strednom Slovensku

Trvanie projektu: 2023 – 2027

Univerzita Komenského v Bratislave, Filozofická fakulta

Zodpovedná riešiteľka:

doc. Mgr. Lucia Lichnerová, PhD. (Katedra knižničnej a informačnej vedy UK)

16 členov riešiteľského kolektívu (Univerzita Komenského, Trnavská univerzita, Univerzitná knižnica, Ústredná knižnica SAV, Pamiatkový úrad SR, Štátna vedecká knižnica v Banskej Bystrici)

Spoluriešiteľky za ŠVKBB:

Mgr. Mária Bôbová, PhD., Mgr. Monika Danková, PhD.

Cieľ projektu:

Zmapovať a spracovať doteraz nepreskúmané šľachtické knižnice z 18. a 19. storočia. Výskum sa zameria na územie stredného a západného Slovenska, kde sa nachádzajú mnohé historické knižničné fondy s mimoriadnou kultúrnou hodnotou. Projekt spája odborníkov z akademických, výskumných aj pamäťových inštitúcií naprieč rôznymi vednými disciplínami. Práve interdisciplinárny prístup dodáva výskumu jeho výnimočnosť – cieľom je ponúknuť ucelený pohľad na fungovanie, význam a vplyv šľachtických knižníc v dobovom spoločenskom a kultúrnom kontexte. Vedci sa zamerajú na knižničné dokumenty a fondy, ktoré sa zachovali buď ako celky, alebo boli rozptýlené medzi viaceré inštitúcie. Skúmajú, ako tieto knižnice vznikali, aké mali zloženie, akým spôsobom sa využívali a akú úlohu zohrávali v kultúrnom a spoločenskom živote svojej doby. Výskum má ambíciu prispieť k lepšiemu poznaniu úlohy šľachty v prenose kultúrnych a spoločenských zmien v 18. a 19. storočí.

Čiastkový výskum v ŠVKBB sa sústreďuje na výskum súkromnej knižnice šľachtického rodu Radvanských. Rod, ktorého pomenovanie je odvodené od obce a neskôr zemepanského mestečka Radvaň (od 1966 mestská časť Banskej Bystrice), patrí medzi autochtónnu šľachtu historickej Zvolenskej stolice. Počiatky knižnice siahajú do začiatku 17. storočia, pričom v priebehu storočí sa jej fond rozrástol na zhruba 5000 zväzkov. Medzi jej najhodnotnejšie tituly patrili tlače z 15. – 16. storočia, rukopisy a kalendáre zo 17. – 18. storočia. Najpočetnejšia časť zbierky sa dnes nachádza v Štátnom archíve v Banskej Bystrici.

Ministerstvo kultúry Slovenskej republiky sa zapojilo do realizácie bilaterálnej iniciatívy v rámci Fondu pre bilaterálne vzťahy na národnej úrovni spolufinancovanej z Finančného mechanizmu EHP a Nórskeho finančného mechanizmu na roky 2014 – 2021.

Tlačová správa k projektu:  Link

Cieľom iniciatívy je vytvoriť inštitucionálnu spoluprácu medzi slovenskými knižnicami a vybranými knižnicami v Nórsku. Cieľom je výmena skúseností v oblasti spolupráce medzi knižnicami a stredoškolskými školami, ako aj výmena skúseností v oblasti ďalšieho odborného vzdelávania pracovníkov knižníc.

Iniciatíva plánuje rozvíjať bilaterálne vzťahy a cieli k vytvoreniu troch výstupov:

1. Analýza obsahujúca výsledky prieskumu a akčný plán pre ďalšiu partnerskú spoluprácu po skončení projektu.
2. Vytvorenie konceptu e-learningového vzdelávacieho nástroja, ktorého zámer bude zvýšiť rozvoj kvalifikácie zamestnancov pracujúcich v knižniciach.
3. Šírenie výstupov prezentované širokej odbornej verejnosti prostredníctvom medzinárodného stretnutia pre knihovníkov na Slovensku.

Obdobie realizácie: 01.11.2023 – 31.12.2024

Partneri iniciatívy:
Štátna vedecká knižnica v Košiciach
Štátna vedecká knižnica v Prešove
Štátna vedecká knižnica v Banskej Bystrici
Slovenská národná knižnica
Univerzitná knižnica v Bratislave
Elvebakken videregående skole
Raelingen bibliotek
Hartvig Nissens skole

Rozpočet: 57 455,60 EUR

https://www.culture.gov.sk/ministerstvo/medialny-servis/aktuality-ministerstva-kultury/projekt-libraryedu-ukazal-ze-medzinarodna-spolupraca-je-klucova-pre-zlepsenie-kvality-vzdelavania-a-prace-kniznic/

Inovatívne sprístupnenie písomného dedičstva Slovenska prostredníctvom systému automatickej transkripcie historických rukopisov

Štátna vedecká knižnica v Banskej Bystrici v spolupráci s Univerzitou Mateja Bela realizuje nový projekt “Inovatívne sprístupnenie písomného dedičstva Slovenska prostredníctvom systému automatickej transkripcie historických rukopisov”. (Číslo projektu: APVV-19-0456), ktorý je podporený Agentúrou na podporu výskumu a vývoja.

Zmluva o spolupráci pri riešení projektu a o podmienkach poskytnutia prostriedkov na riešenie projektu č. APVV-19-0456 (Evidenčné číslo zmluvy ŠVK  61/2020), podpísaná dňa 15.7. 2020.

Osoba zodpovedná za plnenie zmluvy:  prof. PhDr. Dušan Katuščák, PhD.

Projekt SKRIPTOR má európsku a národnú dimenziu.

Projekt chce implementovať a rozšíriť na Slovensku najnovšie technologické inovácie a poznatky z oblasti efektívneho sprístupnenia písomného dedičstva pre odbornú a všeobecnú verejnosť na Slovensku a v zahraničí.
Výstupy projektu SKRIPTOR budú zamerané na inovatívne sprístupnenie dokumentov a poznatkov o vedeckej komunikácii a intelektuálnom dedičstve novoveku a modernej doby širokej verejnosti a odbornej komunite.
Projekt SKRIPTOR bezprostredne nadväzuje na práve skončený európsky projekt READ, ktorý mal všetky atribúty metodológie digital humanities. Hlavným výstupom projektu READ je platforma Transkribus, v ktorej sa implementujú výsledky základného výskumu. Technologická a vedecká inovácia projektu READ je založená na využívaní umelej inteligencie, ako jednej z perspektívnych disciplín informatiky.
Strategickým cieľom projektu SKRIPTOR je vytvoriť na národnej úrovni predpoklady kompetentného partnerstva slovenských výskumníkov so špičkovým európskym výskumom, naštartovať a následne sa aktívne zapojiť do mnohostrannej vedeckej európskej spolupráce.

Projekt SKRIPTOR sa realizuje v odbore: História. Presah projektu je do odboru Knižničná a informačná veda (sociálne aspekty).

Projekt SKRIPTOR je zameraný najmä na novovek. Je vymedzený obdobím humanizmu, renesancie, protestantskej a katolíckej reformácie, rozmachu meštianstva a formovania národných štátov na našom území resp. v našom stredoeurópskom regióne. Medzi skúmané a sprístupnené zbierky však možno zahrnúť aj automatické rozpoznávanie textov novších tlačených a strojom písaných dokumentov, ako aj prvotlače (inkunábuly), tlače 16. storočia, historické časopisy, noviny, ako aj hodnotné materiály z 18.-20. storočia a pod. Po vynáleze kníhtlače síce ustupovala rukopisná tvorba, no napriek rozmachu tlače vznikalo aj naďalej veľmi veľké množstvo unikátnych rukopisných dokumentov, ako sú napríklad matriky, kroniky, katastrálne záznamy, zápisnice, časopisy ai., ktoré sú len v rukopisoch a predstavujú veľké, ale neprístupné archívne bohatstvo.

Originálnosť projektu je:

  1. a) v aplikácii poznatkov základného výskumu automatickej transkripcie na Slovensku,
  2. b) v tvorbe nových modelov automatického rozpoznávania textov pre transkripciu zbierok slovenských inštitúcií (latinčina, maďarčina, slovenčina, nemčina, čeština),
  3. c) tvorba datasetov pre domáce a medzinárodné systémy a databázy,
  4. d) potvrdenie doteraz dosiahnutých výsledkov, prípadne prispenie k zvýšeniu efektívnosti nástroja Transkribus,
  5. e) vytvorenie modelového archívu textov s reprezentatívnymi vzorkami textov historických dokumentov na účely experimentov,
  6. f) výskum korelácie kvality skenovania na efektívnosť automatickej transkripcie rukopisných a iných textov

Výskumnou témou a predmetom záujmu projektu SKRIPTOR sú historické dokumenty, písomné dedičstvo, jeho prieskum, výskum, digitalizácia, automatická transkripcia, uchovávanie a sprístupnenie.

Výskumným problémom projektu SKRIPTOR je tvorba čo najlepších modelov automatického rozpoznávania textov historických dokumentov, ktoré sa nachádzajú na Slovensku a predstavujú súčasť európskeho písomného dedičstva a ako doklady našej kultúry prezentujú našu kultúru v kontexte európskej vedy, kultúry, politiky, hospodárstva a vzdelávania.

Špecifickým výskumným problémom projektu SKRIPTOR je digitalizácia a atraktívna prezentácia určitých dokumentov pre širokú verejnosť.

Všeobecný rámcový cieľ projektu SKRIPTOR vychádza z poznania, že súčasná úroveň informačných a komunikačných technológií umožňuje efektívnejšie sprístupnenie písomného dedičstvo Slovenska.

Štátna vedecká knižnica v Banskej Bystrici je spoluriešiteľskou organizáciou pri plnení projektu SKRIPTOR podporeného Agentúrou na podporu výskumu a vývoja. Zodpovedným riešiteľom je doc. Imrich Nagy z Univerzity Mateja Bela v Banskej Bystrici. Spolu s ním sa na projekte podieľa kolektív historikov a knihovníkov.

Projekt Skriptor nadväzuje na európsky vedecký projekt READ (2016-2019). Základný výskum prebieha prostredníctvom platformy Transkribus založenej na metódach umelej inteligencie a strojového učenia. Celý projekt zahŕňa široké spektrum činností, od výskumu a digitalizácie dokumentov cez automatickú transkripciu až po uchovávanie a sprístupnenie písomného dedičstva.

Niekoľkoročný projekt je rozdelený do štyroch etáp s plánovaným ukončením v roku 2024. V roku 2020, v ktorom sme vyčerpali 15% z celkového rozpočtu projektu, sme uskutočnili prvú fázu pozostávajúcu hlavne z nákupu technickej podpory projektu, zvolenia výskumných tém a zbierok a oboznámenia sa so systémom Transkribus.

Vyhodnotenie prvého roku:

1. fáza: Analýza stavu poznania archívneho dedičstva a indikatívny prieskum zdrojov k problematike písomného dedičstva v slovenských pamäťových a fondových inštitúciách

Realizácia projektu s aktuálnou problematikou a jeho uplatnenie v praxi podporí sprístupnenie dokumentov vo vhodnom formáte pre používateľov.

V spolupráci s Univerzitou Mateja Bela v Banskej Bystrici participuje na projekte Inovatívne sprístupnenie písomného dedičstva Slovenska prostredníctvom systému automatickej transkripcie historických rukopisov (APVV-19-0456, skr. SKRIPTOR), ktorý podporila Agentúra na podporu výskumu a vývoja. Jeho zodpovedným riešiteľom je doc. Mgr. Imrich Nagy, PhD., prodekan pre vedeckovýskumnú činnosť Filozofickej fakulty UMB. Na projekte sa podieľa kolektív historikov a knihovníkov z oboch inštitúcií, za ŠVK sú nimi: prof. PhDr. Dušan Katuščák, PhD., PhDr. Blanka Snopková, PhD., Ing. Ivana Poláková, PhD., a Mgr. Mária Bôbová, PhD.
Štvorročný  projekt je rozdelený do 4 etáp s plánovaným ukončením v roku 2024.

V súčasnosti sme vo fáze prechodu z prvej (Analýza stavu poznania a prieskum zdrojov) do druhej etapy (Implementácia a zefektívnenie platformy Transkribus). Jednotliví riešitelia si zvolili výskumné témy, k nim prislúchajúce rukopisné zbierky a prostredníctvom školení a samoštúdia sa oboznámili so systémom Transkribus.
Druhá, najdlhšie trvajúca etapa zahŕňa viaceré kroky od heuristiky cez digitalizáciu a tvorbu modelov až po hodnotenie efektívnosti automatickej transkripcie, pričom program sa podľa tréningového súboru učí vzory písma a slov. Výsledok transkripcie je potom viditeľný a zhodnotený na testovacom datasete. Ak je uspokojivý, možno automaticky transkribovať ďalšie súbory alebo celú zbierku.
Automatická transkripcia ďalej slúži na vedecké editovanie, v ktorom je možné text korigovať, explicitne pridávať ďalšie dáta, kontextové informácie, dešifrovať dáta, tagovať, pridávať poznámky, metadáta, anotácie, opravovať diakritiku, skratky a pod.

V ŠVK prvé kroky v tejto etape vykonávame:  

–         na rukopisnej zbierke Collectanea z pozostalosti evanjelického kňaza, prekladateľa a náboženského spisovateľa Martina Laučeka (1732 – 1802), ktorú tvorí 22 zv. materiálu obsahujúceho cenné informácie najmä pre dejiny evanjelickej cirkvi.

–        na rukopisnej zbierke  archeológa, geológa, botanika a kňaza Andreja Kmeťa (1841-1907), ktorý sa podieľal na vzniku Slovenskej učenej spoločnosti v Martine. Okrem iného založil cirkevnú knižnicu, čitateľský spolok, ovocinársky spolok…

Na doterajšia práca  spočívala v pozornom a veľmi presnom prepisovaní najmä rukopisnej korešpondencie v editore podľa riadkov. Ľahšie i ťažšie čitateľné texty v slovenskom, nemeckom, maďarskom ale hlavne v latinskom jazyku sa prepisujú podľa súdobého jazykového úzu a gramatiky, aj s chybami. Zároveň pristupujme k tvorbe modelov a ich testovaniu.

V rámci projektu sa chceme zamerať aj na výskum rukopisných knižničných katalógov na príklade katalógu knižného fondu Kňazského seminára sv. Karola Boromejského v Banskej Bystrici. Dokument s názvom Elenchus librorum z 19. storočia obsahuje nielen dva katalógy knižnice, ale i prírastkové zoznamy dvoch významnejších akvizícií a výpožičný katalóg knižnice.

Svoje nové poznatky sme odprezentovali:
–  na vedeckej konferencii NON SCHOLAE, SED VITAE DISCIMUS… (knižná kultúra – osobnosti – školský život), ktorá sa uskutočnila dňa 7. júna 2021 v gescii  ŠVK v Prešove online formou.  Interdisciplinárna vedecká konferencia sa usporiadala pri príležitosti pripomenutia si udalostí spojených s Memorandom národa slovenského (1861), ktoré zachytili aj problematiku kultúrnych požiadaviek, otázky slovenského jazyka a jeho používania, ale aj školstvo. Odznel príspevok  s názvom – Projekt Skriptor, keď stroj sa stáva žiakom od autorky Mgr. Márii Bôbovej, PhD.
– v občasníku ŠVK s názvom Knižničné noviny (4/2020) v článku s názvom –  Zapojenie knižnice do nového výskumného projektu od autorky Mgr. Márii Bôbovej, PhD.