Ako čítať kurent a používať Transkribus
Kompletný sprievodca pre amatérskych genealógov a milovníkov histórie
V tomto článku sa dozviete, ako sa naučiť čítať kurent ale aj postup ako efektívne používať nástroj Transkribus pri dávkových spracovaniach textu.
Prečo je čítanie starých dokumentov dôležité pre genealógiu?
Mnoho historických dokumentov, ktoré obsahujú cenné informácie o predkoch, je napísaných rukou a v písme, ktoré je pre moderného čitateľa neznáme. Najmä v strednej Európe sa často stretneme s tzv. kurentom – špecifickým typom staronemeckého rukopisného písma, ktoré sa používalo až do 20. storočia.
Amatérskych genealógov láka naučiť sa čítať tieto dokumenty. Je to pre nich výzva a vďaka moderným nástrojom a online zdrojom sa to dá zvládnuť aj bez odborného vzdelania. Základy čítania budete potrebovať každopádne. Ani moderné technológie ktoré nám v tomto môžu pomôcť, nie sú stopercentne úspešné, ani keď ich v čítaní aktívne trénujete.
Čo je kurent a ako ho rozpoznať?
Kurent (Kurrent) je staronemecké rukopisné písmo, ktoré sa vyznačuje špecifickým tvarom písmen, ktoré sa výrazne líšia od latinky. Používal sa najmä v nemecky hovoriacich oblastiach a v čechách do konca dävatnásteho storočia, čo zahŕňa aj územia dnešného Slovenska.
Typické znaky kurentu:
- „e“ vyzerá ako malé „n“
- „s“ má dva tvary: dlhé a krátke (podobné f alebo s)
- „h“ má slučku smerom hore
- „z“ sa často zamieňa s „y“
Rozpoznať kurent chce tréning, ale s praxou sa to dá zvládnuť. Nižšie uvádzam niekoľko tipov, ako sa naučiť čítať kurent.
Genealogické čítanky a tréning písma pre začiatočníkov
Existuje niekoľko dostupných zdrojov, ktoré pomáhajú čítať kurent:
Odporúčam vytlačiť si tabuľky písmen v kurente a porovnávať ich priamo s dokumentom, ktorý čítate. Pomáha tiež pravidelne precvičovať – ideálne so známym textom ako sú matriky, sobášne listy alebo domové knihy. Ideálne je ak sa v tomto písme naučíte aj písať, pretože takto sa výrazne zlepšíte pri čítaní horšie napísaných textov. Získate cit pre spájanie písmen neobviklé nadpájanie zhora, ale aj na nedotiahnuté ťahy ktoré sa často objavujú.
Automatické čítanie rukopisov pomocou Transkribus
Transkribus je bezplatná platforma, ktorá využíva umelú inteligenciu na rozpoznávanie rukopisov. Je to ideálny nástroj pre genealógov, ktorí chcú spracovávať väčšie množstvo historických dokumentov bez toho, aby museli všetko manuálne prepisovať. Vždy ale platí, čo sa sami naučíte, vám pomôže pri korekciach automatizovaných spracovaní. Ako však účinne používať Transkribus vám ukážem nižšie.
Postup spracovania v Transkribus-e krok za krokom:
Vytvorte si účet na oficiálnej stránke Transkribus. Tu si stiahnite si desktopovú aplikáciu (alebo použite web verziu). Pripravte váš dokument (naskenovaný alebo fotografiu). Vyberte model rozpoznávania – pre kurent je ideálny model “German Kurrent”
vytvorte si novú kolekciu
pomenujte si ju, ja použijem scitanie
kliknite na Upload pre nahratie dokumentu
vyhľadanie dokumentu alebo pretiahnutie do programu
zobrazenie súborov v projekte na spracovanie
zvolenie postupu
náhľad dokumentu
zvolenie rozpoznávacieho modelu
formát rozpoznávania oblastí dokumentu
spustenie rozpoznávania
proces
konečný výstup
Výhody Transkribusu:
- Podpora mnohých jazykov vrátane nemčiny, latinčiny, maďarčiny ale aj slovenčíny a češtiny
- Automatické rozpoznávanie rukopisného textu (HTR - Handwritten Text Recognition)
- Možnosť vytvárať vlastné modely rozpoznávania
Nevýhody
- Oklieštený mód vo free verzii
- Vysoká cena aj pre školské použitie
Tipy pre efektívne učenie a čítanie historických textov
- Začnite s dokumentmi, ktoré už poznáte (napr. sobášne záznamy vašich prarodičov)
- Vytvorte si vlastný slovník – zapisujte si najčastejšie slová a ich tvar v kurente
- Nebuďte na to sami – využite genealogické fóra a skupiny na Facebooku. Zároveň však nebudte lenivý. Ak zadáte dotaz kde napíšete čo ste ako prečítali a s čím potrebujete pomôct je lepšie ako sa okázať na celý snímok a čakať kto to za vás prečíta.
- Netrápte sa, keď niečo neprečítate hneď – aj odborníci nie všetko prečítaju hneď. Zvyčajne však pomáha väčšie množstvo textu na natrénovanie