21/02/2026
‼️‼️Przyszłość w Skanotece zaczyna się dziś – wprowadziliśmy tagowanie (indeksowanie) akt sądowych przez sztuczną inteligencję - AI, a do tego udostępniamy robioną przy okazji przez AI pełną transliterację i tłumaczenie wpisów.‼️‼️
𝐂𝐨 𝐣𝐮𝐳̇ 𝐣𝐞𝐬𝐭?
W ramach testów zostało obrobionych 5 jednostek (spis z linkami w komentarzu): jedna księga grodzka płocka, jedna nurska, jedna ciechanowska, jedna księga wójtowsko-ławnicza gminy Krowodrza, jedna taka księga jurydyki Garbary.
𝐉𝐚𝐤 𝐤𝐨𝐫𝐳𝐲𝐬𝐭𝐚𝐜́?
Przy tagach zrobionych przez AI pojawia się ikonka AI. Dla przypomnienia: tagi obejmują osoby (imię i nazwisko) i miejscowości i są przeszukiwalne z poziomu zespołu, z poziomu typu dokumentów (sądowe) oraz z poziomu całej Skanoteki.
W przypadku skanów obrobionych przez AI w prawym dolnym rogu pojawia się ikona „Pokaż tłumaczenie”. Po jej naciśnięciu podświetlają się zaznaczenia wpisów. Po kliknięciu na dany wpis wyświetli się jego transliteracja i tłumaczenie.
𝐂𝐨 𝐭𝐫𝐳𝐞𝐛𝐚 𝐦𝐢𝐞𝐜́ 𝐧𝐚 𝐮𝐰𝐚𝐝𝐳𝐞 𝐤𝐨𝐫𝐳𝐲𝐬𝐭𝐚𝐣𝐚̨𝐜 𝐳 𝐭𝐚𝐠𝐨́𝐰 𝐢 𝐭ł𝐮𝐦𝐚𝐜𝐳𝐞𝐧́?
Mogą zawierać błędy, czasem istotne – jest to nieuniknione na tym etapie rozwoju AI. Jednocześnie jesteśmy realistami i wiemy, że weryfikacja tagów przed ich publikacją, na masową skalę (a na taką skalę chcemy obrabiać księgi), nie mówiąc o weryfikacji transliteracji i tłumaczeń, jest nie do osiągnięcia: nie ma do tego wystarczająco dużo chętnych, z odpowiednią wiedzą (tłumaczenia). Dlatego wolimy już teraz udostępnić coś, co w dużej części jest prawidłowe, choć może zawierać błędy, niż czekać na ideał, którego osiągnięcie w praktyce będzie albo niemożliwe, albo będzie trwało latami.
Tagi można weryfikować: po zauważeniu błędu każdy zalogowany użytkownik może wprowadzić tag z prawidłowymi danymi („błędny” tag AI zostanie, użytkownicy nie mogą ich usuwać). Tagi AI jak i transliteracje i tłumaczenia mogą być w przyszłości przetworzone ponownie. Nowe tagi AI zastąpią wyłącznie tagi AI (tagi użytkowników nie będą usuwane ani nadpisywane).
𝐉𝐚𝐤 𝐛𝐞̨𝐝𝐳𝐢𝐞𝐦𝐲 𝐝𝐳𝐢𝐚ł𝐚𝐜́ 𝐝𝐚𝐥𝐞𝐣, 𝐜𝐨 𝐛𝐞̨𝐝𝐳𝐢𝐞 𝐨𝐛𝐫𝐚𝐛𝐢𝐚𝐧𝐞?
Na początek bardzo istotna uwaga: 𝐎𝐁𝐑𝐎́𝐁𝐊𝐀 𝐀𝐈 𝐍𝐈𝐄 𝐃𝐎𝐓𝐘𝐂𝐙𝐘 𝐀𝐊𝐓 𝐌𝐄𝐓𝐑𝐘𝐊𝐀𝐋𝐍𝐘𝐂𝐇. Z nimi AI sobie nie radzi (brak kontekstu) – pewien poziom błędów akceptowalny przy księgach sądowych, jest zupełnie nie do zaakceptowania przy metrykach - będą indeksowane jak dotychczas do Geneteki, nic się tu nie zmienia.
Na teraz obróbka dotyczy wyłącznie ksiąg sądowych (grodzkie, ziemskie, ławnicze, wiejskie, ewentualnie inne).
𝐉𝐚𝐤 𝐰𝐲𝐠𝐥𝐚̨𝐝𝐚 𝐨𝐛𝐫𝐨́𝐛𝐤𝐚?
Aby AI mogło zacząć swoją pracę, trzeba najpierw zaznaczyć ręcznie każdy tekst, który stanowi całość (te kolorowe prostokąty na zdjęciach poniżej). AI sobie z tym nie radzi, musimy to zrobić my. Jest to niezwykle proste, choć żmudne i czasochłonne (ze względu na ilość) zajęcie. Naszym celem jest przetłumaczenie wszystkich zespołów sądowych, jakie są (lub będą) w Skanotece. Nie chcemy więc robić pojedynczych ksiąg z różnych zespołów, tylko obrabiać je „blokami”, aby dostarczać efektywny wynik. Potrzebujemy więc Waszej pomocy – ochotników, którzy, będą oznaczali skany tymi „prostokątami”, co umożliwi ich obróbkę przez AI. Dodatkowo do każdego zespolu trzeba stworzyć listę nazwisk i miejscowości, które najczęściej występują w danym rejonie/zespole (to zmniejsza liczbę błędów).
Będziemy ogłaszać „nabory” na wybrane części zespołów ksiąg sądowych: na profilu FB Skanoteki, na naszym forum na stronie genealodzy pl, w Grupie na FB.
Oczywiście wszystko wytłumaczymy, choć podkreślamy – samo zajęcie jest banalnie proste i wymaga tylko dostępu do Internetu i rejestracji na naszej stronie.
Zapraszamy Was do wyboru pierwszej większej grupy ksiąg, którą poddamy obróbce: ankieta jest dostępna na forum na naszej stronie! Oczywiście pamiętajcie, że oprócz zagłosowania, potrzebujemy ochotników, którzy księgę oznaczą;-).
𝐊𝐨𝐬𝐳𝐭
Obróbka skanów przez AI (odczytywanie tekstu, transliteracja, tłumaczenie, tagi) jest płatną usługą (korzystamy z Gemini). Ten koszt ponosi PTG. Biorąc pod uwagę zamierzoną skalę obróbki – koszt będzie bardzo wysoki. Na początek, m.in. dzięki hojnemu wsparciu w postaci darowizn i przede wszystkim 1,5% przekazanemu w zeszłym roku – stać nas na to. Nie wiemy czy tak będzie mogło być cały czas – nie wykluczamy przeprowadzania np. zbiórek celowych na obróbkę konkretnych partii. To zależy od tego, jakie będą koszty przy obróbce na większą skalę. Tak więc proszę pamiętajcie o nas przy rozliczeniu PITa rocznego w tym roku i kolejnym latach, bo to na pewno pozwoli nam finansować w większym zakresie obróbkę AI.
Finalny produkt, jak zawsze u nas, będzie dostępny dla wszystkich, za darmo w Skanotece.
Zapraszamy do korzystania, włączajcie się w obróbkę skanów, weryfikację i poprawianie tagów, no i wesprzyjcie nas swoim 1,5% w tym roku! 𝐍𝐚𝐬𝐳 𝐧𝐫 𝐊𝐑𝐒: 𝟎𝟎𝟎𝟎𝟐𝟔𝟒𝟐𝟐𝟒