Milzīgā kolekcija viduslaiku ebreju manuskripti Kairas Geniza, kā to dēvē, piedzīvo pagrieziena punktu, pateicoties mākslīgajam intelektam. Pēc gadu desmitiem, kad varēja viegli piekļūt tikai nelielai daļai materiāla, tagad ir pieejama šāda kombinācija: masveida digitalizācija Un teksta atpazīšanas sistēmas patiesi sāk atvērt šo unikālo arhīvu pētniekiem un plašai sabiedrībai.
Kas vēl nesen šķita kā sapnis filologiem un vēsturniekiem — spēja meklēt, lasīt un salīdzināt Ideja padarīt simtiem tūkstošu viduslaiku ebreju fragmentu pieejamus no jebkura datora ir kļuvusi par konkrētu projektu. Izmantojot Izraēlas Nacionālās bibliotēkas Ktiv platformu un MiDRASH programmu, ir ģenerētas praktiski visu Genizas fragmentu sākotnējās transkripcijas, un pašlaik notiek sagatavošanās darbi to pārskatīšanai, uzlabošanai un publiskai publicēšanai.
Gigantisks viduslaiku arhīvs, beidzot salasāms
Zvans Kairas Geniza Tā tiek uzskatīta par lielāko un daudzveidīgāko saglabājušos viduslaiku ebreju dokumentu kolekciju pasaulē. Gandrīz tūkstoš gadus Ēģiptes galvaspilsētas ebreju kopiena tur glabāja reliģiskus, juridiskus, komerciālus un literārus tekstus, kurus, pateicoties tradīcijai neiznīcināt rakstus Dieva vārdā, nevarēja vienkārši izmest. Rezultātā radās kolekcija, kuras lielums mūsdienās tiek lēsts aptuveni [trūkst skaitļa]. 400.000 fragmenti, lielā mērā saglabājies, pateicoties Ēģiptes sausajam klimatam.
Neskatoties uz tās nozīmīgumu, kolekcija ir izmantota tikai daļēji: līdz nesenam laikam mazāk nekā trešdaļa materiāla bija katalogizēta un tik tikko 10–15 % bija transkripts salasāms. Ar pārējiem, lai arī tie bija digitalizēti un pieejami attēlu formātā, joprojām bija grūti sistemātiski strādāt, jo viduslaiku ebreju manuskriptu kursīvā vai puskursīvā lasīšana prasa lielu pieredzi un laiku.
Projekta jaunā fāze maina šo ainavu. Balstoties uz Ktiv infrastruktūru — visu zināmo ebreju manuskriptu digitālo datubāzi, ko pārvalda Izraēlas Nacionālā bibliotēka —, starptautiska komanda ir izstrādājusi automātiskās transkripcijas sistēmas spēj pārvērst šos fragmentus par meklējams digitālais tekstsvismaz pirmajā versijā, kas pēc tam tiks pilnveidota.
Saskaņā ar iestādes publiskotajiem datiem, jau ir ģenerēti sākotnējie transkripti praktiski visiem Kairas Genizas elementiem, kā arī tūkstošiem papildu ebreju manuskriptu iegūts no citām viduslaiku kolekcijām. Nozarei, kas vairāk nekā gadsimtu bija strādājusi pa daļām, mēroga lēcienu ir grūti pārvērtēt.
MiDRASH: Mākslīgais intelekts un humanitārās zinātnes ebreju manuskriptu kalpošanā
Šīs transformācijas centrā ir MiDRASH (Tekstuālo un rakstu tradīciju migrācija, izmantojot viduslaiku manuskriptu liela mēroga skaitļošanas analīzi senebreju rakstībā), kas ir starpdisciplinārs projekts kas apvieno speciālistus no Izraēlas un Eiropas. Iniciatīva tika uzsākta 2023. gadā, pateicoties 10 miljonu eiro ERC Synergy dotācijai, ko uz sešiem gadiem piešķīra Eiropas Pētniecības padome, un tā ir pirmā šāda veida dotācija, kas īpaši veltīta ebreju studijām.
MiDRASH mērķis neaprobežojas tikai ar vecu tekstu pārrakstīšanu. Kā skaidro viens no tās direktoriem, profesors Daniels Stökls Ben Ezra, mērķis ir Grāmatas viduslaiku ebreju literārās kultūras rekonstrukcija, izsekojot, kuri autori citē citus, kā rabīnu komentāri (midraši) cirkulē starp musulmaņu un kristiešu kopienām vai kā gadsimtu gaitā tiek pārveidotas rakstiskās tradīcijas.
Lai to panāktu, komanda ir izvēlējusies strādāt atvērtā pirmkoda platformā. ScriptoriumSistēma, kas paredzēta manuskriptu un uzrakstu automātiskai transkripcijai, izstrādā īpašus viduslaiku ebreju rakstības modeļus, kas apmācīti tūkstošiem transkripciju, kuras speciālisti manuāli apkopojuši daudzu gadu garumā. Rezultāts ir sistēma, kas spēj segmentēt rindas un vārdus senos attēlos un pārvērst tos rediģējamā tekstā.
Atbildīgie uzsver, ka, lai gan sākotnējās transkripcijas satur kļūdas — kas ir neizbēgami neregulāra rokraksta, salauztu fragmentu vai izbalējušas tintes gadījumā —, to praktiska lietderība Tas ir milzīgs: tie ļauj ātri atrast Bībeles fragmentus, Talmuda sadaļas, vēstules, līgumus vai liturģiskos tekstus, kas iepriekš prasīja pacietīgu lasīšanu lappuse pēc lappuses.
No mikrofilmām līdz atvērtām platformām: garš ceļš

Pašreizējā digitālā revolūcija viduslaiku ebreju manuskripti Tas neradās no zila gaisa. Pati Izraēlas Nacionālā bibliotēka atceras, ka jau 1950. gadā premjerministra Dāvida Ben Guriona vadībā tika izveidots Mikrofilmēto ebreju manuskriptu institūts. Tā kā nebija reāli fiziski pārvietot visas kolekcijas uz Jeruzalemi, risinājums bija nofotografēt pēc iespējas vairāk kolekciju mikrofilmā, liekot pamatu lielam vizuālajam arhīvam.
Gadu desmitu laikā daži tika iekļauti 1.500 kolekcijas Sākot ar 2006. gadu, Kairas Genizas materiāli tika integrēti tā sauktajā Frīdberga Genizas projektā, kas paātrināja to sistemātisku digitalizāciju. 2014. gadā Nacionālā bibliotēka sāka pārveidot savu fotoarhīvu digitālā kolekcijā, kas pieejama tiešsaistē, ļaujot pirmo reizi jebkuram lietotājam tiešsaistē meklēt un apskatīt tūkstošiem ebreju manuskriptu.
MiDRASH tieši balstās uz iepriekšējo darbu. Izmantojot Ktiv infrastruktūru, kas jau ir apvienojusi lielāko daļu zināmo ebreju manuskriptu vienā datubāzē, komanda izmanto algoritmus, kas atbilst šādiem kritērijiem: automātiska mācīšanās lai identificētu burtus, vārdus un teksta struktūras. Šī centralizēta arhīva un modernu skaitļošanas rīku kombinācija ļauj izvairīties no vienas no galvenajām problēmām, kas pastāv citās jomās, piemēram, arābu manuskriptu izpētē, kur materiāls ir daudz izkliedētāks.
Dr. Cafra Sjeva, Nacionālās bibliotēkas pētniecības projektu vadītāja, definē MiDRASH kā patiesu locījuma punkts ikvienam, kas strādā ar viduslaiku ebreju manuskriptiem. Viņaprāt, solis uz priekšu ir ne tikai piekļuves atvieglošana, bet arī tādu analīzes veidu iespējošana, kas milzīga mēroga dēļ nebija iespējamas, kad katrs dokuments bija jālasa ar roku un gandrīz vienatnē.
Starptautiskās sadarbības un transkripcijas semināri
MiDRASH projekts darbojas kā starptautisks konsorcijs, apvienojot tehniskās un humanitārās zināšanas. Galveno pētnieku vidū ir profesors Nahums Deršovics (Telavivas Universitāte), Dr. Avi Šmidmans (Barilānas Universitāte) un profesore Judita Olšova-Šlangere (Oksfordas Universitāte), kā arī komandas no Haifas Universitātes, Izraēlas Nacionālās bibliotēkas un Prinstonas Geniza projekts, kuras režisore ir profesore Marina Rustova.
Šī iniciatīva nebūt neaprobežojas tikai ar laboratorijas darbu, bet arī paver iespējas sabiedrības līdzdalībai. No 24. līdz 27. novembrim Jeruzalemē tika organizēts liela mēroga pasākums ar tiešsaistes straumēšanu. “Transkripcijas maratons” koncentrējas uz viduslaiku un mūsdienu ebreju manuskriptiem kursīvā un puskursīvā rakstībā. Šo sesiju laikā apmācīti brīvprātīgie pārskata un labo mākslīgā intelekta ģenerētās transkripcijas.
Šai sadarbības pieejai ir divējāds mērķis. No vienas puses, uzlabot kvalitāte un precizitāte No vienas puses, tiek analizēti paši teksti; no otras puses, cilvēku veiktas korekcijas tiek izmantotas, lai tālāk apmācītu atpazīšanas modeļus, lai nākotnē samazinātu kļūdu skaitu un labāk atpazītu pat visproblemātiskākās rokas. Ideja ir tāda, ka sistēma pamazām mācās no filologu, paleogrāfu un ebreju valodas speciālistu uzkrātās pieredzes.
Izraēlas Nacionālā bibliotēka ir norādījusi, ka Kairas Genizas galīgie transkripti tiks iekļauti Ktiv un darīti pieejami sabiedrībai kopā ar oriģinālie attēli katra manuskripta. Tādā veidā jebkurš pētnieks var salīdzināt ierīces redzamo ar faksimilā redzamo, saglabājot caurspīdīgumu un ļaujot veikt jaunus lasījumus vai labojumus nākotnē.
Jauni jautājumi vecam stāstam
Kad masveida transkripcijas fāze ir pabeigta, projekta vadītāji vēlas sasniegt daudz vairāk nekā tikai piekļuvi. Plāns ir spēt veikt lingvistiskā un tekstuālā analīze plašā mērogā: atklājot citātu ķēdes, identificējot parafrāzas, rekonstruējot ideju maršrutus vai sekojot noteiktu teoloģisko un juridisko motīvu evolūcijai gadsimtu gaitā.
Praksē tas nozīmē, ka viduslaiku ebreju manuskripti vairs nav tikai atsevišķi gabali plauktos vai digitālajos arhīvos un sāk funkcionēt kā savstarpēji savienotu tekstu tīklsMākslīgais intelekts palīdz atrast modeļus, līdzības un atkārtošanās, kas tīri individuālā lasījumā būtu zudušas, savukārt speciālisti sniedz vēsturisko un filoloģisko kontekstu, lai interpretētu šo saistību nozīmi.
Dažas no komandas īpašajām interesēm ietver midrašu, rabīnu stāstu un komentāru, kas cirkulēja ebreju kopienās musulmaņu un kristiešu teritorijās, trajektorijas izsekošanu. Spēja kartēt, kā viena un tā paša teksta versijas atšķiras atkarībā no reģiona vai laikmeta, paver durvis uz labāku izpratni par... kultūras kontakti, iekšējie konflikti un doktrinārās interpretācijas, kas notika viduslaikos.
Pētnieki uzstāj, ka mašīntranskripcija, pat ar tās nepilnībām, ir tikai sākums. Uz šī pamata būs iespējamas turpmākas izstrādes. salīdzinošie pētījumi vārdu krājumu, sintakses vai rakstīšanas stilu, bet arī sociālās un ekonomiskās analīzes, kuru pamatā ir vēstules, komerclīgumi vai juridiskie dokumenti, kas līdz šim tik tikko bija sistemātiski pētīti.
Globālā ietekme un iespējas Eiropai
Lai gan projekts tika aizsākts un tiek koordinēts no Izraēlas puses, tā ietekme pilnībā attiecas uz Eiropas akadēmisko kopienu. ERC Synergy dotācija, kas finansē MiDRASH, ir daļa no Eiropas Savienības politikas atbalstīt digitālās infrastruktūras humanitārajām zinātnēm, un vairāki vadošie pētnieki strādā universitātēs Francijā, Apvienotajā Karalistē un citās valstīs.
Eiropas speciālistiem Vidusjūras vēstures, viduslaiku jūdaisma vai klasiskā islāma jomā šāda visaptveroša un meklējama datubāze ir būtiska pārmaiņa. Līdz šim musulmaņu teritorijās dzīvojošo ebreju kopienu dzīves rekonstrukcija, kur musulmaņi vispār dzīvoja, bija sarežģīts uzdevums. 90% viduslaiku ebreju iedzīvotāju— Tas prasīja ceļošanu un ierobežotu piekļuvi arhīviem. Līdz ar Ktiv pakāpenisku atvēršanu liela daļa šo materiālu kļūst pieejama no jebkuras universitātes pilsētiņas vai pētniecības centra.
Turklāt MiDRASH izstrādātā metodoloģija piedāvā modeli, ko var paplašināt uz citām Eiropas dokumentu kolekcijām: sākot no latīņu manuskriptu kolekcijām līdz notāru vai baznīcas arhīviem. Ideja apvienot digitalizāciju, automātisko transkripciju un publisko sadarbību parādās kā… atkārtojams maršruts saglabāt un pētīt citus mantojuma objektus, kuriem draud bojāeja.
Projekta vadītāji ir pārliecināti, ka rezultātu publicēšana recenzētos zinātniskos žurnālos nostiprinās šo pieeju akadēmisko standartu ietvaros. Tikmēr brīva piekļuve Attēli un transkripcijas sola veicināt kopīgu darbu starp universitātēm Izraēlā, Eiropā un Amerikā, radot plašākus pētniecības tīklus ap viduslaiku ebreju manuskriptiem.
Mākslīgā intelekta attīstība, kas pielietota Kairas Genizas un citu ebreju manuskriptu tapšanā, pārveido gandrīz nepārvaldāmu arhīvu par dzīvs un augošs avotsTas, kas kādreiz prasīja gadiem ilgu rūpīgu lasīšanu, tagad ir izsekojams dažu sekunžu laikā, nemazinot eksperta darba nozīmi, bet drīzāk otrādi: tas atbrīvo laiku sarežģītāku jautājumu uzdošanai un padziļinātai mantojuma interpretācijai, kas pamazām pārstāj būt apslēpts dārgums un kļūst par kopīgu resursu globālā mērogā.
