Yandex õpetas närvivõrke dešifreerima arhiivikirjeid keeruka õigekirjaga
Varia / / April 03, 2023
Ajaloolised käsikirjad, mida inimesel on raske analüüsida, muudetakse tehisintellekti abil peaaegu hetkega trükitekstiks.
Yandex tõi turule uue teenuse nimega Arhiiviotsing, mis kasutab närvivõrke arhiivikirjete dešifreerimiseks revolutsioonieelse keerulise kirjapildiga.
Teenus võimaldab juurdepääsu enam kui 2,5 miljonile leheküljele ajaloolistele dokumentidele koos teksti ärakirjadega. Selle optilise märgituvastussüsteemi baasil üles ehitatud algoritm arvestab käekirja iseärasusi, tunneb ära aktuaalsuse kaotanud tähed ning mõistab arhiividokumentide eristruktuuri.
Ettevõtte spetsialistid koolitasid närvivõrku sadadest tuhandetest käsitsi kirjutatud ridadest koosneval andmemassiivil 18.–19. sajandi reaalsetest tekstidest ja kümnetest miljonitest genereeritud näidetest.
Käsikirjad, mida ettevalmistamata inimesel on raske sõeluda, muutub Yandexi tehnoloogia peaaegu koheselt trükitekstiks. Tänu sellele leiate teenuse andmebaasist kiiresti dokumendid, kus on märgitud perekonnanimi, asukoht või mõni muu sõna.
"Otsing arhiivides" tõhustab ajaloolaste, sotsioloogide, demograafide, genealoogide tööd ning on abiks neile, kes otsivad teavet oma perekonna kohta.
Esimene teenuses esitatud fond oli Moskva peaarhiiv - selle materjalide põhjal koolitasid arendajad närvivõrku. Andmebaasis on ka dokumendid Orenburgi ja Novgorodi oblasti arhiividest. Aja jooksul suureneb salvestusruumide ja saadaolevate skannitud failide arv.
Saate otsida 18. – 20. sajandi alguse materjale, mis on kasutajate seas kõige populaarsemad. Need on koguduse registrid, pihtimuslehed ja revisjonilood rahvaloenduse tulemustega. Dokumendid leiate kataloogist või otsinguriba kaudu. Seal on filtrid aastate, arhiivide, fondide ja varude järgi.
Iga lehe skannimise kõrval kuvatakse närvivõrkude tehtud rea-realt dekodeerimine. Kui hõljutate kursorit soovitud fragmendi kohal, tõstetakse see digitaalsel koopial kohe esile.