Թվանշային գրադարան
- aramhayr
- Aug 12, 2025
- 5 min read
Updated: 1 day ago
Ներածություն
Թվանշացման նպատակը ոչ թե ֆիզիկական որեւէ գործիքի էլեկտրոնային կրկնապատկերումն է, այլ թվանշային տեխնոլոգիաների օգնությամբ նոր ֆունկցիաների ավելացումը եւ եղածների բարելավումն ու ընդլայնումը:
Թվանշային (էլեկտրոնային) գրադարանը (ԹԳ) գրքերի կորպուս է` այսինքն ունի տեքստային կորպուսի բոլոր հնարավորությունները (տես Text corpus հատվածը Linguistic Information Processing System-ում) գումարած կատալոգի ֆունկցիաները: Քանի որ որոնումը (կատալոգում` ֆիզիկական («թղթային») գրադարաններում) ամենակարեվոր ֆունկցիան է, հատուկ ուշադրություն կդարձնենք թվանշային որոնման հնարավորություններին:
Այստեղ մանրամասվում են ԹԳ կառուցման այն առանձնահատկությունները, որոնք նոր ֆունցիոնալ հնարավորություններ են տալիս:
Տարբերենք թվայնացումն ու թվանշացումը (տես Եզրույթներ )` առաջինը անալոգ պատկերի թվային գրանցումն է, իսկ երկրորդը` այդ պատկերի թվային նշաններով (թվանշաններով, տառերով, կետադրական նշաններով, ևն) ներկայացումն է: Վերջինս հնարավորություն է տալիս տեքստի հետ տարբեր գործողություններ` սրբագրում, որոնում, պիտակավորում, ևն, կատարել:
Մասնավորապես, գրադարանի հատորներում իմաստային (բովանդակային) որոնումը արժեքավոր է թվում, հատկապես, գիտնական-ուսումնասիրողների համար:
Առանձնահատկութունները
Շտեմարանի կառուցվածքը
ԹԳ շտեմարանի կառուցվածքը պայմանավորված է բնագրի տպագրական տեսքը պահպանելու պահանջով: Սա հակասություն է ստեղծում որակյալ թվանշացման համար, քանի որ միշտ չէ, որ հնարավոր է թվանշացված տարբերակում վերարտադրել տպագրի արտաքինը: Ամենաակնհայտ պատճառը թվանշային ֆոնտերի բացակայությունն է` ինչքան ավելի հին է գիրքը, այնքան ավելի քիչ հավանական է համապատասխան ֆոնտի առկայությունը:
Խնդրի լուծման լավագույն տարբերակն է տվյալների երկու` պատկերային եւ տեքստային, շտեմարանների իրացումը.

ԹԳ այս ճարտարապետությունը լավագույն փորձ (best practices) է համարվում: Այսպես են կազմակերպված տեխնոլոգիականորեն զարգացած երկրների առաջատար (մայր) գրադարանները:
Թվայնացված (MASTER) մասում պահվում են գրքերի պատկերները, որոնցից կարելի է թղթային բնագիրը վերականգնել (տպագրել): Թվանշացված (DIGITAL) մասում պահպանվում են որոնելի եւ NLP (ալգորիթմային մշակման) համար տարբերակները: Սրանք կարելի է ստանալ OCR Data Pipeline-ի օգնությամբ, որը հնարավորություն է տալիս տողադարձի հեռացումը եւ տվյալների այլ մաքրում: Տվյալների մաքրումը կարեվոիր է ինչպես որոնման շարժիչի, այնպես էլ ԱԲ որակը (ճշգրտությունը) բարձրացնելու համար:
Հայաստանի գրադարանների թվանշացման պահանջները այլ են` հիբրիդային PDF-ներով կառուցված շտեմարան, որտեղ մետատվյալները, տեքստի պատկերը, եւ թվանշանները գտնվում են նույն ֆայլում:
Որոնում
ԹԳ-ում ինդեքսավորվում են ոչ միայն գրքերի (պարբերականների) մետատվյալները (ֆիզիկական գրադարանի նման)` վերնագիր (անուն), հեղինակ, ոլորտ, ևն, այլ նաեւ պարունակությունը: Վերջինը հնարավորություն է տալիս որեւէ ֆրազայի որոնում կատարել գրքի էջերի կամ նույնիսկ պարբերությունների ճշտությամբ: Բացի այդ, կատալոգը ոչ թե կարծրագրվում է վերաբերական (relational) շտեմարանի (կամ դարակներով բաշխված քարտերով), այլ կառուցվում է որոնման շարժիչով:
Այսպիսով ԹԳ-ն կարելի դիտարկել որպես երկու փոփոխվող (դինամիկ) տվյալների եւ մեկ ծանոթագրային (ստատիկ) տեսակների`
Հատորը էջերի (պարբերությունների (?)) բաժանած` ամեն էջը (պարբերությունը) մի պարզ տեքստային ֆայլ
Հատորի մետատվյալները` մատենագիտական գրառումները
Թեմատիկ վերնագրերի (միգուցե և բանալի բառերի), ծառատիպ կառուցվածքը մատենագիտական գրառումներում համակարգված գործածության համար (օրինակ՝ Դյուիի տասնորդական կամ Կոնգրեսի գրադարանի, կամ այլ դասակարգում):
Ժամանակակից որոնման շարժիչների հատկությունները ամփոփված են այս հարցազրույցում:
Կատալոգ
ԹԳ կատալոգը հատորների մատենագիտական գրառումները տվյալների պարզ տեքստային ֆայլերի ֆիզիկապես ոչ կարգավորված հավաքածու է: Այն չի հենվում ստորադասական (սովորական ֆայլային պնակների (folder) համակարգ), վերաբերական (տվյալների շտեմարան` relational database), կամ որեւէ այլ շտեմարանների կառուցվածքի վրա: Այն կարող է ձեռակերտ լինել (գրադարանավարն է կատարում դասակարգումը եւ մուտքագրումը) կամ ԱԲ օգնությամբ` ինքնաշխատ:
Այս մոտեցումը ծայրաստիճան ճկուն եւ հարմար է թե՛ մուտքագրելու, եւ թե՛ որոնելու համար:
Մատենագիտական գրառումների հիմնօրինակումը` #3 նախորդ հատվածում, ապահովում է կատալոգման հետեւողականությունը եւ տրամաբանականությունը:
ԹԳ կատալոգը ոչ թե կարծրագրվում է, այլ կառուցվում որոնման շարժիչով, որը հիմնվում է ինդեքսավորված մետատվյալների վրա, որոնք «թղթային» գրադարաններում կատալոգի քարտում են գրանցվում:
Դիտարկում. Էսպեսի «ГОСТ 7.76-96 Система стандартов по информации, библиотечному и издательскому делу. Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения. Росстандарт» մի բան պետք է որպես ՀՀ-ՊՀՕ մշակել: Նաեւ Վիքիպեդիայի Գրադարանավարություն (Գրադարանային գիտություն), Հայ Գրադարանավարության պատմություն, եւ Կատալոգավորում հոդվածներ (կամ/եւ դիսերտացիաներ) գրել:
Պարունակության որոնում
Հատորի պարունակությունը անցնում է գրանշանների ճանաչման համակարգով, սրբագրվում, եւ կտրատվում է էջերի: Էջերը ավելացվում են հակադարձ ինդեքսի որոնման շարժիչին մատչելի դառնալու համար:
Որոնման շարժիչը ապահովում է թե նշանների շարանի որոնում (այսիքն տողերի մակարդակով, ինչպես հինավուրց որոնող շարժիչներ էին անում մինչեւ 2023 թ.) եւ սեմանտիկ (իմաստային): Կարելի է շարահյուսական (սինտակտիկ) որոնում ավելացնել, սակայ սա ավելի սազական է լեզվաբանական կորպուսներին:
Հասանելիություն
Այն երկրները, որոնք փափագում են Եւրոպական քաղաքակրթության մաս դառնալ (բայց նաֆթ չունեն), պետք է ապահովեն իրենց տարածքում գործածվող ծրագրային համակարգերի հասանելիությունը (տե՛ս Հումանիտար տեխնոլոգիաների կայքէջեր, #1, Ընդհանրական) ապահովել: ԹԳ-ն պետք է գրքերի ձայնային տարբերակի (audiobook) ապահովի տեսողային խնդիրներ ունեցողների համար: Կա կարծիք (տե՛ս #5 Հայերեն տեքստը բանավոր խոսքի վերածում), որ այդպիսի տեխնոլոգիաներ հայերենի համար ստեղծված է:
Սակայն ձայնային գրքերը հարմար են ոչ միայն հաշմանդամների համար: Հասարակ մարդիկ վազելիս, հեծանիվ կամ մեքենա քշելիս, կուզենան լսել գրքեր, իսկ ուսանողը, օրինակ` աստվածաբանության պատմության քննության Գավառից Աշտարակ գնալուց կարող է Ե.Կողբացու «Եղծ աղանդոց»-ը լսել եւ գերազանց գնահատական ստանալ Ակադեմիական քաղաք ժամանելուն պես:
Գրադարանի անդամակցությունը կտրուկ կավելանա:
Հատուկ գործածումներ
Բացի գրքերի եւ նրանց պարունակության որոնման որակական տարբերությունից, ԹԳ-ն կտրամադրի մի շարք նոր ծառայություններ`
Հեղինակային իրավունքի վերահսկողություն
Ըստ պահանջի հատորի լրիվ կամ մի մասի տպագրություն (հինավուրց Xerox տեխնոլոգիայի փոխարեն)
Բնագրերի որակի պահպանում` հին եւ արժեքավոր գրքերի վերականգնում (տե՛ս Հավելվածը):
Գրքերի գործածման գնահատում եւ շարակարգում (ինչքա՞ն հաճախ է գիրքը կարդացում, ո՞վ է կարդում, ևն):
Գրքերի աննոտացիաները կամ ամփոփումները կարելի է մոտ 200 լեզուներով ինքնաշխատ թարգմանել եւ կատալոգին կից պահել: Մարդիկ կարող են լրիվ թարգմանություններ պատվիրել, որոնք րոպեների ընթացքում կարելի է կատարել եւ վաճառել:
Հավելված
Այս հավելվածում ներկայացված է մի օրինակ հին թերթերի եւ գրքերի անորակ [լուսա]նկարները ժամանակակից ԱԲ-ի օգնությամբ վերականգնելու հնարավորությունները:
Ժողովուրդ օրաթերթի 1918 թ. N 34 (Ազգային գրադարան) առաջին էջից վերցված լուսանկարը`
ԱՒՍՏՐՕ-ՀՈՒՆԳԱՐԻՈՅ ՊԱՏԵՐԱԶՄԻՆ ՊԱՏԱՍԽԱՆԱՏՈՒՆԵՐԸ

Այդ նույն լուսանկարը ԱԲ-ի (Perplexity.ai) օգնությամբ վերականգված (որակը լավն է, ճշտությունը` ոչ այդքան)`
ԱՒՍՏՐՕ-ՀՈՒՆԳԱՐԻՈՅ ՊԱՏԵՐԱԶՄԻՆ ՊԱՏԱՍԽԱՆԱՏՈՒՆԵՐԸ

Մէջտեղը գտնւողն է Աւստրիոյ Քարլ կայսրը, իսկ շուրջինները՝ Արհիդուքս Էօժէն (թիւ 1), գերման զօրավար Պիւլօմ (թիւ 2), Արհիդուքս Էօժէն (3), զօրավար Քօնրատ (4), զօր. Պորովիչ (5), զօր. Արձ (6):
[ԱՀ. Ենթադրաբար` ձախ ստորին օվալը թիւ 1-ն է: Թիւ 1-ն ու 3-ը նո՞ւյն են:]
Ահա բոյլը այն ոճրագործ մարդկանց որոնք իրենց ոճրագործ ծրագիրներու համար ստեղծեցին համաշխարհային սպանդը։ Մարդիկ` որոնք տակաւին երեկ` իրենց մասին մեկ շարժումով կրնային արար աշխարհ դողացնել՝ այսօր իբրեւ մեղապարտներ դեպի բանտ, դեպի աքսոր, եւ թերեւս դեպի՝ Կիյյօրին եւ կամ կախաղան կառաջնորդւին, ահոնց կողմէ, որոնց միլիոններու տեղ չունին, քանի դիակներուն վրայ բարձրացնել կուզեին իրենց փառքի եւ զեխութեան գահը:
Իսկ Թուրքիոյ ոճրագործները, օ՜, անոնք մտահոգւելու տեղ չունին քանի որ, ապահով են թե այս երկնքին տակ, ոչ մեկ արդար պիտի գտնւեր, որ համարձակեր իրենց վրայ առաջին քարը ներելու:
[ԱՀ. Վերականգված տաբերակը հեշտ չէր ստանալ` Improve the quality of the attached photo; ԱԲ զգայապատրանքների համար դեղ-ու-դարման ունեցողներին խնդրում ենք օգնել:]
Comments