top of page
Search

Թվանշային գրադարան

Updated: 1 day ago





Ներածություն

Թվանշացման նպատակը ոչ թե ֆիզիկական որեւէ գործիքի էլեկտրոնային կրկնա­պատկերումն է, այլ թվանշային տեխնոլոգիաների օգնությամբ նոր ֆունկցիաների ավելացումը եւ եղածների բարելավումն ու ընդլայնումը:

Թվանշային (էլեկտրոնային) գրադարանը (ԹԳ) գրքերի կորպուս է` այսինքն ունի տեքս­տային կորպուսի բոլոր հնարավորությունները (տես Text corpus հատվածը ​Linguistic Information Processing System-ում) գումարած կատալոգի ֆունկցիաները: Քանի որ որոնումը (կատալոգում` ֆիզիկական («թղթային») գրադարաններում) ամե­նակարեվոր ֆունկցիան է, հատուկ ուշադրություն կդարձնենք թվանշային որոն­ման հնարավորություններին:

Այստեղ մանրամասվում են ԹԳ կառուցման այն առանձնահատկությունները, ո­րոնք նոր ֆունցիոնալ հնարավորություններ են տալիս:

Տարբերենք թվայնացումն ու թվանշացումը (տես Եզրույթներ )` առաջինը անալոգ պատ­կերի թվային գրանցումն է, իսկ երկ­րոր­դը` այդ պատկերի թվային նշաններով (թվա­նշաններով, տառերով, կետադրական նշաններով, ևն) ներկայացումն է: Վեր­ջինս հնարավորություն է տալ­իս տեքստի հետ տարբեր գործողություններ` սրբա­գրում, որոնում, պի­տա­կա­վո­րում, ևն, կատարել:

Մասնավորապես, գրադարանի հատորներում իմաստային (բովանդակային) որո­նու­մը արժեքավոր է թվում, հատկապես, գիտնական-ուսումնասիրողների համար:


Առանձնահատկութունները

Շտեմարանի կառուցվածքը

ԹԳ շտեմարանի կառուցվածքը պայմանավորված է բնագրի տպագրական տեսքը պահպանելու պահանջով: Սա հակասություն է ստեղծում որակյալ թվանշացման համար, քանի որ միշտ չէ, որ հնարավոր է թվանշացված տարբերակում վե­րար­տա­դրել տպագրի արտաքինը: Ամենաակնհայտ պատճառը թվանշային ֆոնտերի բա­ցա­կայությունն է` ինչքան ավելի հին է գիրքը, այնքան ավելի քիչ հավանական է հա­մապատասխան ֆոնտի առկայությունը:

Խնդրի լուծման լավագույն տարբերակն է տվյալների երկու` պատկերային եւ տեքս­տա­յին, շտեմարանների իրացումը.


ԹԳ այս ճարտարապետությունը լավագույն փորձ (best practices) է համարվում: Այսպես են կազմակերպված տեխնոլոգիականորեն զարգացած երկրների առա­ջա­տար (մայր) գրադարանները:

Թվայնացված (MASTER) մասում պահվում են գրքերի պատկերները, որոնցից կա­րե­լի է թղթային բնագիրը վերականգնել (տպագրել): Թվանշացված (DIGITAL) մասում պահ­պանվում են որոնելի եւ NLP (ալգորիթմային մշակման) համար տար­բե­րակ­նե­րը: Սրանք կարելի է ստանալ OCR Data Pipeline-ի օգնությամբ, որը հնա­րա­վո­րու­թյուն է տալիս տողադարձի հեռացումը եւ տվյալների այլ մաքրում: Տվյալների մաք­րու­մը կարեվոիր է ինչպես որոնման շարժիչի, այնպես էլ ԱԲ որակը (ճշգրտությունը) բարձ­րացնելու համար:

Հայաստանի գրադարանների թվանշացման պահանջները այլ են` հիբրիդային PDF-ներով կառուցված շտեմարան, որտեղ մետատվյալները, տեքստի պատկերը, եւ թվանշանները գտնվում են նույն ֆայլում:


Որոնում

ԹԳ-ում ինդեքսավորվում են ոչ միայն գրքերի (պարբերականների) մետա­տվյալ­նե­րը (ֆիզիկական գրադարանի նման)` վերնագիր (անուն), հեղինակ, ոլորտ, ևն, այլ նաեւ պարունակությունը: Վերջինը հնարավորություն է տալիս որեւէ ֆրազայի որո­նում կատարել գրքի էջերի կամ նույնիսկ պարբերությունների ճշտությամբ: Բացի այդ, կատալոգը ոչ թե կարծրագրվում է վերաբերական (relational) շտեմարանի (կամ դարակներով բաշխված քարտերով), այլ կառուցվում է որոնման շարժիչով:

Այսպիսով ԹԳ-ն կարելի դիտարկել որպես երկու փոփոխվող (դինամիկ) տվյալների եւ մեկ ծանոթագրային (ստատիկ) տեսակների`

  1. Հատորը էջերի (պարբերությունների (?)) բաժանած` ամեն էջը (պարբերությունը) մի պարզ տեքստային ֆայլ

  2. Հատորի մետատվյալները` մատենագիտական գրառումները

  3. Թեմատիկ վերնագրերի (միգուցե և բանալի բառերի), ծառատիպ կա­ռուց­ված­քը մատենագիտական գրառումներում համակարգված գործածության համար (օրինակ՝ Դյուիի տասնորդական կամ Կոնգրեսի գրադարանի, կամ այլ դա­սա­կար­գում):

Ժամանակակից որոնման շարժիչների հատկությունները ամփոփված են այս հար­ցա­զրույցում:


Կատալոգ

ԹԳ կատալոգը հատորների մատենագիտական գրառումները տվյալների պարզ տեքստային ֆայլերի ֆիզիկապես ոչ կարգավորված հավաքածու է: Այն չի հենվում ստորադասական (սովորական ֆայլային պնակների (folder) համակարգ), վե­րա­բե­րա­կան (տվյալների շտեմարան` relational database), կամ որեւէ այլ շտե­մա­րան­ների կառուցվածքի վրա: Այն կարող է ձեռակերտ լինել (գրա­դա­րա­նա­վարն է կատարում դասակարգումը եւ մուտքագրումը) կամ ԱԲ օգնությամբ` ինք­նաշ­խատ:

Այս մոտեցումը ծայրաստիճան ճկուն եւ հարմար է թե՛ մուտքագրելու, եւ թե՛ որոնելու համար:

Մատենագիտական գրառումների հիմնօրինակումը` #3 նախորդ հատվածում, ա­պա­հովում է կատալոգման հետեւողականությունը եւ տրամաբանականությունը:

ԹԳ կատալոգը ոչ թե կարծրագրվում է, այլ կառուցվում որոնման շարժիչով, որը հիմնվում է ինդեքսավորված մետատվյալների վրա, որոնք «թղթային» գրադարաններում կատալոգի քարտում են գրանցվում:

Դիտարկում. Էսպեսի «ГОСТ 7.76-96 Система стандартов по информации, библиотечному и издательскому делу. Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения. Росстандарт» մի բան պետք է որպես ՀՀ-ՊՀՕ մշակել: Նաեւ Վի­քի­պե­դի­այի Գրադարանավարություն (Գրադարանային գիտություն), Հայ Գրադարանավարության պատմություն, եւ Կատալոգավորում հոդվածներ (կամ/եւ դիսերտացիաներ) գրել:


Պարունակության որոնում

Հատորի պարունակությունը անցնում է գրանշանների ճանաչման համակարգով, սրբագրվում, եւ կտրատվում է էջերի: Էջերը ավելացվում են հակադարձ ինդեքսի որոնման շարժիչին մատչելի դառնալու համար:

Որոնման շարժիչը ապահովում է թե նշանների շարանի որոնում (այսիքն տողերի մակարդակով, ինչպես հինավուրց որոնող շարժիչներ էին անում մինչեւ 2023 թ.) եւ սեմանտիկ (իմաստային): Կարելի է շարահյուսական (սինտակտիկ) որոնում ավե­լաց­նել, սակայ սա ավելի սազական է լեզվաբանական կորպուսներին:


Հասանելիություն

Այն երկրները, որոնք փափագում են Եւրոպական քաղաքակրթության մաս դառնալ  (բայց նաֆթ չունեն), պետք է ապահովեն իրենց տարածքում գործածվող ծրա­գրա­յին համակարգերի հասանելիությունը (տե՛ս Հումանիտար տեխ­նո­լո­գի­ա­նե­րի կայ­քէ­ջեր, #1Ընդհանրական) ապահովել: ԹԳ-ն պետք է գրքերի ձայնային տար­բե­րա­կի (audiobook) ապահովի տեսողային խնդիրներ ունեցողների համար: Կա կարծիք (տե՛ս #5 Հայերեն տեքստը բանավոր խոսքի վերածում), որ այդպիսի տեխ­նո­լո­գի­ա­ներ հայերենի համար ստեղծված է:

Սակայն ձայնային գրքերը հարմար են ոչ միայն հաշմանդամների համար: Հա­սա­րակ մարդիկ վազելիս, հեծանիվ կամ մեքենա քշելիս, կուզենան լսել գրքեր, իսկ ու­սա­նողը, օրինակ` աստվածաբանության պատմության քննության Գավառից Աշ­տա­րակ գնալուց կարող է Ե.Կողբացու «Եղծ աղանդոց»-ը լսել եւ գերազանց գնա­հա­տական ստանալ Ակադեմիական քաղաք ժամանելուն պես:

Գրադարանի անդամակցությունը կտրուկ կավելանա:


Հատուկ գործածումներ

Բացի գրքերի եւ նրանց պարունակության որոնման որակական տարբերությունից, ԹԳ-ն կտրամադրի մի շարք նոր ծառայություններ`

  1. Հեղինակային իրավունքի վերահսկողություն

  2. Ըստ պահանջի հատորի լրիվ կամ մի մասի տպագրություն (հինավուրց Xerox տեխնոլոգիայի փոխարեն)

  3. Բնագրերի որակի պահպանում` հին եւ արժեքավոր գրքերի վերականգնում (տե՛ս Հավելվածը):

  4. Գրքերի գործածման գնահատում եւ շարակարգում (ինչքա՞ն հաճախ է գիրքը կարդացում, ո՞վ է կարդում, ևն):

  5. Գրքերի աննոտացիաները կամ ամփոփումները կարելի է մոտ 200 լեզուներով ինքնաշխատ թարգմանել եւ կատալոգին կից պահել: Մարդիկ կարող են լրիվ թարգ­մանություններ պատվիրել, որոնք րոպեների ընթացքում կարելի է կա­տա­րել եւ վաճառել:


Հավելված

Այս հավելվածում ներկայացված է մի օրինակ հին թերթերի եւ գրքերի անորակ [լու­սա]­նկարները ժամանակակից ԱԲ-ի օգնությամբ վերականգնելու հնա­րա­վո­րու­թյուն­ները:

Ժողովուրդ օրաթերթի 1918 թ. N 34 (Ազգային գրադարան) առաջին էջից վերցված լուսանկարը`


ԱՒՍՏՐՕ-ՀՈՒՆԳԱՐԻՈՅ ՊԱՏԵՐԱԶՄԻՆ ՊԱՏԱՍԽԱՆԱՏՈՒՆԵՐԸ


Այդ նույն լուսանկարը ԱԲ-ի (Perplexity.ai) օգնությամբ վերականգված (որակը լավն է, ճշտությունը` ոչ այդքան)`


ԱՒՍՏՐՕ-ՀՈՒՆԳԱՐԻՈՅ ՊԱՏԵՐԱԶՄԻՆ ՊԱՏԱՍԽԱՆԱՏՈՒՆԵՐԸ

Մէջտեղը գտնւողն է Աւստրիոյ Քարլ կայսրը, իսկ շուրջինները՝ Արհիդուքս Էօժէն (թիւ 1), գերման զօրավար Պիւլօմ (թիւ 2), Արհիդուքս Էօժէն (3), զօրավար Քօնրատ (4), զօր. Պորովիչ (5), զօր. Արձ (6): 

[ԱՀ. Ենթադրաբար` ձախ ստորին օվալը թիւ 1-ն է: Թիւ 1-ն ու 3-ը նո՞ւյն են:]

Ահա բոյլը այն ոճրագործ մարդկանց որոնք իրենց ոճրագործ ծրագիրներու համար ստեղծեցին համաշխարհային սպանդը։ Մարդիկ` որոնք տակաւին երեկ` իրենց մա­սին մեկ շարժումով կրնային արար աշխարհ դողացնել՝ այսօր իբրեւ մե­ղա­պարտ­ներ դեպի բանտ, դեպի աքսոր, եւ թերեւս դեպի՝ Կիյյօրին եւ կամ կախաղան կա­ռաջ­նորդւին, ահոնց կողմէ, որոնց միլիոններու տեղ չունին, քանի  դիակներուն վրայ բարձրացնել կուզեին իրենց փառքի եւ զեխութեան գահը: 

Իսկ Թուրքիոյ ոճրագործները, օ՜, անոնք մտահոգւելու տեղ չունին քանի որ, ա­պա­հով են թե այս երկնքին տակ, ոչ մեկ արդար պիտի գտնւեր, որ համարձակեր իրենց վրայ առաջին քարը ներելու:

[ԱՀ. Վերականգված տաբերակը հեշտ չէր ստանալ` Improve the quality of the attached photo; ԱԲ զգայապատրանքների համար դեղ-ու-դարման ունեցողներին խնդրում ենք օգնել:]




 
 
 

Recent Posts

See All
Եզրույթներ

Այստեղ բերված են այն եզրույթները, որոնք բացակայում են գրքում կամ անհաջող են ձեւավակերպված այնտեղ: Անհատկանիշ ( անգլ.՝ wildcard) - Հաշվողական գիտություններում (Computer science), ՏՏ-ում գործածվող ե

 
 
 
Գունային եզրույթներ

Հարյուր տարվա իմ մենության ընթացքում մի քանի փորձ արեցի գույների մասին գրել [1] : Լեզու․ իրականության հայելին և ճարտարապետը նայելիս, զգացի, որ թե­ման հասունացել է: Չնայած, որ սպիտակի երանգրերի մասին

 
 
 
Եղանակ

Grammatical_mood Grammatical_moods Causative mood Wikipedia: Causative mood is not to be confused with the unrelated notion of causative voice , a valency-shifting operation in many languages. Chrome

 
 
 

Comments


bottom of page