top of page

Digital Humanities

Ներածություն
Մտադրությունը

Երբ 2022 վերջերին միտք առաջացավ հայկական Հումանիտար Թվանշային Տեխնոլոգիաներին (ՀԹՏ) նվիրված կայք ստեղ­ծել, որը ա) կուրվագծի ՀԹՏ ոլորտը եւ նպատակները, եւ բ) կամփոփի հայկական ՀԹՏ վիճակն ու անելիքները, այն դի­տարկ­վում էր, որպես ՀԹՏ զարգացումների եւ նվաճումների քննարկման մի հարթակ, որի արտահանումը, արտադրանքը կլիներ ՀԹՏ ուսումնական ծրագրերի մշակում, գիտահետազոտական աշխատանքների ուղղորդում ու սատարում, եւ արդյունքները [դա­սա]գրքերի, հոդվածների, բլոգերի, վիդեոների, ինտերնետային ինտերակտիվ կիրառումների, ևն տեսքով հրա­պա­րա­կու­մը:

[Դիտարկում. Երբեմն ՀԹՏ-ի փոխարեն օգտագործվում է Հումանիտար Թվանշային Գիտություններ եզրույթը: Գիտություններ ան­վա­նե­լը միգուցե ճիշտ չէ, քանի որ ՀԹՏ-ն ՏՏ-ի ենթաբազմություն է, այլ ոչ թե գիտական տեսությունների եւ մեթոդների [յուրահատուկ] հա­վա­քածու:]

Նպատակը չի փոխվել, հարթակը ոնց-որ թե կառուցվել է, բայց չի գործում:

 
Մտորումներ

Պարզվեց, որ այս ամենի շուրջ Հայաստանում հետաքրքրություն չկա, մասնավորապես` չկան տեսական լեզվաբաններ: Լեզ­վա­բանությունը համարվում է հումանիտար գիտություն, որի շրջանակը, սահմանը հայագիտությունն է:  Առհասարակ` հու­մա­նի­տար մասնագետները գերազանցապես (բացառապե՞ս) հայագետներ են: Օրինակ` կա՞ն արդյոք հայ պատմաբաններ, ո­րոնք գիտության պատմության որեւէ ժամանակատվածի մասին լուրջ ուսումնասիրություն են արել... կամ կա՞ն փի­լի­սո­փա­ներ, որ գիտության, լեզվի, կենսաբանության, մաթեմատիկայի, կամ ԱԲ եւ, առհասարակ, տեխնոլոգիայի փիլիսոփայության բնա­գավառում արժեքավոր հոդվածներ են գրել... կամ բանասերներ, որոնք ուսումնասիրել են Հարավամերիկյան իս­պա­նա­լե­զու եւ պորտուգալերեն գրականությունը, համեմատել դրանք, վերլուծել ... կամ համեմատել եւրոպական եւ հոլիվուդյան ռե­ժի­սորներին եւ դերասաններին, անտեսելով նրանց հայկական, ռուսական, կամ վրացական արմատները... կամ ... թե՞ «Աշ­խա՛րհ անցի՛ր, Արարատի նման ճերմակ գագաթ չկա»:  Խտացում է, իհարկե, բայց իրականությունից ոչ շատ հեռու:

Այս­պիսով, մինչեւ հարթակ կառուցելը, պետք էր ներկայացման մասնակիցներ եւ հանդիսատեսներ պատրաստել:

 
Արդյունքը

Քանի որ լեզվի եւ խոսքի ուսումնասիրությունը մաթեմատիկական, բնական եւ հումանիտար գիտությունների ե՛ւ հիմքն է, ե՛ւ ա­ռարկան, կայքը, բնականաբար, տեսական եւ հաշվողական լեզվաբանության ռեսուրսի վերածվեց: Այն կարելի դիտարկել որ­պես լեզվաբանական տեղեկությունների շտեմարան, որը մի պայծառ առավոտ կձեւափոխվի եւ կվերածվի  հա­մա­գոր­ծակ­ցության պլատֆորմի:

Կայքի ամենաառաջին գրված էջերում` Հումանիտար Թվանշային գիտություններ եւ Հումանիտար տեխնոլոգիաների կայ­քէ­ջեր (որից հետագայում դուրս հանվեցին Լեզվաբանություն, ևն, Բնական խոսքի մշակում, Արհեստական Բանականություն է­ջե­րը) ուրվագծվեցին ՀԹՏ ոլորտի սահմանները եւ արդի վիճակը: Ենթադրվում էր, այս երկու էջերը բավական տեղեկություն են պարունակում, որպեսզի բանավեճեր եւ քննարկումներ առաջացնեն բնագավառի զարգացման հեռանկարների եւ հնա­րա­վորությունները մասին եւ հետաքրքրություն կառաջացնեն Բնական խոսքի ընդհանրական ներկայացման հիման վրա (կամ, այլ, օրինակ` Համընդհանուր Կախվածություններով )  բնական լեզվի կոմպյուտերային մոդել կառուցելու շուրջը: Այդ մո­դե­լը նախատեսված էր որպես Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում ուր­վագծ­ված Լեզվաբանի Աշխատանոց կիրառման (application) գիտական եւ տեխնոլոգիական հիմք: Վերջինս հնարավորություն կտա լեզվաբաններին լեզուն ուսումնասիրել (նաեւ դասավանդել) հաշվողական գիտությունների եւ կոմպյուտերային տեխ­նո­լո­գիաների միջոցներով, ճիշտ այնպես, ինչպես ֆիզիկոսներն են օգտվում ՄՀԲ-ն կամ JWST-ն իրենց խնդիրների համար: 

 
Հույսը

Կայքի նպատակն է նաեւ ՀԹՏ ուսումնասիրությունների եւ ուսանման համար ռեսուրսների մի կառուցվածք` Հաշվողական լեզ­վաբանության միջբուհական կենտրոն ստեղծելը, որտեղ, հիմնվելով լեզվի եւ լեզվաբանության ժամանակակից ըն­կալ­ման հենքի վրա (տե՛ս Ի՞նչ է լեզուն  էջերը Կայքի քարտեզում ստորեւ, #4) ուսանողները եւ գիտնականները, աշխատելով  Լեզ­վա­բանի Աշխատանոց-ի եւ բնալեզվական մոդելի բարելավման վրա, կգրեն ուսանողական կամ գիտական թեզեր, հոդ­ված­ներ, ձեռնարկներ, եւ հենց  Լեզվաբանի Աշխատանոց​-ի օգնությամբ կկատարեն հետազոտություններ, ու­սում­նա­սի­րու­թյուն­ներ: Իմ խորին համոզմամբ ունանման որակը կտրականապես բարձրանում է այն միջավայրում, , որտեղ գիտելիքների ան­մի­ջապես կիրառվում, արտադրանք են տալիս: Այդ տեսանկյունից Ուսումնաարտադրական Կենտրոն (ՈւԱԿ) է: 

ՀՀ-ում պետք է որ գտնվեն 10-15 երիտասարդներ, որոնք հակված են մտածել  մաթեմատիկորեն լեզվաբանության եւ լեզ­վա­բա­նորեն մաթեմատիկայի մասին: Այդ երիտասարդներին (եւ հասուն անձանց նմանապես) կայքի մասին տեղյակ պահեք` խնդրեք, որ այցելեն: Որոնումները շարունակվում եմ, հաջողություններ դեռ չեն արձանագրվել:

 
Բացահայտում

Կայքի նորությունների մասին անդամները ամիսը մեկ նամակ են ստանում:

 
Հավելյալ բացատրություններ
Աշխարհայացքը

Կենսաբանական օբյեկտները` մարդիկ ներառյալ, իրականության մեջ են առաջացել եւ գոյատեւում են բնական օրենքների հա­մաձայն: Զարգացման, էվոլյուցիայի ընթացքում որոշ կենսաբանական էակների մոտ ստեղծվել է նյարդային համակարգ, որը զարգացման ներկա հատվածում ձեւավորվել է որպես մարդկային ուղեղ, որի գործողության ընթացքում մարդիկ գի­տա­կից են: Թե ինչ է գիտակցությունը ոչ ոք չգիտի (բայց այս փաստի մասին շատ քչերն են տեղյակ): Բայց մեր խնդիրների հա­մար բավարար է իմանալ, որ մենք գիտակից ենք եւ մեր գիտակցության արտահայտումներից մեկը մտածելն է: Մենք մտա­ծում ենք պատկերներով, որոնց մասին միմյանց հաղորդում ենք խոսքի միջոցով: Խոսքը կառուցվում է նշաններից հատուկ հա­մակցական օրենքներով: Նշանները սովորաբար կոչվում են բառեր, իսկ օրենքների բազմությունը` քերականություն: Լեզուն բառերի ցանկի` բառապաշարի, եւ քերականության ամբողջությունն է:

Լեզվի օգնությամբ կառուցված խոսքը ունի իմաստ` բովանդակություն եւ նշանակություն, եւ հաղորդում է պարունակում, որից երե­ւում է խոսողի մտադրությունը: Լեզուն եւ խոսքը «գործում» են մտավոր պատկերների միջեւ` խոսողի մտավոր պատ­կեր­նե­րը եւ վիճակները հաղորդվում եւ ազդում են լսողի մտավոր պատկերների եւ հոգեկան վիճակների վրա եւ դրանով ազդում են լսողի վարվելակերպի վրա: Մարդկային մտքերը լեզվով միջերեսված հաղորդվում են խոսքով:

Այս աշխարհայացքի լավագույն շարադրումը տես Ջ. Սըրլի դասախոսությունների երկու` Մտքի փիլիսոփայություն եւ Լեզվի փի­լիսոփայություն շարքերում (տես Լեզվաբանություն, ևն, 39.a, 39.b)

 
Լեզու 

Ի՞նչ է լեզուն խորագրի տակ (տե՛ս ներքեւում, Կայքի քարտեզի #4) ամփոփված էջերից Դեպի լեզվի զարգացման կեն­սա­բա­նա­կան տեսություն  էջն ամենակարեվորն է: Ովքեր պատրաստ են ռացիոնալ, բանական (այլ ոչ թե էմոցիոնալ, զգայական) լեզ­վաբանությամբ զբաղվել պետք է դա կարդան:

Հայոց ՀԹՏ իրացումներ էջում (տես #1.4 ստորեւ) փորձ է կատարված նկարագրել հայկական ՀԹՏ արդի վիճակը եւ պար­զա­բա­նել «կոթողային» եւ «ճարտարագիտական» ստեղծածոների տարբերությունը: Այստեղ նաեւ առաջարկվում է գի­տա­տեխ­նի­կական գրանտերի (կամ բարեգործական գումարների)  հատկացման այնպիսի սխեմա, որով գումարները կբաշխվեն ոչ մի­այն «լավ խնդրողների» շրջանակում, այլ նաեւ «լավ կատարողների», լավ, օգտակար ծրագրեր, հոդվածներ, գրքեր գրող­նե­րի մեջ:

Ներկայումս մեզ հայտնի են կայքի քարտեզի #1.4 կետում թվարկված տպագիր տեքստի (գրավոր խոսք)  կամ ձայնային (բա­նա­վոր խոսք) պատկերից պարզ տեքստ ստացող ծրագրեր: Այդպիսի տեքստերը կարելի հաջորդիվ վերլուծել (պի­տա­կա­վո­րել) եւ սրբագրել, ինչպես նաեւ թարգմանել ~200 լեզվով:

Ինչո՞ւ ե Գյոդելի թեորեմները ոչ թե «Սուտասանի պարադոքսի» մասին, այլ «այս նախադասությունը սուտ է» նա­խա­դա­սու­թյան: Իմաստային պարադոքսներ էջում մի բացատրություն է տրվում: Բացի այդ այստեղ օգտագործվում է ճշգրտված եզ­րա­բանություն` իմաստ – նշանակություն (այլ ոչ թե իմաստի փոխարեն հաճախ բովանդակություն եւ նշանակության փո­խա­րեն իմաստ գործածումը, ինչպես արված է Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում), եւ սրանով ավելի ցայտուն է դարձվում Ֆրեգեի իմաստի եւ նշանակության տարբերակումը:

 
Կյանքի իմաստը

[<ԿԱՌՈւՑՎՈւՄ Է>]

ਵੱਡਾ ਕਰੋ మీ ఆనందం, 増加することなく他人的痛苦.

======================================================================================

Կայքի քարտեզը - Site Map
Բլոգի տեսանկյուն
Էջեր [հիմնականում] հայերենով
  1. Հումանիտար Թվանշային գիտություններ

    1. Հումանիտար տեխնոլոգիաների կայքէջեր

    2. Լեզվաբանություն, ևն

    3. Արհեստական Բանականություն

    4. Բնական խոսքի մշակում

    5. Հայոց ՀԹՏ իրացումներ

    6. Կորպուսային լեզվաբանություն 

    7. Թվանշային գրադարան

  2. Բնական լեզուների մոդելավորում

    1. Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին

      1. ** Չհրապարակված հատվածներ

      2. Շարահյուսական կապակցումը հայերենում

    2. Խոսքի նկարագրությունը Համընդհանուր Կախվածություններով

    3. Տեսական լեզվաբանություն - ընթերցարան, գրախոսականներ

    4. Արեւելահայերենի շաղկապները եւ բառակապակցությունների կապակցումը (անգլերեն)

  3. Լեզվաբանի Աշխատանոց​​

    1. Գանձարան

      1. Հ.Աճառյան. ՀԱԲ. ՅԱՌԱՋԱԲԱՆ

      2. ՆԱՅԻՐԻ բառարաններ

    2. Կորպուսների կառուցում

      1. Կորպուսային լեզվաբանություն. Ներածություն

      2. Կորպուսային Լեզվաբանություն

      3. Corpus linguistics (ԱԲ)

      4. Tree banks usage in linguistics (ԱԲ)

      5. User's Guide to OCR Data Pipeline - ԳՕՃ Տեղեկատարի գործածման ուղեցույց

      6. Armenian Speech-to-Text Web Application  - Հայերեն խոսքի վերածումը տեքստի

      7. Բնագրի վերածումը մուտքային տվյալների

      8. Armenian Parser (Հայերենի վերլուծիչ)

    3. Linguistic Information Processing System

  4. Ի՞նչ է լեզուն

    1. What is language? (Что такое язык?)

    2. Reviewing the Thought-Based Linguistics (Գրախոսական) 

    3. Դեպի լեզվի զարգացման կենսաբանական տեսություն 

    4. Lեզվական էվոլյուցիա

    5. Thinking without Words

    6. Pragmatics

    7. Connectives in Armenain - language and speech

    8. Գունային եզրոյթներ

  5. Հաշվողական լեզվաբանության միջբուհական կենտրոն

    1. Գանձարան

    2. Լեզվաբանի Աշխատանոց

    3. Linguistic Information Processing System

  6. Իմաստային պարադոքսներ

Էջեր անգլերենով - Pages in English
  1. Մեքենայի ուսանում (ՄՈւ) եւ Արհեստական բանականություն (ԱԲ)

    1. Արհեստական Բանականություն - ML, AI resources

    2. Interviewing ChatGPT

      1. Language basics

      2. Natural Language Processing (NLP)

      3. Corpus linguistics

      4. Armenian Corpora and morphology test

    3. Что такое язык?

    4. Tree banks usage in linguistics

  2. The Eastern Armenian National Corpus: questions, comments

  3. Reviewing the Thought-Based Linguistics

  4. What is language?

  5. Thinking without Words

  6. On Syntactic Structure Representation

    1. Linguistic Information Processing System

    2. Connectives in Armenain

    3. Running the Armenian Parser - Linux command line Eastern Armenian Parser (spellcheck, tagging)

  7. Character set standardization

    1. Armenian Characters set review

    2. Transliteration-Library of Congress-Armenian

  8. ​Summarizing YouTube Transcript

  9. DH technologies for Armenian

  10. Pragmatics

  11. Discourse Analysis

 

Ռուսերեն  էջեր - Страницы на русском
  1. Что такое язык?

Researching Connectives

 

Այցելեք կայքը սատարող գրախանութները` https://www.agoulis.com/ եւ գնումներ կատարեք 

Collaboration

Volunteer help needed to:

  1. Review and compare technologies listed on Բնական խոսքի մշակում page.

  2. Design (UX designer) the site, as well as to edit/create/contribute. I envisioned the ՀԹՏ site as a collaboration platform, rather than a site for promoting my Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին or - other books. Unfortunately, the majority of pages are still write-only. Better UX might help (I know that on mopbile devices the pages are even uglier).

  3. Investigate phases of [Armenian] language produced by neural networks (GPT) and verify if "poverty of input" is applicable to neural nets - for more details see Why GPT is not a language model? section in What is language? and Armenian Corpora and morphology test.

  4. Edit Wikipedia Armenian articles: we can make it a valuable knowledge base for laymen, students, and researches alike for free (no elusive grants needed) by laymen, students, and researches alike. Do you know a forum, a hang out for Armenian Wikipedia activists (enthusiasts)?

  5. Work on introducing generative AI (GPT) into Armenian science and education system - prepare courses to learn AI usage basics, prompt engineering.

  6. Linguists and Software, DevOps, DataOps engineers for developing, supporting, and integrating:

    1. ​Linguistic Information Processing System

    2. The Arm Parser

    3. OCR Data Pipeline

    4. Armenian Speech-to-Text WebApplication

    5. Գանձարան

    6. Կորպուսների կառուցում

    7. Լեզվաբանի Աշխատանոց - Linguists'/Philogists'/Lexicographers' Workbench (see section 16 in Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին and Lecture #4 in Կորպուսային լեզվաբանություն. Ներածություն, as well as the diagram in Հումանիտար Թվանշային գիտություններ).

  7. Articles on Discourse Analysis (working titles):

    1. "The Logic of Discourse",

    2. "Relative connectives in Eastern Armenian",

    3. "Eastern Armenian Speech Acts: syntax and semantics".

  8. Five part textbook for University course in Theoretical Linguistics. Let's look for grants from the Government of Third Republic or the House of Medici:

    1. "Philosophy of Language",

    2. Use: "Pragmatics",

    3. Content: "Semantics",

    4. Form: "Syntax", "Morphology", "Phonology",​​

    5. "Computational Linguistics"

  9. Theory and Practice of Discourse Analysis (DA):

    1. Research in theory of DA:

      1. Connectives,

      2. Modality: from grammar to speech acts,

      3. Use AREVAK for the above research.

    2. Evaluate methodologies of DA and design the approach

    3. Use of existing corpora for DA.

  10. Finding or developing technologies for creating Audio Corpora

    1. Audio-to-IPA conversion (I think this is important for phonology studies and dialect recognition​)

    2. Automatic Interlocutor identification

 

Please help finding paying customers and/or investors:

  1. for the OCR functionality (User's Guide to OCR Data Pipeline, OCR Data Pipeline. Possible interested parties are:

    1. Libraries: National, Academy of Sciences, University, Local, Personal, etc.

    2. Museums

    3. Publisher houses

    4. Archives

    5. Courtrooms

    6. Individuals, that want to digitize old books.

  2.  for xosum.am (Armenian Speech-to-Text WebApplication) please contact support@xosum.am. Possible interested parties are:

    1. Creators to add automatic subtitles (transcript) to video

    2. Organizations/corporations that need high-quality, high-speed stenographers, high-quality and quick meeting transcripts (notes), etc.

    3. Applications (such as MS Word, Messengers, text editors, etc.) that lack Armenian speech-to-texts plugins

    4. Speech researchers (maybe` therapists)

    5. Journalists/reporters - interviewers

    6. Courtrooms/police - interviewers

    7. Synchronic translation (simultaneous interpretation) software developers - Armenian speech-to-text - GoogleTranslate to Vietnamese - Vietnamese text-to-speech

    8. Anyone who talks better than writes

  3. for the Translation processor - in addition to the above - #2: Notary services

bottom of page