top of page

Technologies numériques humanitaires

Ներածություն
Մտադրությունը

Երբ 2022 վերջերին միտք առաջացավ հայկական Թվանշային Հումանիտար Տեխնոլոգիաներին (ԹՀՏ) նվիրված կայք ստեղծել, որը ա) կուրվագծի ԹՀՏ ոլորտը եւ նպատակները, եւ բ) կամփոփի հայկական ԹՀՏ վիճակն ու անելիքները, այն դիտարկվում էր, որպես ԹՀՏ զարգացումների եւ նվաճումների քննարկման հարթակ, որի արտահանումը, արտադրանքը կլիներ ԹՀՏ ուսումնական ծրագրերի մշակում, գիտահետազոտական աշխատանքների ուղղորդում ու սատարում, եւ արդյունքները [դասա]գրքերի, հոդվածների, բլոգերի, վիդեոների, ինտերնետային ինտերակտիվ կիրառումների, ևն տեսքով հրապարակումը:

[Դիտարկում. Երբեմն ԹՀՏ-ի փոխարեն օգտագործվում է Թվանշային Հումանիտար Գիտություններ եզրույթը: Գիտություններ անվանելը միգուցե ճիշտ չէ, քանի որ ԹՀՏ-ն ՏՏ-ի ենթաբազմություն է, այլ ոչ թե գիտական տեսությունների եւ մեթոդների [յուրահատուկ] հավաքածու:]

Նպտակը չի փոխվել, սակայն հարթակը ոնց-որ թե կառուցվել է, բայց չի գործում:

Մտորումներ

Պարզվեց, որ այս ամենի շուրջ Հայաստանում հետաքրքրություն չկա, մասնավորապես` չկան տեսական լեզվաբաններ: Լեզվաբանությունը համարվում է հումանիտար գիտություն, որի շրջանակը, սահմանը հայագիտությունն է:  Առհասարակ` հումանիտար մասնագետները գերազանցապես (բացառապե՞ս) հայագետներ են: Օրինակ` կա՞ն արդյոք հայ պատմաբաններ, որոնք գիտության պատմության որեւէ ժամանակատվածի մասին լուրջ ուսումնասիրություն են արել... կամ կա՞ն փիլիսոփաներ, որ գիտության, լեզվի, կենսաբանության, մաթեմատիկայի, կամ ԱԲ եւ, առհասարակ, տեխնոլոգիայի փիլիսոփայության բնագավառում արժեքավոր հոդվածներ են գրել... կամ բանասերներ, որոնք ուսումնասիրել են Հարավամերիկյան իսպանալեզու եւ պորտուգալերեն գրականությունը, համաեմատել դրանք, վերլուծել ... կամ համեմատել եւրոպական եւ հոլիվուդյան ռեժիսորներին եւ դերասաններին, անտեսելով նրանց հայկական, ռուսական, կամ վրացական արմատները... կամ ..., թե՞ «Աշխա՛րհ անցի՛ր, Արարատի նման ճերմակ գագաթ չկա»:  Խտացում է, իհարկե, բայց իրականությունից ոչ շատ հեռու:

Այսպիսով, մինչեւ հարթակ կառուցելը, պետք էր ներկայացման մասնակիցներ եւ հանդիսատեսներ պատրաստել:

Արդյունքը

Քանի որ լեզվի եւ խոսքի ուսումնասիրությունը մաթեմատիկական, բնական եւ հումանիտար գիտությունների ե՛ւ հիմքն է, ե՛ւ առարկան, կայքը, բնականաբար, տեսական եւ հաշվողական լեզվաբանության ռեսուրսի վերածվեց: Այն կարելի դիտարկել որպես լեզվաբանական տեղեկությունների շտեմարան, որը մի պայծառ առավոտ կձեւափոխվի եւ կվերածվի  համագործակցության պլատֆորմի:

Կայքի ամենաառաջին գրված էջերում` Թվանշային հումանիտար գիտություններ եւ Հումանիտար տեխնոլոգիաների կայքէջեր (որից հետագայում դուրս հանվեցին Լեզվաբանություն, ևն, Բնական խոսքի մշակում, Արհեստական Բանականություն էջերը) ուրվագծվեցին ԹՀՏ ոլորտի սահմանները եւ արդի վիճակը: Ենթադրվում էր, այս երկու էջերը բավական տեղեկություն են պարունակում, որպեսզի բանավեճեր եւ քննարկումներ առաջացնեն բնագավառի զարգացման հեռանկարների եւ հնարավորությունները մասին եւ հետաքրքրություն կառաջացնեն Բնական խոսքի ընդհանրական ներկայացման հիման վրա (կամ, այլ, օրինակ` Համընդհանուր Կախվածություններով )  բնական լեզվի կոմպյուտերային մոդել կառուցելու շուրջը: Այդ մոդելը նախատեսված էր որպես Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում ուրվագծված Լեզվաբանի Աշխատանոց կիրառման (application) գիտական եւ տեխնոլոգիական հիմք: Վերջինս հնարավորություն կտա լեզվաբաններին լեզուն ուսումնասիրել (նաեւ դասավանդել) հաշվողական գիտությունների եւ կոմպյուտերային տեխնոլոգիաների միջոցներով, ճիշտ այնպես, ինչպես ֆիզիկոսներն են օգտվում ՄՀԲ-ն կամ JWST-ն իրենց խնդիրների համար: 

Հույսը

Կայքի նպատակն է նաեւ ԹՀՏ ուսումնասիրությունների եւ ուսանման համար ռեսուրսների մի կառուցվածք` Հաշվողական լեզվաբանության միջբուհական կենտրոն ստեղծելը, որտեղ, հիմնվելով լեզվի եւ լեզվաբանության ժամանակակից ընկալման հենքի վրա (տե՛ս Ի՞նչ է լեզուն  էջերը Կայքի քարտեզում ստորեւ, #4) ուսանողները եւ գիտնականները, աշխատելով  Լեզվաբանի Աշխատանոց-ի եւ բնալեզվական մոդելի բարելավման վրա, կգրեն ուսանողական կամ գիտական թեզեր, հոդվածներ, ձեռնարկներ, եւ հենց  Լեզվաբանի Աշխատանոց​-ի օգնությամբ կկատարեն հետազոտություններ, ուսումնասիրություններ: Իմ խորին համոզմամբ ունանման որակը կտրականապես բարձրանում է այն միջավայրում, , որտեղ գիտելիքների անմիջապես կիրառվում, արտադրանք են տալիս: Այդ տեսանկյունից Ուսումնաարտադրական Կենտրոն (ՈւԱԿ) է: 

ՀՀ-ում պետք է որ գտնվեն 10-15 երիտասարդներ, որոնք հակված են մտածել  մաթեմատիկորեն լեզվաբանության եւ լեզվաբանորեն մաթեմատիկայի մասին: Այդ երիտասարդներին (եւ հասուն անձանց նմանապես) կայքի մասին տեղյակ պահեք` խնդրեք, որ այցելեն: Որոնումները շարունակվում եմ, հաջողություններ դեռ չեն արձանագրվել:

Բացահայտում

Կայքի նորությունների մասին անդամները ամիսը մեկ նամակ են ստանում:

Հավելյալ բացատրություններ
Աշխարհայացքը

Կենսաբանական օբյեկտները` մարդիկ ներառյալ, իրականության մեջ են առաջացել եւ գոյատեւում են բնական օրենքների համաձայն: Զարգացման, էվոլյուցիայի ընթացքում որոշ կենսաբանական էակների մոտ ստեղծվել է նյարդային համակարգ, որը զարգացման ներկա հատվածում ձեւավորվել է որպես մարդկային ուղեղ, որի գործողության ընթացքում մարդիկ գիտակից են: Թե ինչ է գիտակցությունը ոչ ոք չգիտի (բայց այս փաստի մասին շատ քչերն են տեղյակ): Բայց մեր խնդիրների համար բավարար է իմանալ, որ մենք գիտակից ենք եւ մեր գիտակցության արտահայտումներից մեկը մտածելն է: Մենք մտածում ենք պատկերներով, որոնց մասին միմյանց հաղորդում ենք խոսքի միջոցով: Խոսքը կառուցվում է նշաններից հատուկ համկցական օրենքներով: Նշանները սովորաբար կոչվում են բառեր, իսկ օրենքների բազմությունը` քերականություն: Լեզուն բառերի ցանկի` բառապաշարի, եւ քերականության ամբողջությունն է:

Լեզվի օգնությամբ կառուցված խոսքը ունի իմաստ` բովանդակություն եւ նշանակություն, եւ հաղորդում է պարունակում, որից երեւում է խոսողի մտադրությունը: Լեզուն եւ խոսքը «գործում» են մտավոր պատկերների միջեւ` խոսողի մտավոր պատկերները եւ վիճակները հաղորդվում եւ ազդում են լսողի մտավոր պատկերների եւ հոգեկան վիճակների վրա եւ դրանով ազդում են լսողի վարվելակերպի վրա: Մարդկային մտքերը լեզվով միջերեսված հաղորդվում են խոսքով:

Այս աշխարհայացքի լավագույն շարադրումը տես Ջ. Սըրլի դասախոսությունների երկու` Մտքի փիլիսոփայություն եւ Լեզվի փիլիսոփայություն շարքերում (տես Լեզվաբանություն, ևն, 39.a, 39.b)

Լեզու 

Ի՞նչ է լեզուն խորագրի տակ (տե՛ս ներքեւում, Կայքի քարտեզի #4) ամփոփված էջերից Դեպի լեզվի զարգացման կենսաբանական տեսություն  էջն ամենակարեվորն է: Ովքեր պատրաստ են ռացիոնալ, բանական (այլ ոչ թե էմոցիոնալ, զգայական) լեզվաբանությամբ զբաղվել պետք է դա կարդան:

Հայոց ՀԹՏ իրացումներ էջում (տես #1.4 ստորեւ) փորձ է կատարված նկարագրել հայկական ԹՀՏ արդի վիճակը եւ պարզաբանել «կոթողային» եւ «ճարտարագիտական» ստեղծածոների տարբերությունը: Այստեղ նաեւ առաջարկվում է գիտատեխնիկական գրանտերի (կամ բարեգործական գումարների)  հատկացման այնպիսի սխեմա, որով գումարները կբաշխվեն ոչ միայն «լավ խնդրողների» շրջանակում, այլ նաեւ «լավ կատարողների», լավ, օգտակար ծրագրեր, հոդվածներ, գրքեր գրողների մեջ:

Ներկայումս մեզ հայտնի են կայքի քարտեզի #1.4 կետում թվարկված տպագիր տեքստի (գրավոր խոսք)  կամ ձայնային (բանավոր խոսք) պատկերից պարզ տեքստ ստացող ծրագրեր: Այդպիսի տեքստերը կարելի հաջորդիվ վերլուծել (պիտակավորել) եւ սրբագրել, ինչպես նաեւ թարգմանել ~200 լեզվով:

Ինչո՞ւ ե Գյոդելի թեորեմները ոչ թե «Սուտասանի պարադոքսի» մասին, այլ «այս նախադասությունը սուտ է» նախադասության: Իմաստային պարադոքսներ էջում մի բացատրություն է տրվում: Բացի այդ այստեղ օգտագործվում է ճշգրտված եզրաբանություն` իմաստ – նշանակություն (այլ ոչ թե իմաստի փոխարեն հաճախ բովանդակություն եւ նշանակության փոխարեն իմաստ գործածումը, ինչպես արված է Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում), եւ սրանով ավելի ցայտուն է դարձվում Ֆրեգեի իմաստի եւ նշանակության տարբերակումը:

Կյանքի իմաստը

[<ԿԱՌՈւՑՎՈւՄ Է>]

ਵੱਡਾ ਕਰੋ మీ ఆనందం, 増加することなく他人的痛苦.

======================================================================================

Կայքի քարտեզը - Site Map
Էջեր [հիմնականում] հայերենով
  1. Թվային հումանիտար գիտություններ

    1. Հումանիտար տեխնոլոգիաների կայքէջեր

    2. Լեզվաբանություն, ևն

    3. Արհեստական Բանականություն

    4. Բնական խոսքի մշակում

    5. Հայոց ՀԹՏ իրացումներ

    6. Կորպուսային լեզվաբանություն 

    7. Թվանշային գրադարան

  2. Բնական լեզուների մոդելավորում

    1. Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին

      1. ** Չհրապարակված հատվածներ

      2. Շարահյուսական կապակցումը հայերենում

    2. Խոսքի նկարագրությունը Համընդհանուր Կախվածություններով

    3. Տեսական լեզվաբանություն - ընթերցարան, գրախոսականներ

    4. Արեւելահայերենի շաղկապները եւ բառակապակցությունների կապակցումը (անգլերեն)

  3. Լեզվաբանի Աշխատանոց​​

    1. Գանձարան

      1. Հ.Աճառյան. ՀԱԲ. ՅԱՌԱՋԱԲԱՆ

      2. ՆԱՅԻՐԻ բառարաններ

    2. Կորպուսների կառուցում

      1. Կորպուսային լեզվաբանություն. Ներածություն

      2. Կորպուսային Լեզվաբանություն

      3. Corpus linguistics (ԱԲ)

      4. Tree banks usage in linguistics (ԱԲ)

      5. User's Guide to OCR Data Pipeline - ԳՕՃ Տեղեկատարի գործածման ուղեցույց

      6. Armenian Speech-to-Text Web Application  - Հայերեն խոսքի վերածումը տեքստի

      7. Բնագրի վերածումը մուտքային տվյալների

      8. Armenian Parser (Հայերենի վերլուծիչ)

    3. Linguistic Information Processing System

  4. Ի՞նչ է լեզուն

    1. What is language? (Что такое язык?)

    2. Reviewing the Thought-Based Linguistics (Գրախոսական) 

    3. Դեպի լեզվի զարգացման կենսաբանական տեսություն 

    4. Lեզվական էվոլյուցիա

    5. Thinking without Words

    6. Pragmatics

    7. Connectives in Armenain - language and speech

    8. Գունային եզրոյթներ

  5. Հաշվողական լեզվաբանության միջբուհական կենտրոն

    1. Գանձարան

    2. Լեզվաբանի Աշխատանոց

    3. Linguistic Information Processing System

  6. Իմաստային պարադոքսներ

Էջեր անգլերենով - Pages in English
  1. Մեքենայի ուսանում (ՄՈւ) եւ Արհեստական բանականություն (ԱԲ)

    1. Արհեստական Բանականություն - ML, AI resources

    2. Interviewing ChatGPT

      1. Language basics

      2. Natural Language Processing (NLP)

      3. Corpus linguistics

      4. Armenian Corpora and morphology test

    3. Что такое язык?

    4. Tree banks usage in linguistics

  2. The Eastern Armenian National Corpus: questions, comments

  3. Reviewing the Thought-Based Linguistics

  4. What is language?

  5. Thinking without Words

  6. On Syntactic Structure Representation

    1. Linguistic Information Processing System

    2. Connectives in Armenain

    3. Running the Armenian Parser - Linux command line Eastern Armenian Parser (spellcheck, tagging)

  7. Character set standardization

    1. Armenian Characters set review

    2. Transliteration-Library of Congress-Armenian

  8. ​Summarizing YouTube Transcript

  9. DH technologies for Armenian

  10. Pragmatics

  11. Discourse Analysis

 

Ռուսերեն  էջեր - Страницы на русском
  1. Что такое язык?

Researching Connectives

 

Այցելեք կայքը սատարող գրախանութները` https://www.agoulis.com/ եւ գնումներ կատարեք 

Collaboration

Volunteer help needed to:

  1. Review and compare technologies listed on Բնական խոսքի մշակում page.

  2. Design (UX designer) the site, as well as to edit/create/contribute. I envisioned the ՀԹՏ site as a collaboration platform, rather than a site for promoting my Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին or - other books. Unfortunately, the majority of pages are still write-only. Better UX might help (I know that on mopbile devices the pages are even uglier).

  3. Investigate phases of [Armenian] language produced by neural networks (GPT) and verify if "poverty of input" is applicable to neural nets - for more details see Why GPT is not a language model? section in What is language? and Armenian Corpora and morphology test.

  4. Edit Wikipedia Armenian articles: we can make it a valuable knowledge base for laymen, students, and researches alike for free (no elusive grants needed) by laymen, students, and researches alike. Do you know a forum, a hang out for Armenian Wikipedia activists (enthusiasts)?

  5. Work on introducing generative AI (GPT) into Armenian science and education system - prepare courses to learn AI usage basics, prompt engineering.

  6. Linguists and Software, DevOps, DataOps engineers for developing, supporting, and integrating:

    1. ​Linguistic Information Processing System

    2. The Arm Parser

    3. OCR Data Pipeline

    4. Armenian Speech-to-Text WebApplication

    5. Գանձարան

    6. Կորպուսների կառուցում

    7. Լեզվաբանի Աշխատանոց - Linguists'/Philogists'/Lexicographers' Workbench (see section 16 in Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին and Lecture #4 in Կորպուսային լեզվաբանություն. Ներածություն, as well as the diagram in Թվային հումանիտար գիտություններ).

  7. Articles on Discourse Analysis (working titles):

    1. "The Logic of Discourse",

    2. "Relative connectives in Eastern Armenian",

    3. "Eastern Armenian Speech Acts".

  8. Five part textbook for University course in Theoretical Linguistics. Let's look for grants from the Government of third Republic or the House of Medici:

    1. "Philosophy of Language",

    2. Use: "Pragmatics",

    3. Content: "Semantics",

    4. Form: "Syntax", "Morphology", "Phonology",​​

    5. "Computational Linguistics"

 

Please help finding paying customers and/or investors:

  1. for the OCR functionality (User's Guide to OCR Data Pipeline, OCR Data Pipeline. Possible interested parties are:

    1. Libraries: National, Academy of Sciences, University, Local, Personal, etc.

    2. Museums

    3. Publisher houses

    4. Archives

    5. Courtrooms

    6. Individuals, that want to digitize old books.

  2.  for xosum.am (Armenian Speech-to-Text WebApplication) please contact support@xosum.am. Possible interested parties are:

    1. Creators to add automatic subtitles (transcript) to video

    2. Organizations/corporations that need high-quality, high-speed stenographers, high-quality and quick meeting transcripts (notes), etc.

    3. Applications (such as MS Word, Messengers, text editors, etc.) that lack Armenian speech-to-texts plugins

    4. Speech researchers (maybe` therapists)

    5. Journalists/reporters - interviewers

    6. Courtrooms/police - interviewers

    7. Synchronic translation (simultaneous interpretation) software developers - Armenian speech-to-text - GoogleTranslate to Vietnamese - Vietnamese text-to-speech

    8. Anyone who talks better than writes

  3. for the Translation processor - in addition to the above - #2: Notary services

bottom of page