top of page

Гуманитарные цифровые технологии

Ներածություն

Երբ 2022 վերջերին միտք առաջացավ հայկական Թվանշային Հումանիտար Տեխնոլոգիաներին (ԹՀՏ) նվիրված կայք ստեղծել, որը ա) կուրվագծի ԹՀՏ ոլորտը եւ նպատակները, եւ բ) կամփոփի հայկական ԹՀՏ վիճակն ու անելիքները: Այն դիտարկվում էր, որպես ԹՀՏ զարգացումների եւ նվաճումների քննարկման պլատֆորմ, որի արտահանումը, արտադրանքը կլիներ ԹՀՏ ուսումնական ծրագրերի մշակում, գիտահետազոտական աշխատանքների ուղղորդում ու սատարում, եւ արդյունքները [դասա]գրքերի, հոդվածների, բլոգերի, վիդեոների, ինտերնետային ինտերակտիվ կիրառումների, ևն տեսքով հրապարակումը:

[Դիտարկում. Երբեմն ԹՀՏ-ի փոխարեն օգտագործվում է Թվանշային Հումանիտար Գիտություններ եզրույթը: Գիտություններ անվանելը միգուցե ճիշտ չէ, քանի որ ԹՀՏ-ն ՏՏ-ի ենթաբազմություն է, այլ ոչ թե գիտական տեսությունների եւ մեթոդների [յուրահատուկ] հավաքածու:]

Քանի որ լեզվի եւ խոսքի ուսումնասիրությունը մասթեմատիկական, բնական եւ հումանիտար գիտությունների ե՛ւ հիմքն է, ե՛ւ առարկան, կայքը, բնականաբար, տեսական եւ հաշվողական լեզվաբանության ռեսուրսի վերածվեց: Այն կարելի դիտարկել որպես լեզվաբանական տեղեկությունների շտեմարան եւ համագործակցության պլատֆորմ:

Կայքի ամենաառաջին գրված էջերում` Թվանշային հումանիտար գիտություններ եւ Հումանիտար տեխնոլոգիաների կայքէջեր (որից հետագայում դուրս հանվեցին Լեզվաբանություն, ևն, Բնական խոսքի մշակում, Արհետական Բանականություն էջերը) ուրվագծվեցին ԹՀՏ ոլորտի սահմանները եւ արդի վիճակը: Ենթադրվում էր, այս երկու էջերը բավական տեղեկություն են պարունակում, որպեսզի բանավեճեր եւ քննարկումներ առաջացնեն բնագավառի զարգացման հեռանկարների եւ հնարավորությունները մասին եւ հետաքրքրություն կառաջացնեն Բնական խոսքի ընդհանրական ներկայացման հիման վրա (կամ, այլ, օրինակ` Համընդհանուր Կախվածություններով )  բնական լեզվի կոմպյուտերային մոդել կառուցելու շուրջը: Այդ մոդելը նախատեսված էր որպես Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում ուրվագծված Լեզվաբանի Աշխատանոց կիրառման (application) գիտական եւ տեխնոլոգիական հիմք: Վերջինս հնարավորություն կտա լեզվաբաններին լեզուն ուսումնասիրել (նաեւ դասավանդել) հաշվողական գիտությունների եւ կոմպյուտերային տեխնոլոգիաների միջոցներով, ճիշտ այնպես, ինչպես ֆիզիկոսներն են օգտվում ՄՀԲ-ն կամ JWST-ն իրենց խնդիրների համար: 

Կայքի նպատակն է նաեւ ԹՀՏ ուսումնասիրությունների եւ ուսանման համար ռեսուրսների մի կառուցվածք` Հաշվողական լեզվաբանության միջբուհական կենտրոն ստեղծելը, որտեղ, հիմնվելով լեզվի եւ լեզվաբանության ժամանակակից ընկալման հենքի վրա (տե՛ս Ի՞նչ է լեզուն  էջերը Կայքի քարտեզում ստորեւ, #4) ուսանողները եւ գիտնականները, աշխատելով  Լեզվաբանի Աշխատանոց-ի եւ բնալեզվական մոդելի բարելավվման վրա կգրեն ուսանողական կամ գիտական թեզեր, հոդվածներ, ձեռնարկներ, եւ հենց  Լեզվաբանի Աշխատանոց​-ի օգնությամբ կկատարեն հետազոտություններ, ուսումնասիրություններ: ՀՀ-ում պետք է կգտնվեն 10-15 երիտասարդներ, որոնք հակված են մտածել  մաթեմատիկորեն լեզվաբանության եւ լեզվաբանորեն մաթեմատիկայի մասին: Այդ երիտասարդներին (եւ հասուն անձանց նմանապես) կայքի մասին տեղյակ պահեք` խնդրեք, որ այցելեն:

Կայքի նորությունների մասին անդամները ամիսը մեկ նամակ են ստանում:

Հավելյալ բացատրություններ

Ի՞նչ է լեզուն խորագրի տակ (տե՛ս ներքեւում, Կայքի քարտեզի #4) ամփոփված էջերից Դեպի լեզվի զարգացման կենսաբանական տեսություն  էջն ամենակարեվորն է: Ովքեր պատրաստ են ռացիոնալ, բանական (այլ ոչ թե էմոցիոնալ, զգայական) լեզվաբանությամբ զբաղվել պետք է դա կարդան:

Հայոց ՀԹՏ իրացումներ էջում (տես #1.4 ստորեւ) փորձ է կատարված նկարագրել հայկական ԹՀՏ արդի վիճակը եւ պարզաբանել «կոթողային» եւ «ճարտարագիտական» ստեղծածոների տարբերությունը: Այստեղ նաեւ առաջարկվում է գիտատեխնիկական գրանտերի (կամ բարեգործական գումարների)  հատկացման այնպիսի սխեմա, որով գումարները կբաշխվեն ոչ միայն «լավ խնդրողների» շրջանակում, այլ նաեւ «լավ կատարողների», լավ, օգտակար ծրագրեր, հոդվածներ, գրքեր գրողների մեջ:

Ներկայումս մեզ հայտնի են կայքի քարտեզի #1.4 կետում թվարկված տպագիր տեքստի (գրավոր խոսք)  կամ ձայնային (բանավոր խոսք) պատկերից պարզ տեքստ ստացող ծրագրեր: Այդպիսի տեքստերը կարելի հաջորդիվ վերլուծել (պիտակավորել) եւ սրբագրել, ինչպես նաեւ թարգմանել ~200 լեզվով:

Ինչո՞ւ ե Գյոդելի թեորեմները ոչ թե «Սուտասանի պարադոքսի» մասին, այլ «այս նախադասությունը սուտ է» նախադասության: Իմաստային պարադոքսներ էջում մի բացատրություն է տրվում: Բացի այդ այստեղ օգտագործվում է ճշգրտված եզրաբանություն` իմաստ – նշանակություն (այլ ոչ թե իմաստի փոխարեն հաճախ բովանդակություն եւ նշանակության փոխարեն իմաստ գործածումը, ինչպես արված է Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում), եւ սրանով ավելի ցայտուն է դարձվում Ֆրեգեի իմաստի եւ նշանակության տարբերակումը:

======================================================================================

Կայքի քարտեզը - Site Map
Էջեր [հիմնականում] հայերենով
  1. Թվային հումանիտար գիտություններ

    1. Հումանիտար տեխնոլոգիաների կայքէջեր

    2. Լեզվաբանություն, ևն

    3. Արհեստական Բանականություն

    4. Բնական խոսքի մշակում

    5. Հայոց ՀԹՏ իրացումներ

    6. Կորպուսային լեզվաբանություն 

    7. Թվանշային գրադարան

  2. Բնական լեզուների մոդելավորում

    1. Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին

      1. ** Չհրապարակված հատվածներ

      2. Շարահյուսական կապակցումը հայերենում

    2. Խոսքի նկարագրությունը Համընդհանուր Կախվածություններով

    3. Տեսական լեզվաբանություն - ընթերցարան, գրախոսականներ

    4. Արեւելահայերենի շաղկապները եւ բառակապակցությունների կապակցումը (անգլերեն)

  3. Լեզվաբանի Աշխատանոց​​

    1. Գանձարան

      1. Հ.Աճառյան. ՀԱԲ. ՅԱՌԱՋԱԲԱՆ

      2. ՆԱՅԻՐԻ բառարաններ

    2. Կորպուսների կառուցում

      1. Կորպուսային լեզվաբանություն. Ներածություն

      2. Կորպուսային Լեզվաբանություն

      3. Corpus linguistics (ԱԲ)

      4. Tree banks usage in linguistics (ԱԲ)

      5. User's Guide to OCR Data Pipeline - ԳՕՃ Տեղեկատարի գործածման ուղեցույց

      6. Armenian Speech-to-Text Web Application  - Հայերեն խոսքի վերածումը տեքստի

      7. Բնագրի վերածումը մուտքային տվյալների

      8. Armenian Parser (Հայերենի վերլուծիչ)

    3. Linguistic Information Processing System

  4. Ի՞նչ է լեզուն

    1. What is language? (Что такое язык?)

    2. Reviewing the Thought-Based Linguistics (Գրախոսական) 

    3. Դեպի լեզվի զարգացման կենսաբանական տեսություն 

    4. Lեզվական էվոլյուցիա

    5. Thinking without Words

    6. Pragmatics

    7. Connectives in Armenain - language and speech   

  5. Հաշվողական լեզվաբանության միջբուհական կենտրոն

    1. Գանձարան

    2. Լեզվաբանի Աշխատանոց

    3. Linguistic Information Processing System

  6. Իմաստային պարադոքսներ

Էջեր անգլերենով - Pages in English
  1. Մեքենայի ուսանում (ՄՈւ) եւ Արհեստական բանականություն (ԱԲ)

    1. Արհեստական Բանականություն - ML, AI resources

    2. Interviewing ChatGPT

      1. Language basics

      2. Natural Language Processing (NLP)

      3. Corpus linguistics

      4. Armenian Corpora and morphology test

    3. Что такое язык?

    4. Tree banks usage in linguistics

  2. The Eastern Armenian National Corpus: questions, comments

  3. Reviewing the Thought-Based Linguistics

  4. What is language?

  5. Thinking without Words

  6. On Syntactic Structure Representation

    1. Linguistic Information Processing System

    2. Connectives in Armenain

    3. Running the Armenian Parser - Linux command line Eastern Armenian Parser (spellcheck, tagging)

  7. Character set standardization

    1. Armenian Characters set review

    2. Transliteration-Library of Congress-Armenian

  8. ​Summarizing YouTube Transcript

  9. DH technologies for Armenian

  10. Pragmatics

  11. Discourse Analysis

 

Ռուսերեն  էջեր - Страницы на русском
  1. Что такое язык?

Researching Connectives

 

Այցելեք կայքը սատարող գրախանութները` https://www.agoulis.com/ եւ գնումներ կատարեք 

Collaboration

Volunteer help needed to:

  1. Review and compare technologies listed on Բնական խոսքի մշակում page.

  2. Design (UX designer) the site, as well as to edit/create/contribute. I envisioned the ՀԹՏ site as a collaboration platform, rather than a site for promoting my Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին or - other books. Unfortunately, the majority of pages are still write-only. Better UX might help (I know that on mopbile devices the pages are even uglier).

  3. Investigate phases of [Armenian] language produced by neural networks (GPT) and verify if "poverty of input" is applicable to neural nets - for more details see Why GPT is not a language model? section in What is language? and Armenian Corpora and morphology test.

  4. Edit Wikipedia Armenian articles: we can make it a valuable knowledge base for laymen, students, and researches alike for free (no elusive grants needed) by laymen, students, and researches alike. Do you know a forum, a hang out for Armenian Wikipedia activists (enthusiasts)?

  5. Work on introducing generative AI (GPT) into Armenian science and education system - prepare courses to learn AI usage basics, prompt engineering.

  6. Linguists and Software, DevOps, DataOps engineers for developing, supporting, and integrating:

    1. ​Linguistic Information Processing System

    2. The Arm Parser

    3. OCR Data Pipeline

    4. Armenian Speech-to-Text WebApplication

    5. Գանձարան

    6. Կորպուսների կառուցում

    7. Լեզվաբանի Աշխատանոց - Linguists'/Philogists'/Lexicographers' Workbench (see section 16 in Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին and Lecture #4 in Կորպուսային լեզվաբանություն. Ներածություն, as well as the diagram in Թվային հումանիտար գիտություններ).

 

Please help finding paying customers and/or investors:

  1. for the OCR functionality (User's Guide to OCR Data Pipeline, OCR Data Pipeline. Possible interested parties are:

    1. Libraries: National, Academy of Sciences, University, Local, Personal, etc.

    2. Museums

    3. Publisher houses

    4. Archives

    5. Courtrooms

    6. Individuals, that want to digitize old books.

  2.  for xosum.am (Armenian Speech-to-Text WebApplication) please contact support@xosum.am. Possible interested parties are:

    1. Creators to add automatic subtitles (transcript) to video

    2. Organizations/corporations that need high-quality, high-speed stenographers, high-quality and quick meeting transcripts (notes), etc.

    3. Applications (such as MS Word, Messengers, text editors, etc.) that lack Armenian speech-to-texts plugins

    4. Speech researchers (maybe` therapists)

    5. Journalists/reporters - interviewers

    6. Courtrooms/police - interviewers

    7. Synchronic translation (simultaneous interpretation) software developers - Armenian speech-to-text - GoogleTranslate to Vietnamese - Vietnamese text-to-speech

    8. Anyone who talks better than writes

  3. for the Translation processor - in addition to the above - #2: Notary services

bottom of page