Technologies numériques humanitaires

Ներածություն

Մտադրությունը

Երբ 2022 վերջերին միտք առաջացավ հայկական Հումանիտար Թվանշային Տեխնոլոգիաներին (ՀԹՏ) նվիրված կայք ստեղծել, որը ա) կուրվագծի ՀԹՏ ոլորտը եւ նպատակները, եւ բ) կամփոփի հայկական ՀԹՏ վիճակն ու անելիքները, այն դիտարկվում էր, որպես ՀԹՏ զարգացումների եւ նվաճումների քննարկման մի հարթակ, որի արտահանումը, արտադրանքը կլիներ ՀԹՏ ուսումնական ծրագրերի մշակում, գիտահետազոտական աշխատանքների ուղղորդում ու սատարում, եւ արդյունքները [դասա]գրքերի, հոդվածների, բլոգերի, վիդեոների, ինտերնետային ինտերակտիվ կիրառումների, ևն տեսքով հրապարակումը:

[Դիտարկում. Երբեմն ՀԹՏ-ի փոխարեն օգտագործվում է Հումանիտար Թվանշային Գիտություններ եզրույթը: Գիտություններ անվանելը միգուցե ճիշտ չէ, քանի որ ՀԹՏ-ն ՏՏ-ի ենթաբազմություն է, այլ ոչ թե գիտական տեսությունների եւ մեթոդների [յուրահատուկ] հավաքածու:]

Նպատակը չի փոխվել, հարթակը ոնց-որ թե կառուցվել է, բայց չի գործում:

Մտորումներ

Պարզվեց, որ այս ամենի շուրջ Հայաստանում հետաքրքրություն չկա, մասնավորապես` չկան տեսական լեզվաբաններ: Լեզվաբանությունը համարվում է հումանիտար գիտություն, որի շրջանակը, սահմանը հայագիտությունն է: Առհասարակ` հումանիտար մասնագետները գերազանցապես (բացառապե՞ս) հայագետներ են: Օրինակ` կա՞ն արդյոք հայ պատմաբաններ, որոնք գիտության պատմության որեւէ ժամանակատվածի մասին լուրջ ուսումնասիրություն են արել... կամ կա՞ն փիլիսոփաներ, որ գիտության, լեզվի, կենսաբանության, մաթեմատիկայի, կամ ԱԲ եւ, առհասարակ, տեխնոլոգիայի փիլիսոփայության բնագավառում արժեքավոր հոդվածներ են գրել... կամ բանասերներ, որոնք ուսումնասիրել են Հարավամերիկյան իսպանալեզու եւ պորտուգալերեն գրականությունը, համեմատել դրանք, վերլուծել ... կամ համեմատել եւրոպական եւ հոլիվուդյան ռեժիսորներին եւ դերասաններին, անտեսելով նրանց հայկական, ռուսական, կամ վրացական արմատները... կամ ... թե՞ «Աշխա՛րհ անցի՛ր, Արարատի նման ճերմակ գագաթ չկա»: Խտացում է, իհարկե, բայց իրականությունից ոչ շատ հեռու:

Այսպիսով, մինչեւ հարթակ կառուցելը, պետք էր ներկայացման մասնակիցներ եւ հանդիսատեսներ պատրաստել:

Արդյունքը

Քանի որ լեզվի եւ խոսքի ուսումնասիրությունը մաթեմատիկական, բնական եւ հումանիտար գիտությունների ե՛ւ հիմքն է, ե՛ւ առարկան, կայքը, բնականաբար, տեսական եւ հաշվողական լեզվաբանության ռեսուրսի վերածվեց: Այն կարելի դիտարկել որպես լեզվաբանական տեղեկությունների շտեմարան, որը մի պայծառ առավոտ կձեւափոխվի եւ կվերածվի համագործակցության պլատֆորմի:

Կայքի ամենաառաջին գրված էջերում` Հումանիտար Թվանշային գիտություններ եւ Հումանիտար տեխնոլոգիաների կայքէջեր (որից հետագայում դուրս հանվեցին Լեզվաբանություն, ևն, Բնական խոսքի մշակում, Արհեստական Բանականություն էջերը) ուրվագծվեցին ՀԹՏ ոլորտի սահմանները եւ արդի վիճակը: Ենթադրվում էր, այս երկու էջերը բավական տեղեկություն են պարունակում, որպեսզի բանավեճեր եւ քննարկումներ առաջացնեն բնագավառի զարգացման հեռանկարների եւ հնարավորությունները մասին եւ հետաքրքրություն կառաջացնեն Բնական խոսքի ընդհանրական ներկայացման հիման վրա (կամ, այլ, օրինակ` Համընդհանուր Կախվածություններով ) բնական լեզվի կոմպյուտերային մոդել կառուցելու շուրջը: Այդ մոդելը նախատեսված էր որպես Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում ուրվագծված Լեզվաբանի Աշխատանոց կիրառման (application) գիտական եւ տեխնոլոգիական հիմք: Վերջինս հնարավորություն կտա լեզվաբաններին լեզուն ուսումնասիրել (նաեւ դասավանդել) հաշվողական գիտությունների եւ կոմպյուտերային տեխնոլոգիաների միջոցներով, ճիշտ այնպես, ինչպես ֆիզիկոսներն են օգտվում ՄՀԲ-ն կամ JWST-ն իրենց խնդիրների համար:

Հույսը

Կայքի նպատակն է նաեւ ՀԹՏ ուսումնասիրությունների եւ ուսանման համար ռեսուրսների մի կառուցվածք` Հաշվողական լեզվաբանության միջբուհական կենտրոն ստեղծելը, որտեղ, հիմնվելով լեզվի եւ լեզվաբանության ժամանակակից ընկալման հենքի վրա (տե՛ս Ի՞նչ է լեզուն էջերը Կայքի քարտեզում ստորեւ, #4) ուսանողները եւ գիտնականները, աշխատելով Լեզվաբանի Աշխատանոց-ի եւ բնալեզվական մոդելի բարելավման վրա, կգրեն ուսանողական կամ գիտական թեզեր, հոդվածներ, ձեռնարկներ, եւ հենց Լեզվաբանի Աշխատանոց-ի օգնությամբ կկատարեն հետազոտություններ, ուսումնասիրություններ: Իմ խորին համոզմամբ ունանման որակը կտրականապես բարձրանում է այն միջավայրում, , որտեղ գիտելիքների անմիջապես կիրառվում, արտադրանք են տալիս: Այդ տեսանկյունից Ուսումնաարտադրական Կենտրոն (ՈւԱԿ) է:

ՀՀ-ում պետք է որ գտնվեն 10-15 երիտասարդներ, որոնք հակված են մտածել մաթեմատիկորեն լեզվաբանության եւ լեզվաբանորեն մաթեմատիկայի մասին: Այդ երիտասարդներին (եւ հասուն անձանց նմանապես) կայքի մասին տեղյակ պահեք` խնդրեք, որ այցելեն: Որոնումները շարունակվում եմ, հաջողություններ դեռ չեն արձանագրվել:

Բացահայտում

Կայքի նորությունների մասին անդամները ամիսը մեկ նամակ են ստանում:

Գնացեք ՀԹՏ գլխավոր էջ,
Սեղմեք [Enter] (Մուտք գործել` վերին աջ անկյուն),
Գրանցման 3 եղանակ կա՝ 1) Google-ով, 2) Facebook-ով, 3) էլ. փոստով,

Հավելյալ բացատրություններ

Աշխարհայացքը

Կենսաբանական օբյեկտները` մարդիկ ներառյալ, իրականության մեջ են առաջացել եւ գոյատեւում են բնական օրենքների համաձայն: Զարգացման, էվոլյուցիայի ընթացքում որոշ կենսաբանական էակների մոտ ստեղծվել է նյարդային համակարգ, որը զարգացման ներկա հատվածում ձեւավորվել է որպես մարդկային ուղեղ, որի գործողության ընթացքում մարդիկ գիտակից են: Թե ինչ է գիտակցությունը ոչ ոք չգիտի (բայց այս փաստի մասին շատ քչերն են տեղյակ): Բայց մեր խնդիրների համար բավարար է իմանալ, որ մենք գիտակից ենք եւ մեր գիտակցության արտահայտումներից մեկը մտածելն է: Մենք մտածում ենք պատկերներով, որոնց մասին միմյանց հաղորդում ենք խոսքի միջոցով: Խոսքը կառուցվում է նշաններից հատուկ համակցական օրենքներով: Նշանները սովորաբար կոչվում են բառեր, իսկ օրենքների բազմությունը` քերականություն: Լեզուն բառերի ցանկի` բառապաշարի, եւ քերականության ամբողջությունն է:

Լեզվի օգնությամբ կառուցված խոսքը ունի իմաստ` բովանդակություն եւ նշանակություն, եւ հաղորդում է պարունակում, որից երեւում է խոսողի մտադրությունը: Լեզուն եւ խոսքը «գործում» են մտավոր պատկերների միջեւ` խոսողի մտավոր պատկերները եւ վիճակները հաղորդվում եւ ազդում են լսողի մտավոր պատկերների եւ հոգեկան վիճակների վրա եւ դրանով ազդում են լսողի վարվելակերպի վրա: Մարդկային մտքերը լեզվով միջերեսված հաղորդվում են խոսքով:

Այս աշխարհայացքի լավագույն շարադրումը տես Ջ. Սըրլի դասախոսությունների երկու` Մտքի փիլիսոփայություն եւ Լեզվի փիլիսոփայություն շարքերում (տես Լեզվաբանություն, ևն, 39.a, 39.b)

Լեզու

Ի՞նչ է լեզուն խորագրի տակ (տե՛ս ներքեւում, Կայքի քարտեզի #4) ամփոփված էջերից Դեպի լեզվի զարգացման կենսաբանական տեսություն էջն ամենակարեվորն է: Ովքեր պատրաստ են ռացիոնալ, բանական (այլ ոչ թե էմոցիոնալ, զգայական) լեզվաբանությամբ զբաղվել պետք է դա կարդան:

Հայոց ՀԹՏ իրացումներ էջում (տես #1.4 ստորեւ) փորձ է կատարված նկարագրել հայկական ՀԹՏ արդի վիճակը եւ պարզաբանել «կոթողային» եւ «ճարտարագիտական» ստեղծածոների տարբերությունը: Այստեղ նաեւ առաջարկվում է գիտատեխնիկական գրանտերի (կամ բարեգործական գումարների) հատկացման այնպիսի սխեմա, որով գումարները կբաշխվեն ոչ միայն «լավ խնդրողների» շրջանակում, այլ նաեւ «լավ կատարողների», լավ, օգտակար ծրագրեր, հոդվածներ, գրքեր գրողների մեջ:

Ներկայումս մեզ հայտնի են կայքի քարտեզի #1.4 կետում թվարկված տպագիր տեքստի (գրավոր խոսք) կամ ձայնային (բանավոր խոսք) պատկերից պարզ տեքստ ստացող ծրագրեր: Այդպիսի տեքստերը կարելի հաջորդիվ վերլուծել (պիտակավորել) եւ սրբագրել, ինչպես նաեւ թարգմանել ~200 լեզվով:

Ինչո՞ւ ե Գյոդելի թեորեմները ոչ թե «Սուտասանի պարադոքսի» մասին, այլ «այս նախադասությունը սուտ է» նախադասության: Իմաստային պարադոքսներ էջում մի բացատրություն է տրվում: Բացի այդ այստեղ օգտագործվում է ճշգրտված եզրաբանություն` իմաստ – նշանակություն (այլ ոչ թե իմաստի փոխարեն հաճախ բովանդակություն եւ նշանակության փոխարեն իմաստ գործածումը, ինչպես արված է Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին գիրքում), եւ սրանով ավելի ցայտուն է դարձվում Ֆրեգեի իմաստի եւ նշանակության տարբերակումը:

Կյանքի իմաստը

[<ԿԱՌՈւՑՎՈւՄ Է>]

ਵੱਡਾ ਕਰੋ మీ ఆనందం, 増加することなく他人的痛苦.

======================================================================================

Կայքի քարտեզը - Site Map

Բլոգի տեսանկյուն

Այցելեք կայքը սատարող գրախանութները` https://www.agoulis.com/ եւ գնումներ կատարեք

Collaboration

Volunteer help needed to:

Review and compare technologies listed on Բնական խոսքի մշակում page.
Design (UX designer) the site, as well as to edit/create/contribute. I envisioned the ՀԹՏ site as a collaboration platform, rather than a site for promoting my Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին or - other books. Unfortunately, the majority of pages are still write-only. Better UX might help (I know that on mopbile devices the pages are even uglier).
Investigate phases of [Armenian] language produced by neural networks (GPT) and verify if "poverty of input" is applicable to neural nets - for more details see Why GPT is not a language model? section in What is language? and Armenian Corpora and morphology test.
Edit Wikipedia Armenian articles: we can make it a valuable knowledge base for laymen, students, and researches alike for free (no elusive grants needed) by laymen, students, and researches alike. Do you know a forum, a hang out for Armenian Wikipedia activists (enthusiasts)?
1. Վիքիների ուսումնասիրություն
Work on introducing generative AI (GPT) into Armenian science and education system - prepare courses to learn AI usage basics, prompt engineering.
Linguists and Software, DevOps, DataOps engineers for developing, supporting, and integrating:
1. Linguistic Information Processing System
2. The Arm Parser
3. OCR Data Pipeline
4. Armenian Speech-to-Text WebApplication
5. Գանձարան
6. Կորպուսների կառուցում
7. Լեզվաբանի Աշխատանոց - Linguists'/Philogists'/Lexicographers' Workbench (see section 16 in Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին and Lecture #4 in Կորպուսային լեզվաբանություն. Ներածություն, as well as the diagram in Հումանիտար Թվանշային գիտություններ).
Articles on Discourse Analysis (working titles):
1. "The Logic of Discourse",
2. "Relative connectives in Eastern Armenian",
3. "Eastern Armenian Speech Acts: syntax and semantics".
Five part textbook for University course in Theoretical Linguistics. Let's look for grants from the Government of Third Republic or the House of Medici:
1. "Philosophy of Language",
2. Use: "Pragmatics",
3. Content: "Semantics",
4. Form: "Syntax", "Morphology", "Phonology",
5. "Computational Linguistics"
Theory and Practice of Discourse Analysis (DA):
1. Research in theory of DA:
  1. Connectives,
  2. Modality: from grammar to speech acts,
  3. Use AREVAK for the above research.
2. Evaluate methodologies of DA and design the approach
3. Use of existing corpora for DA.
Finding or developing technologies for creating Audio Corpora
1. Audio-to-IPA conversion (I think this is important for phonology studies and dialect recognition)
2. Automatic Interlocutor identification

Please help finding paying customers and/or investors:

for the OCR functionality (User's Guide to OCR Data Pipeline, OCR Data Pipeline. Possible interested parties are:
1. Libraries: National, Academy of Sciences, University, Local, Personal, etc.
2. Museums
3. Publisher houses
4. Archives
5. Courtrooms
6. Individuals, that want to digitize old books.
for xosum.am (Armenian Speech-to-Text WebApplication) please contact support@xosum.am. Possible interested parties are:
1. Creators to add automatic subtitles (transcript) to video
2. Organizations/corporations that need high-quality, high-speed stenographers, high-quality and quick meeting transcripts (notes), etc.
3. Applications (such as MS Word, Messengers, text editors, etc.) that lack Armenian speech-to-texts plugins
4. Speech researchers (maybe` therapists)
5. Journalists/reporters - interviewers
6. Courtrooms/police - interviewers
7. Synchronic translation (simultaneous interpretation) software developers - Armenian speech-to-text - GoogleTranslate to Vietnamese - Vietnamese text-to-speech
8. Anyone who talks better than writes
for the Translation processor - in addition to the above - #2: Notary services

PolyWorldlot