top of page

Summarizing the Transcript

aramhayr

Updated: Aug 24, 2024

If the activities described in this page are illegal, please let me know - I do not want AI induced headache.


Using the instructions provided by Download the Transcript of a YouTube video chat and mimic my exchange with Perplexity you can get similar to below output for any YouTube lecture (video) that has auto- or manual transcription on.


This is the result (note that the Summary is human wirriten - compare with the one generated by Perplexity):


#1 Introduction to Corpus Linguistics - What is Corpus Linguistics?

Ամփոփում

Տեսանյութը կորպուսային լեզվաբանության ներածական ակնարկ է։ Կորպուսային լեզվաբանությունը այն ոլորտն է, որն ուսումնասիրում է խոսքը կորպուսների` բնական լեզվով տեքստերի հավաքածուների (շտեմարանների), միջոցով։ Կորպուսը պետք է լինի մեծ եւ իրական (ոչ մեքենական կամ հատուկ գրված), որպեսզի լիարժեք ներկայացնի լեզվի օգտագործումը։ Կորպուսի կառուցումը ներառնում է տեքստերի հավաքումը, համակարգչում դարանումը, եւ հատուկ ծրագրերի միջոցով վերլուծությունը։ Այսպիսի ծրագրերի օրինակներն են LancsBox-ը եւ AntConc-ը։ Կորպուսային լեզվաբանությունը լեզվի տեսություն չէ, այլ մեթոդաբանական գործիք։ Այս ոլորտի կարեվոր գիտնականներ են` Սինքլերը եւ Բրեզինան. նրանց աշխատություններին ծանոթանալը կօգնի ավելի խորը հասկանալ կորպուսային լեզվաբանությունը:

Դասախոսության զուգահեռ փոխադրումը անգլերեն եւ հայերեն 

0:00 - hello and welcome to this series of videos on corpus linguistics. In the next couple of weeks,  

0:00 - Բարեւ եւ բարի գալուստ այս տեսանյութերի շարքին կորպուսային լեզվաբանության մասին։ Հաջորդ մի քանի շաբաթների ընթացքում


0:05 - we'll be talking about what corpus linguistics is. we'll start from the very basic notions and  

0:05 - մենք կխոսենք, թե ինչ է կորպուսային լեզվաբանությունը։ Մենք կսկսենք ամենահիմնական հասկացություններից եւ


0:11 - things that you need to understand in order to get you started and then step-by-step will move  

0:11 - այն բաներից, որոնք պետք է հասկանալ, որպեսզի սկսենք, եւ ապա աստիճանաբար կանցնենք


0:15 - on to more advanced topics related to the field. so yeah without wasting your time with meaningless  

0:15 - ավելի բարդ թեմաների։ Այսպիսով, առանց ավելորդ ներկայացումների,


0:23 - introductions let us jump right into it. so corpus linguistics such an interesting field wouldn't you  

0:23 - եկեք անմիջապես սկսենք։ Կորպուսային լեզվաբանությունը շատ հետաքրքիր ոլորտ է, չէ՞։


0:29 - say? all right so what is corpus linguistics? to give you a very simple, very broad definition, What is Corpus Linguistics?  

0:29 - Լավ, ինչ է կորպուսային լեզվաբանությունը։ Շատ պարզ եւ լայն սահմանմամբ, ինչ է կորպուսային լեզվաբանությունը։


0:35 - corpus linguistics is the study of language using corpora, which is plural for corpus. I know that  

0:35 - Կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է կորպուսների միջոցով, որը կորպուսի հոգնակի ձեւն է։


0:42 - this is a weird plural but hey! Who am I to judge? I am not even a native speaker of English. anyway  

0:42 - Գիտեմ, որ սա տարօրինակ հոգնակի ձեւ է, բայց ով եմ ես, որ դատեմ։ Ես նույնիսկ անգլերենի բնիկ խոսնակ չեմ։


0:48 - so what does a corpus mean? "study languages using a corpus." well corpus is a word which is derived  

0:48 - Ինչ է նշանակում կորպուս։ «ուսումնասիրել լեզուները կորպուսի միջոցով»։ Կորպուսը բառ է, որը գալիս է


0:54 - from the latin word, surprise surprise, corpus which literally translates to body. now obviously  

0:54 - լատիներեն բառից, զարմանք զարմանք, կորպուս, որը բառացիորեն թարգմանվում է որպես մարմին։


1:02 - body here does not refer to the physical body rather it refers to a body of texts. so a corpus  

1:02 - Այստեղ մարմինը չի վերաբերում ֆիզիկական մարմնին, այլ վերաբերում է տեքստերի մարմնին։


1:09 - is simply or to put it very broad a collection or a body of texts. so corpus linguistics is studying  

1:09 - Այսպիսով, կորպուսը պարզապես կամ լայնորեն ասած տեքստերի հավաքածու է։ Կորպուսային լեզվաբանությունը ուսումնասիրում է


1:18 - language using a collection of texts. how is this done? you might be wondering. I am glad you  

1:18 - լեզուն տեքստերի հավաքածուի միջոցով։ Ինչպես է դա արվում։ Դուք կարող եք հետաքրքրվել։ Ես ուրախ եմ, որ


1:25 - asked! well let us give an example to illustrate these points. say that you're an English teacher,  

1:25 - հարցրեցիք։ Եկեք տանք մի օրինակ՝ այս կետերը պարզաբանելու համար։ Ենթադրենք, դուք անգլերենի ուսուցիչ եք,


1:31 - alright and the happy little ones are your students, and say that you have been teaching  

1:31 - եւ ուրախ փոքրիկները ձեր աշակերտներն են, եւ ենթադրենք, որ դուք նրանց դասավանդում եք


1:38 - them for about two years now and at this point you are interested in seeing how they use their  

1:38 - արդեն մոտ երկու տարի եւ այս պահին դուք հետաքրքրված եք տեսնելու, թե ինչպես են նրանք օգտագործում իրենց


1:43 - English. more specifically, you're interested in investigating the following: what are the three  

1:43 - անգլերենը։ Ավելի կոնկրետ, դուք հետաքրքրված եք հետազոտելու հետեւյալը՝ որոնք են երեք


1:49 - most frequent words that my students use in their writings, and you would also like to know how they  

1:49 - ամենահաճախ օգտագործվող բառերը, որոնք իմ ուսանողները օգտագործում են իրենց գրություններում, եւ դուք կցանկանայիք իմանալ, թե ինչպես են նրանք


1:55 - use these words in their writings. so take a second here and think how would you do this  

1:55 - օգտագործում այս բառերը իրենց գրություններում։ Այսպիսով, մի պահ մտածեք, թե ինչպես կկատարեիք դա


2:02 - how would you investigate these two questions? pause the video if you like and I will continue  

2:02 - ինչպես կքննեք այս երկու հարցերը։ Դադարեցրեք տեսանյութը, եթե ցանկանում եք, եւ ես կշարունակեմ


2:08 -... in three two and one. so as you have rightly predicted you'll start by collecting your students  

2:08 -... երեք, երկու եւ մեկ։ Այսպիսով, ինչպես ճիշտ կանխատեսեցիք, դուք կսկսեք ձեր ուսանողների գրությունները հավաքելով։


2:16 - writings. then you will calculate the number of words that they have used in their writings,  

2:16 - Հետո դուք կկատարեք նրանց գրություններում օգտագործված բառերի քանակի հաշվարկը,


2:22 - and then once you have calculated all the words ... the number of all the words that they have  

2:22 - եւ հետո երբ դուք հաշվարկեք բոլոր բառերը ... բոլոր բառերի քանակը, որոնք նրանք օգտագործել են,


2:27 - used, you will generate frequency lists of all these words and then rank them from the most  

2:27 - դուք կստեղծեք այս բոլոր բառերի հաճախականության ցուցակներ եւ ապա դրանք դասակարգեք ամենաշատից


2:33 - frequent word to the least frequent word. now say after doing this you get the following results: The total number of words: 800  

2:33 - հաճախ օգտագործվող բառից մինչեւ ամենաքիչ օգտագործվող բառը։ Ենթադրենք, այս ամենից հետո դուք ստանում եք հետեւյալ արդյունքները՝


2:39 - the total numbers of words, the total number sorry of words that your students have used is  

2:39 - ընդհանուր բառերի քանակը, ներողություն, ընդհանուր բառերի քանակը, որոնք ձեր ուսանողները օգտագործել են, կազմում է


2:45 - 800 and the three most frequent ones are "the" which occurred 48 times "for" which occurred  

2:45 - 800 եւ երեք ամենահաճախ օգտագործվողները «the»-ն է, որը հանդիպել է 48 անգամ, «for»-ը, որը հանդիպել է


2:52 - 20 times and "I" which occurred 12 times. so concerning the first task, give yourself  

2:52 - 20 անգամ եւ «I»-ն, որը հանդիպել է 12 անգամ։ Այսպիսով, առաջին առաջադրանքի վերաբերյալ, շնորհավորեք ինքներդ ձեզ,


2:59 - a round of applause, you have successfully completed it. now how about the second task?  

2:59 - դուք հաջողությամբ ավարտել եք այն։ Իսկ ինչ կասեք երկրորդ առաջադրանքի մասին։


3:04 - remember, you were interested in seeing how they use each of these words. so in order to see how  

3:04 - հիշեք, դուք հետաքրքրված էիք տեսնելու, թե ինչպես են նրանք օգտագործում այս բառերից յուրաքանչյուրը։ Այսպիսով, որպեսզի տեսնեք, թե ինչպես


3:09 - they use the word 'the' you need again to go back to the papers and look for all of the 48 instances  

3:09 - նրանք օգտագործում են «the» բառը, դուք պետք է նորից վերադառնաք գրություններին եւ փնտրեք բոլոր 48 դեպքերը


3:15 - of the word "the" do the same for "for" and then do the same for "I".. as you can already imagine  

3:15 - «the» բառի, նույնը կատարեք «for»-ի համար եւ ապա նույնը կատարեք «I»-ի համար։ Ինչպես արդեն պատկերացնում եք,


3:22 - this is a laborious activity. it will take so much time and so much effort and chances are you may  

3:22 - սա աշխատատար գործունեություն է։ Դա կպահանջի շատ ժամանակ եւ շատ ջանքեր, եւ հավանական է, որ դուք կարող եք


3:28 - make certain mistakes calculating the number of words and so on and so forth.. because hey, we're  

3:28 - կատարել որոշ սխալներ բառերի քանակի հաշվարկի եւ այլնի մեջ... որովհետեւ մենք բոլորս մարդիկ ենք,


3:33 - all humans we are not right all the time right? and imagine if you had large amounts of data,  

3:33 - մենք միշտ ճիշտ չենք, չէ՞։ Եվ պատկերացրեք, եթե դուք ունենայիք մեծ քանակությամբ տվյալներ,


3:39 - say thousands of words or millions of words, it would be quite impossible wouldn't you say? yeah  

3:39 - ասենք հազարավոր բառեր կամ միլիոնավոր բառեր, դա բավականին անհնար կլիներ, չէ՞։ Այո,


3:46 - so it would be lovely if there were some software that can do this for you. well lucky for us here  

3:46 - այնպես որ, լավ կլիներ, եթե լիներ մի ծրագրակազմ, որը կարող էր դա անել ձեզ համար։ Դե, մեզ համար բախտավոր է,


3:54 - there are some software available that do exactly this and more. so these software are what corpus  

3:54 - կան որոշ ծրագրակազմեր, որոնք անում են հենց դա եւ ավելին։ Այս ծրագրակազմերն են, որոնք կորպուսային


4:01 - linguists use in order to carry out linguistic research. so in a nutshell this is what corpus  

4:01 - լեզվաբանները օգտագործում են լեզվաբանական հետազոտություններ իրականացնելու համար։ Այսպիսով, կարճ ասած, սա է կորպուսային


4:07 - linguistics is all about. you as a researcher are interested in a certain linguistic phenomenon you  

4:07 - լեզվաբանության ամբողջ իմաստը։ Դուք՝ որպես հետազոտող, հետաքրքրված եք որոշակի լեզվաբանական երեւույթով,


4:14 -... collect your data or your corpus accordingly that is according to your research objectives and then  

4:14 - հավաքում եք ձեր տվյալները կամ ձեր կորպուսը համապատասխանաբար՝ ըստ ձեր հետազոտական նպատակների, եւ ապա


4:20 - in order to analyze the data you use some specific software so yeah this is an oversimplification of  

4:20 - տվյալների վերլուծության համար օգտագործում եք որոշակի ծրագրակազմ։ Այսպիսով, այո, սա կորպուսային լեզվաբանության


4:29 - what corpus linguistics. so up until this point, we have given a very simplistic definition (yeah  

4:29 - չափազանց պարզեցում է։ Այսպիսով, մինչ այս պահը, մենք տվել ենք շատ պարզ սահմանում (այո,


4:36 - I used that word a lot, right?) anyway we have given a very broad and very simplistic  

4:36 - ես շատ եմ օգտագործել այդ բառը, չէ՞)։ Ամեն դեպքում, մենք տվել ենք շատ լայն եւ շատ պարզ


4:41 - definition and it doesn't really do justice to what corpus linguistics is.. but yeah it's helpful  

4:41 - սահմանում, եւ դա իսկապես արդարություն չի անում կորպուսային լեզվաբանությանը... բայց այո, դա օգտակար է


4:46 - to to get us started and to have a general idea of what is it that corpus linguists do?  

4:46 - մեզ համար սկսելու եւ ընդհանուր գաղափար ունենալու համար, թե ինչ են անում կորպուսային լեզվաբանները։


4:52 - now we will move to more informative and more detailed definition we start with the corpus so we What is a Corpus?  

4:52 - հիմա մենք կանցնենք ավելի ինֆորմատիվ եւ ավելի մանրամասն սահմանմանը։ Մենք սկսում ենք կորպուսից, այնպես որ


5:01 - have seen that a corpus is a collection of texts but it's more than that a corpus is a principled  

5:01 - մենք տեսել ենք, որ կորպուսը տեքստերի հավաքածու է, բայց դա ավելին է, քան դա։ Կորպուսը սկզբունքային


5:07 - and large collection or body of authentic texts that are stored in a computer and analyzed using  

5:07 - եւ մեծ հավաքածու կամ մարմին է իսկական տեքստերի, որոնք պահվում են համակարգչում եւ վերլուծվում են


5:14 - software designed for corpus analysis. now I know that this is a large definition but  

5:14 - ծրագրակազմի միջոցով, որը նախատեսված է կորպուսի վերլուծության համար։ Հիմա գիտեմ, որ սա մեծ սահմանում է, բայց


5:20 - it's really interesting. now let's read this once again corpus is a principled and large collection  

5:20 - դա իսկապես հետաքրքիր է։ Հիմա եկեք նորից կարդանք սա՝ կորպուսը սկզբունքային եւ մեծ հավաքածու է


5:27 - of authentic texts that are stored in a computer and analyzed using software designed for corpus  

5:27 - իսկական տեքստերի, որոնք պահվում են համակարգչում եւ վերլուծվում են կորպուսի վերլուծության համար նախատեսված ծրագրակազմի միջոցով։


5:33 - analysis. now we have a bunch of keywords here and we need to stop at each one of them. so I'll  

5:33 - Հիմա մենք ունենք մի շարք հիմնաբառեր, եւ մենք պետք է կանգնենք դրանցից յուրաքանչյուրի վրա։ Այսպիսով, ես


5:38 - highlight them for you here they are: principled, large collections, authentic texts, stored in a  

5:38 - դրանք կդարձնեմ ձեզ համար։ Ահա դրանք՝ սկզբունքային, մեծ հավաքածուներ, իսկական տեքստեր, պահված


5:44 - computer, and software. now take a second here, pause the video again if you'd like, and think  

5:44 - համակարգչում եւ ծրագրակազմ։ Հիմա մի պահ մտածեք այստեղ, դադարեցրեք տեսանյութը նորից, եթե ցանկանում եք, եւ մտածեք


5:50 - about the following: when we say principled, what do we mean by principled? and when we say large  

5:50 - հետեւյալի մասին՝ երբ մենք ասում ենք սկզբունքային, ինչ ենք մենք հասկանում սկզբունքային ասելով։ Եվ երբ մենք ասում ենք մեծ


5:55 - collection of authentic texts, what does authentic texts refer to? and how large should it be? is it  

5:55 - հավաքածու իսկական տեքստերի, ինչ է նշանակում իսկական տեքստեր։ Եվ ինչքան մեծ պետք է լինի դա։ Արդյո՞ք դա


6:02 - hundreds of words? thousands of words? millions? dare I say billions? stored in a computer, what  

6:02 - հարյուրավոր բառեր։ հազարավոր բառեր։ միլիոնավոր։ համարձակվեմ ասել՝ միլիարդավոր։ պահված համակարգչում, ինչ


6:11 - can a computer do other than give us frequencies? and so on and so forth and what can't a computer  

6:11 - կարող է անել համակարգիչը, բացի մեզ հաճախականություններ տալուց։ եւ այլն եւ այլն, եւ ինչ չի կարող անել համակարգիչը։


6:16 - do? and finally software, what software are we talking about? and are there any software  

6:16 - եւ վերջապես ծրագրակազմ, ինչ ծրագրակազմի մասին ենք խոսում։ եւ արդյո՞ք կան ծրագրակազմեր,


6:22 - available for the public? that is for free ;) all right so think about these questions and I will  

6:22 - հասանելի հանրության համար։ այսինքն՝ անվճար ;) լավ, մտածեք այս հարցերի մասին, եւ ես


6:27 -... continue again in three two and one so a principle collection of texts let us go back to the example A principled collection of texts  

6:27 -... կշարունակեմ նորից երեք, երկու եւ մեկ։ Այսպիսով, սկզբունքային տեքստերի հավաքածու։ Եկեք վերադառնանք օրինակին,


6:36 - that we have started our conversation with, in which you were the teacher, you were interested  

6:36 - որով մենք սկսել ենք մեր զրույցը, որտեղ դուք ուսուցիչ էիք, դուք հետաքրքրված էիք


6:40 - in investigating your students' language and so on and so forth. so remember, you were interested in  

6:40 - ձեր ուսանողների լեզուն հետազոտելու եւ այլն եւ այլն։ Այսպիսով, հիշեք, դուք հետաքրքրված էիք


6:44 - seeing how your students use English in their writings. so what did you do? did you collect  

6:44 - տեսնելու, թե ինչպես են ձեր ուսանողները օգտագործում անգլերենը իրենց գրություններում։ Այսպիսով, ինչ արեցիք։ Արդյո՞ք դուք հավաքեցիք


6:50 - your students oral reproduction? did you collect your students grammar assignments? No, you've  

6:50 - ձեր ուսանողների բանավոր վերարտադրությունը։ Արդյո՞ք դուք հավաքեցիք ձեր ուսանողների քերականական առաջադրանքները։ Ոչ, դուք


6:55 - collected your students writings. so since you have already a goal or an objective in mind then

6:55 - հավաքեցիք ձեր ուսանողների գրությունները։ Այսպիսով, քանի որ դուք արդեն ունեք նպատակ կամ խնդիր մտքում, ապա


7:01 - you collect your data according to that objective. so this is what we mean by principled collection

7:01 - դուք հավաքում եք ձեր տվյալները ըստ այդ նպատակի։ Այսպիսով, սա է այն, ինչ մենք հասկանում ենք սկզբունքային հավաքածու ասելով։


7:08 - of texts. collecting the texts for the corpus is a planned operation and not random and researchers

7:08 - տեքստերի։ Տեքստերի հավաքումը կորպուսի համար պլանավորված գործողություն է եւ ոչ պատահական, եւ հետազոտողները


7:16 - normally have a research question in mind before they start compiling or designing the corpus.

7:16 - սովորաբար ունենում են հետազոտական հարց իրենց մտքում, նախքան կորպուսը կազմելն ու նախագծելը։


7:20 - so yeah collecting data for the corpus is not a random operation you cannot just collect random

7:20 - Այսպիսով, այո, կորպուսի համար տվյալների հավաքումը պատահական գործողություն չէ։ Դուք չեք կարող պարզապես պատահականորեն հավաքել


7:26 - texts and claim that these are the texts for the corpus it doesn't really work that way so

7:26 - տեքստեր եւ պնդել, որ դրանք են կորպուսի տեքստերը։ Դա իսկապես այդպես չի աշխատում։


7:31 - you need to have a goal in mind or an objective, a research objective, and then collect your data

7:31 - Դուք պետք է ունենաք նպատակ կամ հետազոտական նպատակ, եւ ապա հավաքեք ձեր տվյալները


7:36 - according to that objective. so that is it for principled. now what about large collection of

7:36 - ըստ այդ նպատակի։ Այսպիսով, դա է սկզբունքայինի մասին։ Հիմա ինչ կասեք մեծ հավաքածուի մասին


7:42 - authentic texts? what do we mean by authentic texts? well to put it very simply authentic texts

7:42 - իսկական տեքստերի։ Ինչ ենք մենք հասկանում իսկական տեքստեր ասելով։ Դե, շատ պարզ ասած, իսկական տեքստերը


7:48 - refer to naturally occurring examples of language be them spoken or written, and to give a quote by

7:48 - վերաբերում են լեզվի բնական օրինակներին, լինի դա բանավոր կամ գրավոր, եւ Սինքլերի խոսքերով ասած


7:56 - Sinclair by the way Sinclair is one of the most important scholars in Corpus linguistics and I

7:56 - ի դեպ, Սինքլերը կորպուսային լեզվաբանության ամենակարեւոր գիտնականներից մեկն է, եւ ես


8:02 - highly suggest that you read his work. anyway to use Sinclair's words, authentic texts refer to

8:02 - շատ եմ խորհուրդ տալիս կարդալ նրա աշխատանքները։ Ամեն դեպքում, Սինքլերի խոսքերով, իսկական տեքստերը վերաբերում են


8:09 - genuine communications of people going about their normal business. so I think that you already have

8:09 - մարդկանց իրական հաղորդակցություններին, որոնք զբաղվում են իրենց սովորական գործերով։ Այսպիսով, ես կարծում եմ, որ դուք արդեն ունեք


8:16 - an idea about what authentic texts refer to, naturally-occurring examples of language, so,

8:16 - գաղափար, թե ինչ են նշանակում իսկական տեքստեր, լեզվի բնական օրինակներ, այսպիսով,


8:20 - not artificial not controlled types of language but rather how people use their language naturally

8:20 - ոչ արհեստական, ոչ վերահսկվող լեզվի տեսակներ, այլ ինչպես մարդիկ օգտագործում են իրենց լեզուն բնական


8:26 -... normally again to give a very simplistic example let's go back to the example in which you were

8:26 -... սովորաբար։ Նորից շատ պարզ օրինակ տալու համար եկեք վերադառնանք օրինակի, որտեղ դուք


8:31 - the teacher and you were again interested in investigating how your students use their English

8:31 - ուսուցիչ էիք, եւ դուք նորից հետաքրքրված էիք հետազոտելու, թե ինչպես են ձեր ուսանողները օգտագործում իրենց անգլերենը


8:35 - but this time you're interested in seeing how they use their language orally. so you can't give

8:35 - բայց այս անգամ դուք հետաքրքրված եք տեսնելու, թե ինչպես են նրանք օգտագործում իրենց լեզուն բանավոր։ Այսպիսով, դուք չեք կարող տալ


8:43 - them dialogues that are already provided in the course book and make them repeat these dialogues,

8:43 - նրանց երկխոսություններ, որոնք արդեն տրամադրված են դասագրքում, եւ ստիպել նրանց կրկնել այդ երկխոսությունները,


8:50 - record them, transcribed them, and claim that this is your corpus. it's not really a corpus

8:50 - ձայնագրել դրանք, տառադարձել դրանք, եւ պնդել, որ սա ձեր կորպուսն է։ Դա իսկապես կորպուս չէ,


8:54 - because that text is not an authentic text. that oral production is not how your students

8:54 - քանի որ այդ տեքստը իսկական տեքստ չէ։ Այդ բանավոր արտադրությունը ձեր ուսանողների


9:01 - use their language naturally. it did not come from them. rather they just repeated what other people

9:01 - լեզուն բնականորեն օգտագործելու ձեւը չէ։ Դա նրանցից չի եկել։ Նրանք պարզապես կրկնել են այն, ինչ ուրիշ մարդիկ


9:06 - have already written. so in order to collect authentic texts from your students your students,

9:06 - արդեն գրել են։ Այսպիսով, ձեր ուսանողներից իսկական տեքստեր հավաքելու համար ձեր ուսանողները


9:13 - have to use their language naturally. so this is what we mean by authentic texts. now, for "a large

9:13 - պետք է օգտագործեն իրենց լեզուն բնականորեն։ Այսպիսով, սա է այն, ինչ մենք հասկանում ենք իսկական տեքստեր ասելով։ Հիմա, «մեծ


9:21 - collection of authentic texts". how large should it be? well there isn't really a straightforward

9:21 - հավաքածու իսկական տեքստերի»։ Ինչքան մեծ պետք է լինի։ Դե, իսկապես չկա միանշանակ


9:27 - answer there isn't one definitive answer rather sorry yeah it will depend on the type of the

9:27 - պատասխան, չկա միանշանակ պատասխան, ներողություն, այո, դա կախված կլինի կորպուսի տեսակից


9:34 - corpus and the research objectives. so I'll give you an example, the British national corpus,

9:34 - եւ հետազոտական նպատակներից։ Այսպիսով, ես կտամ ձեզ մի օրինակ՝ Բրիտանական ազգային կորպուսը,


9:41 - the BNC, is a general corpus. so it reflects how British people use English in a variety

9:41 - BNC-ն, ընդհանուր կորպուս է։ Այն արտացոլում է, թե ինչպես են բրիտանացիները օգտագործում անգլերենը տարբեր


9:47 - of contexts. so that is why the British national corpus is made of 100 million words yeah more than

9:47 - համատեքստերում։ Այսպիսով, այդ պատճառով Բրիտանական ազգային կորպուսը կազմված է 100 միլիոն բառերից, այո, ավելի քան


9:55 - 100 million words. so it's quite large, but why? because the British national corpus contains texts

9:55 - 100 միլիոն բառերից։ Այն բավականին մեծ է, բայց ինչու։ Քանի որ Բրիտանական ազգային կորպուսը պարունակում է տեքստեր


10:02 - that are collected from journals, from newspapers, from TV shows, from academic writings, novels,

10:02 - որոնք հավաքված են ամսագրերից, թերթերից, հեռուստահաղորդումներից, ակադեմիական գրություններից, վեպերից,


10:09 - people's normal everyday conversations, formal informal and so on and so forth. so it's a large

10:09 - մարդկանց սովորական ամենօրյա խոսակցություններից, պաշտոնական ոչ պաշտոնական եւ այլն։ Այսպիսով, դա մեծ


10:15 - amount of data but why? because it should reflect how British people use English generally, in a

10:15 - քանակությամբ տվյալներ են, բայց ինչու։ Քանի որ այն պետք է արտացոլի, թե ինչպես են բրիտանացիները օգտագործում անգլերենը ընդհանուր առմամբ, տարբեր


10:22 - variety of contexts. so in this case, you need large amounts of data, but if you're interested

10:22 - համատեքստերում։ Այս դեպքում, ձեզ անհրաժեշտ է մեծ քանակությամբ տվյալներ, բայց եթե դուք հետաքրքրված եք


10:27 - in seeing how just a limited or a certain very specific group of people use their language,

10:27 - տեսնելու, թե ինչպես է միայն սահմանափակ կամ որոշակի շատ հատուկ խումբ մարդիկ օգտագործում իրենց լեզուն,


10:32 - be it English or Spanish or whatever.. then you wouldn't need that huge amount of data. A few

10:32 - լինի դա անգլերեն կամ իսպաներեն կամ ինչ էլ որ լինի։ Այդ դեպքում ձեզ անհրաժեշտ չէ այդքան մեծ քանակությամբ տվյալներ։ Մի քանի


10:39 - million words would suffice.... so how large should the corpus be? it would depend on your research

10:39 - միլիոն բառերը բավական կլինեն։ Այսպիսով, ինչքան մեծ պետք է լինի կորպուսը։ Դա կախված կլինի ձեր հետազոտական


10:45 - objectives and the type of the corpus that you're going for, but the convention is that it's usually

10:45 - նպատակներից եւ կորպուսի տեսակից, որը դուք ընտրում եք, բայց սովորաբար դա միլիոնավոր բառեր է։


10:50 - millions of words. although it's not always the case. so you do your own readings and you you'll

10:50 - թեեւ դա միշտ չէ, որ այդպես է։ Այսպիսով, դուք կատարեք ձեր սեփական ընթերցումները եւ դուք կգտնեք


10:57 - discover things on your own. anyway, why large and why authentic? well remember that a corpus

10:57 - բաներ ինքնուրույն։ Ամեն դեպքում, ինչու մեծ եւ ինչու իսկական։ Հիշեք, որ կորպուսը


11:05 - is a representative sample of language use. you cannot possibly collect all of the instances of

11:05 - լեզվի օգտագործման ներկայացուցչական նմուշ է։ Դուք հնարավոր չէ հավաքել բոլոր դեպքերը


11:11 - any language. it's quite impossible. you'd need to to be with all of the people at the

11:11 - ցանկացած լեզվի։ Դա բավականին անհնար է։ Դուք պետք է լինեք բոլոր մարդկանց հետ


11:17 - same time and record their conversations and so on all the time.. that's quite impossible,

11:17 - միաժամանակ եւ ձայնագրեք նրանց խոսակցությունները եւ այլն։ Դա բավականին անհնար է,


11:22 - so a corpus should be large enough and authentic enough so that it represents

11:22 - այնպես որ կորպուսը պետք է լինի բավականին մեծ եւ իսկական, որպեսզի այն ներկայացնի


11:29 - the language you intend to investigate. so that is why we need as large as possible amounts of

11:29 - այն լեզուն, որը դուք մտադիր եք հետազոտել։ Այդ պատճառով մեզ անհրաժեշտ է հնարավորինս մեծ քանակությամբ


11:36 - data and of course it should be authentic. Alright moving on. "Stored in a computer"

11:36 - տվյալներ, եւ իհարկե, դա պետք է լինի իսկական։ Լավ, անցնենք առաջ։ «Պահված համակարգչում»


11:44 - why do we need to sort our data in a computer? I think it's quite obvious come on! storing texts

11:44 - ինչու մենք պետք է պահենք մեր տվյալները համակարգչում։ Ես կարծում եմ, դա բավականին ակնհայտ է։ Տեքստերի պահպանումը


11:51 - in a computer makes the corpus analysis easy, more precise, and more accurate. so the computer allows

11:51 - համակարգչում կորպուսի վերլուծությունը դարձնում է հեշտ, ավելի ճշգրիտ եւ ավելի ճիշտ։ Այսպիսով, համակարգիչը թույլ է տալիս


11:59 - for fast and accurate analysis of large amounts of data. now why did they use the word the word

11:59 - արագ եւ ճշգրիտ վերլուծություն մեծ քանակությամբ տվյալների։ Հիմա ինչու նրանք օգտագործեցին բառը


12:05 - accurate between inverted commas? of course the the computer can give you very precise and very

12:05 - «ճշգրիտ» կրկնակի չակերտների մեջ։ Իհարկե, համակարգիչը կարող է տալ ձեզ շատ ճշգրիտ եւ շատ


12:13 - accurate numbers. there is no doubt about that. but is the analysis accurate? well that would

12:13 - ճշգրիտ թվեր։ Դրանում կասկած չկա։ Բայց արդյո՞ք վերլուծությունը ճշգրիտ է։ Դե, դա կախված կլինի


12:19 - depend on how you design the corpus, what statistical measures you use to analyze your

12:19 - այն բանից, թե ինչպես եք դուք նախագծում կորպուսը, ինչ վիճակագրական միջոցներ եք օգտագործում ձեր


12:26 - data and so on... we will talk about statistics in corpus linguistics in later videos. so what more?

12:26 - տվյալների վերլուծության համար եւ այլն։ Մենք կխոսենք վիճակագրության մասին կորպուսային լեզվաբանության մեջ հետագա տեսանյութերում։ Այսպիսով, ինչ ավելին։


12:33 - yeah computers can give insights into patterns not easily detectable by humans. well since the

12:33 - այո, համակարգիչները կարող են տալ պատկերացումներ այն ձեւերի մասին, որոնք հեշտությամբ չեն հայտնաբերվում մարդկանց կողմից։ Քանի որ


12:39 - computer analyzes millions and millions of data then of course some patterns will emerge and these

12:39 - համակարգիչը վերլուծում է միլիոնավոր եւ միլիոնավոր տվյալներ, ապա իհարկե որոշ ձեւեր կհայտնվեն, եւ այս


12:45 - patterns may not be easily detectable by us or by following our intuition. so the computer has that

12:45 - ձեւերը հեշտությամբ չեն հայտնաբերվի մեզ կամ մեր ինտուիցիայով։ Այսպիսով, համակարգիչն ունի այդ


12:53 - advantage and unfortunately since everything has its limitations,... well a computer too, no matter

12:53 - առավելությունը, եւ ցավոք, քանի որ ամեն ինչ ունի իր սահմանափակումները,... դե, համակարգիչն էլ, անկախ


13:01 - how good it is, has its limitations. I'll give you an example. there is an interesting research

13:01 - որքան լավ է, ունի իր սահմանափակումները։ Ես կտամ ձեզ մի օրինակ։ Կա հետաքրքիր հետազոտություն


13:06 - carried out by this gentleman here, Dr. Brezina who is also by the way one of the most important

13:06 - իրականացված այս պարոնի կողմից, դոկտոր Բրեզինայի, ով ի դեպ կորպուսային լեզվաբանության ամենակարեւոր


13:14 - scholars in modern corpus linguistics, what can corpora tell us about learning a foreign language?

13:14 - գիտնականներից մեկն է։ Ի՞նչ կարող են կորպուսները մեզ ասել օտար լեզու սովորելու մասին։


13:21 - quite a lot actually. anyway he did a very interesting research in which he found that male

13:21 - իրականում շատ բան։ Ամեն դեպքում, նա կատարեց շատ հետաքրքիր հետազոտություն, որի արդյունքում պարզեց, որ տղամարդ


13:30 - british speakers use personal pronouns less than female british speakers. now this is something

13:30 - բրիտանացի խոսնակները անձնական դերանուններ ավելի քիչ են օգտագործում, քան կին բրիտանացի խոսնակները։ Սա այն է,


13:38 - that the computer can tell you in terms of numbers and frequencies and so on.. but a computer cannot

13:38 - ինչ համակարգիչը կարող է ասել ձեզ թվերի եւ հաճախականությունների առումով եւ այլն։ Բայց համակարգիչը չի կարող


13:44 - tell you why. why do female British speakers use personal pronouns more than male speakers do? the

13:44 - ասել, թե ինչու։ Ինչու են կին բրիտանացի խոսնակները ավելի շատ օգտագործում անձնական դերանուններ, քան տղամարդ խոսնակները։ 


13:51 - computer cannot tell you that so it is up to you the researcher to give qualitative explanations

13:51 - համակարգիչը չի կարող ասել դա, այնպես որ դա ձեր՝ հետազոտողի գործն է տալ որակական բացատրություններ


13:56 - to the data. so a computer can do quantitative analysis very precisely and very accurately,

13:56 - տվյալներին։ Այսպիսով, համակարգիչը կարող է կատարել քանակական վերլուծություն շատ ճշգրիտ եւ շատ ճիշտ,


14:03 - and it's up to you the researcher to do whatever qualitative interpretations of that data. all

14:03 - եւ դա ձեր՝ հետազոտողի գործն է կատարել որակական մեկնաբանություններ այդ տվյալների վերաբերյալ։


14:11 - right now "software for corpus analysis" and I know that this is what you are interested in. you

14:11 - հիմա «ծրագրակազմ կորպուսի վերլուծության համար» եւ ես գիտեմ, որ սա է այն, ինչ ձեզ հետաքրքրում է։ Դուք


14:17 - want to have some fun investigating whatever language you are interested in. so anyway,

14:17 - ցանկանում եք զվարճանալ հետազոտելով այն լեզուն, որը ձեզ հետաքրքրում է։ Ամեն դեպքում,


14:23 - software for corpus analysis. are there any software available for free? are there any

14:23 - ծրագրակազմ կորպուսի վերլուծության համար։ Արդյո՞ք կան ծրագրակազմեր, որոնք հասանելի են անվճար։ Արդյո՞ք կան


14:27 - good ones? well my friend yes! there are a bunch of them but I highly suggest these two. Lancsbox

14:27 - լավերը։ Դե, իմ ընկեր, այո՛։ Կան դրանցից մի քանիսը, բայց ես շատ եմ խորհուրդ տալիս այս երկուսը։ Lancsbox


14:35 - and AntConc. they are available for free. they will not take much space in your computer,

14:35 - եւ AntConc։ Դրանք հասանելի են անվճար։ Դրանք շատ տեղ չեն զբաղեցնի ձեր համակարգչում,


14:39 - which is always a plus, and they're user friendly. they are fairly easy to use and yeah you can carry

14:39 - ինչը միշտ դրական է, եւ դրանք օգտագործողի համար հարմար են։ Դրանք բավականին հեշտ են օգտագործման համար, եւ այո, դուք կարող եք կատարել


14:46 - out your first corpus analyses using either one of these two and I will talk about them in

14:46 - ձեր առաջին կորպուսային վերլուծությունները՝ օգտագործելով այս երկուսից որեւէ մեկը, եւ ես կխոսեմ դրանց մասին


14:51 - future videos. anyway so what does a corpus look like? very simply this is a corpus, it's just a

14:51 - հետագա տեսանյութերում։ Ամեն դեպքում, ինչպիսի՞ն է կորպուսը։ Շատ պարզ՝ սա է կորպուսը, դա պարզապես


15:01 - collection of texts which are collected according to one's research objectives. that's it. so what

15:01 - տեքստերի հավաքածու է, որոնք հավաքվում են ըստ մեկի հետազոտական նպատակների։ Այդքանը։ Այսպիսով, ինչ


15:08 - is corpus linguistics?... to go back to the question that we have started our presentation with. yes

15:08 - է կորպուսային լեզվաբանությունը։ Վերադառնանք այն հարցին, որով մենք սկսեցինք մեր ներկայացումը։ Այո,


15:14 - we have seen that corpus linguistics is the study of language using corpora. what else?

15:14 - մենք տեսանք, որ կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է կորպուսների միջոցով։ Ինչ ավելին։


15:21 - corpus linguistics is not a theory of language. so it does not explain how we acquire language

15:21 - Կորպուսային լեզվաբանությունը լեզվի տեսություն չէ։ Այսպիսով, այն չի բացատրում, թե ինչպես ենք մենք ձեռք բերում լեզուն


15:26 - or whatever any of that. it's just a tool or a method to study language and investigate

15:26 - կամ նման բաներ։ Դա պարզապես գործիք է կամ մեթոդ՝ լեզուն ուսումնասիրելու եւ հետազոտելու


15:33 - linguistic phenomena. that's it. so to conclude, what have we learned today? I'll ask you some

15:33 - լեզվաբանական երեւույթները։ Այդքանը։ Այսպիսով, եզրափակելու համար, ինչ սովորեցինք այսօր։ Ես կտամ ձեզ մի քանի


15:39 - questions do not cheat and make sure to answer them to see if you have grasped most of the ideas

15:39 - հարցեր, մի խաբեք եւ համոզվեք, որ պատասխանում եք դրանց՝ տեսնելու համար, թե արդյոք դուք հասկացել եք այս տեսանյութում ներկայացված գաղափարների մեծ մասը։


15:45 - presented in this video. so what is a corpus? yeah a corpus is a large collection of authentic texts

15:45 - Այսպիսով, ի՞նչ է կորպուսը։ Այո, կորպուսը իսկական տեքստերի մեծ հավաքածու է,


15:55 - that are stored in a computer analyzed using software designed for corpus analysis. Why

15:55 - որոնք պահվում են համակարգչում եւ վերլուծվում են կորպուսի վերլուծության համար նախատեսված ծրագրակազմի միջոցով։ Ինչու


16:01 - principled and large collections of authentic texts? yeah, according to one's objectives,

16:01 - սկզբունքային եւ մեծ հավաքածուներ իսկական տեքստերի։ Այո, ըստ մեկի նպատակների,


16:11 - a corpus should be a representative sample of language use in light of those objectives. so if

16:11 - կորպուսը պետք է լինի լեզվի օգտագործման ներկայացուցչական նմուշ՝ այդ նպատակների լույսի ներքո։ Այսպիսով, եթե


16:16 - you're interested in seeing how people use, for instance Spanish orally in Spain, then you need

16:16 - դուք հետաքրքրված եք տեսնելու, թե ինչպես են մարդիկ օգտագործում, օրինակ, իսպաներենը բանավոր Իսպանիայում, ապա դուք պետք է


16:22 - to collect oral data of Spanish production again in Spain, so on so forth. what else? yeah what is

16:22 - հավաքեք իսպաներենի բանավոր արտադրության տվյալներ նորից Իսպանիայում, եւ այլն։ Ինչ ավելին։ Այո, ինչ է


16:30 - corpus linguistics? this is a fairly easy question and I know that you'll get this one right! yeah

16:30 - կորպուսային լեզվաբանությունը։ Սա բավականին հեշտ հարց է, եւ ես գիտեմ, որ դուք ճիշտ կպատասխանեք այս մեկին։ Այո,


16:36 - yeah corpus linguistics is the study of language simply using corpora. it is not a theory of

16:36 - այո, կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է պարզապես կորպուսների միջոցով։ Դա լեզվի տեսություն չէ,


16:41 - language. it's only a tool or a method to investigate linguistic phenomena. so yeah some of

16:41 - դա միայն գործիք է կամ մեթոդ՝ լեզվաբանական երեւույթները հետազոտելու համար։ Այսպիսով, այո, որոշ


16:48 - the important scholars, and these are by no means the most important ones, but some of them, there's

16:48 - կարեւոր գիտնականներ, եւ սրանք ամենեւին էլ ամենակարեւորները չեն, բայց նրանցից մի քանիսը՝ կան


16:54 - Leech, Biber, Conrad McCarthy and of course Brezina. I highly suggest that you read some

16:54 - Լիչը, Բիբերը, Կոնրադ ՄաքՔարթին եւ իհարկե Բրեզինան։ Ես շատ եմ խորհուրդ տալիս, որ դուք կարդաք


17:01 - of their their work. they're really informative. but many consider Sinclair to be one of the most

17:01 - նրանց աշխատանքներից։ Դրանք իսկապես ինֆորմատիվ են։ Բայց շատերը համարում են Սինքլերին ամենակարեւոր


17:09 - important scholars in Corpus linguistics or at least modern corpus linguistics and I highly

17:09 - գիտնականներից մեկը կորպուսային լեզվաբանության մեջ կամ առնվազն ժամանակակից կորպուսային լեզվաբանության մեջ, եւ ես շատ


17:15 - suggest that you read Sinclair's work. so here are some references to get you started. You can start

17:15 - խորհուրդ եմ տալիս, որ դուք կարդաք Սինքլերի աշխատանքները։ Այսպիսով, ահա մի քանի հղումներ՝ սկսելու համար։ Դուք կարող եք սկսել


17:23 - by any one of these. they are highly informative. they helped me a lot when I first started learning

17:23 - դրանցից ցանկացածով։ Դրանք շատ ինֆորմատիվ են։ Դրանք շատ օգնեցին ինձ, երբ ես առաջին անգամ սկսեցի սովորել


17:29... about corpus linguistics and I highly suggest that you read them, or at least one of them. so this

17:29... կորպուսային լեզվաբանության մասին, եւ ես շատ խորհուրդ եմ տալիս, որ դուք կարդաք դրանք կամ առնվազն դրանցից մեկը։ Այսպիսով, սա


17:35 - brings us to the end of the video I hope that you have enjoyed it and I hope that you have learned

17:35 - մեզ բերում է տեսանյութի ավարտին։ Հուսով եմ, որ դուք հաճույք ստացաք դրանից, եւ հուսով եմ, որ դուք սովորեցիք


17:42 - or at least I have answered some of your questions and if you have further questions don't hesitate

17:42 - կամ առնվազն ես պատասխանեցի ձեր հարցերից մի քանիսին, եւ եթե դուք ունեք հետագա հարցեր, մի հապաղեք


17:47 - to leave your questions in the comment section down below. I'll do my best to answer all of

17:47 - թողնել ձեր հարցերը մեկնաբանությունների բաժնում ներքեւում։ Ես կանեմ հնարավորը՝ պատասխանելու ձեր բոլոր


17:51 - your questions. If the question requires another video I'll gladly post another video and yeah have

17:51 - հարցերին։ Եթե հարցը պահանջում է մեկ այլ տեսանյութ, ես սիրով կտեղադրեմ մեկ այլ տեսանյութ, եւ այո, ունեցեք


17:57 - a good week have a good month have a good year and see you the next video bye bye ciao ciao...

17:57 - լավ շաբաթ, լավ ամիս, լավ տարի, եւ տեսնվենք հաջորդ տեսանյութում։ Ցտեսություն, ցտեսություն...

 
 
 

Recent Posts

See All

Translation Processor

Overview Translation Processor can be viewed as one of the terminal steps in the OCR Data Pipeline or Armenian Speech-to-Text...

Comments


bottom of page