Summarizing the Transcript

aramhayr
Aug 22, 2024
23 min read

Updated: Jul 26, 2025

If the activities described in this page are illegal, please let me know - I do not want AI induced headache.

Using the instructions provided by Download the Transcript of a YouTube video chat and mimic my exchange with Perplexity you can get similar to below output for any YouTube lecture (video) that has auto- or manual transcription on.

This is the result (note that the Summary is human wirriten - compare with the one generated by Perplexity):

#1 Introduction to Corpus Linguistics - What is Corpus Linguistics?

Corpus Linguistics for Beginners series

Lecture #1

Ամփոփում

Տեսանյութը կորպուսային լեզվաբանության ներածական ակնարկ է։ Կորպուսային լեզվաբանությունը այն ոլորտն է, որն ուսումնասիրում է խոսքը կորպուսների` բնական լեզվով տեքստերի հավաքածուների (շտեմարանների), միջոցով։ Կորպուսը պետք է լինի մեծ եւ իրական (ոչ մեքենական կամ հատուկ գրված), որպեսզի լիարժեք ներկայացնի լեզվի օգտագործումը։ Կորպուսի կառուցումը ներառնում է տեքստերի հավաքումը, համակարգչում դարանումը, եւ հատուկ ծրագրերի միջոցով վերլուծությունը։ Այսպիսի ծրագրերի օրինակներն են LancsBox-ը եւ AntConc-ը։ Կորպուսային լեզվաբանությունը լեզվի տեսություն չէ, այլ մեթոդաբանական գործիք։ Այս ոլորտի կարեվոր գիտնականներ են` Սինքլերը եւ Բրեզինան. նրանց աշխատություններին ծանոթանալը կօգնի ավելի խորը հասկանալ կորպուսային լեզվաբանությունը:

Դասախոսության զուգահեռ փոխադրումը անգլերեն եւ հայերեն

0:00 - hello and welcome to this series of videos on corpus linguistics. In the next couple of weeks,

0:00 - Բարեւ եւ բարի գալուստ այս տեսանյութերի շարքին կորպուսային լեզվաբանության մասին։ Հաջորդ մի քանի շաբաթների ընթացքում

0:05 - we'll be talking about what corpus linguistics is. we'll start from the very basic notions and

0:05 - մենք կխոսենք, թե ինչ է կորպուսային լեզվաբանությունը։ Մենք կսկսենք ամենահիմնական հասկացություններից եւ

0:11 - things that you need to understand in order to get you started and then step-by-step will move

0:11 - այն բաներից, որոնք պետք է հասկանալ, որպեսզի սկսենք, եւ ապա աստիճանաբար կանցնենք

0:15 - on to more advanced topics related to the field. so yeah without wasting your time with meaningless

0:15 - ավելի բարդ թեմաների։ Այսպիսով, առանց ավելորդ ներկայացումների,

0:23 - introductions let us jump right into it. so corpus linguistics such an interesting field wouldn't you

0:23 - եկեք անմիջապես սկսենք։ Կորպուսային լեզվաբանությունը շատ հետաքրքիր ոլորտ է, չէ՞։

0:29 - say? all right so what is corpus linguistics? to give you a very simple, very broad definition, What is Corpus Linguistics?

0:29 - Լավ, ինչ է կորպուսային լեզվաբանությունը։ Շատ պարզ եւ լայն սահմանմամբ, ինչ է կորպուսային լեզվաբանությունը։

0:35 - corpus linguistics is the study of language using corpora, which is plural for corpus. I know that

0:35 - Կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է կորպուսների միջոցով, որը կորպուսի հոգնակի ձեւն է։

0:42 - this is a weird plural but hey! Who am I to judge? I am not even a native speaker of English. anyway

0:42 - Գիտեմ, որ սա տարօրինակ հոգնակի ձեւ է, բայց ով եմ ես, որ դատեմ։ Ես նույնիսկ անգլերենի բնիկ խոսնակ չեմ։

0:48 - so what does a corpus mean? "study languages using a corpus." well corpus is a word which is derived

0:48 - Ինչ է նշանակում կորպուս։ «ուսումնասիրել լեզուները կորպուսի միջոցով»։ Կորպուսը բառ է, որը գալիս է

0:54 - from the latin word, surprise surprise, corpus which literally translates to body. now obviously

0:54 - լատիներեն բառից, զարմանք զարմանք, կորպուս, որը բառացիորեն թարգմանվում է որպես մարմին։

1:02 - body here does not refer to the physical body rather it refers to a body of texts. so a corpus

1:02 - Այստեղ մարմինը չի վերաբերում ֆիզիկական մարմնին, այլ վերաբերում է տեքստերի մարմնին։

1:09 - is simply or to put it very broad a collection or a body of texts. so corpus linguistics is studying

1:09 - Այսպիսով, կորպուսը պարզապես կամ լայնորեն ասած տեքստերի հավաքածու է։ Կորպուսային լեզվաբանությունը ուսումնասիրում է

1:18 - language using a collection of texts. how is this done? you might be wondering. I am glad you

1:18 - լեզուն տեքստերի հավաքածուի միջոցով։ Ինչպես է դա արվում։ Դուք կարող եք հետաքրքրվել։ Ես ուրախ եմ, որ

1:25 - asked! well let us give an example to illustrate these points. say that you're an English teacher,

1:25 - հարցրեցիք։ Եկեք տանք մի օրինակ՝ այս կետերը պարզաբանելու համար։ Ենթադրենք, դուք անգլերենի ուսուցիչ եք,

1:31 - alright and the happy little ones are your students, and say that you have been teaching

1:31 - եւ ուրախ փոքրիկները ձեր աշակերտներն են, եւ ենթադրենք, որ դուք նրանց դասավանդում եք

1:38 - them for about two years now and at this point you are interested in seeing how they use their

1:38 - արդեն մոտ երկու տարի եւ այս պահին դուք հետաքրքրված եք տեսնելու, թե ինչպես են նրանք օգտագործում իրենց

1:43 - English. more specifically, you're interested in investigating the following: what are the three

1:43 - անգլերենը։ Ավելի կոնկրետ, դուք հետաքրքրված եք հետազոտելու հետեւյալը՝ որոնք են երեք

1:49 - most frequent words that my students use in their writings, and you would also like to know how they

1:49 - ամենահաճախ օգտագործվող բառերը, որոնք իմ ուսանողները օգտագործում են իրենց գրություններում, եւ դուք կցանկանայիք իմանալ, թե ինչպես են նրանք

1:55 - use these words in their writings. so take a second here and think how would you do this

1:55 - օգտագործում այս բառերը իրենց գրություններում։ Այսպիսով, մի պահ մտածեք, թե ինչպես կկատարեիք դա

2:02 - how would you investigate these two questions? pause the video if you like and I will continue

2:02 - ինչպես կքննեք այս երկու հարցերը։ Դադարեցրեք տեսանյութը, եթե ցանկանում եք, եւ ես կշարունակեմ

2:08 -... in three two and one. so as you have rightly predicted you'll start by collecting your students

2:08 -... երեք, երկու եւ մեկ։ Այսպիսով, ինչպես ճիշտ կանխատեսեցիք, դուք կսկսեք ձեր ուսանողների գրությունները հավաքելով։

2:16 - writings. then you will calculate the number of words that they have used in their writings,

2:16 - Հետո դուք կկատարեք նրանց գրություններում օգտագործված բառերի քանակի հաշվարկը,

2:22 - and then once you have calculated all the words ... the number of all the words that they have

2:22 - եւ հետո երբ դուք հաշվարկեք բոլոր բառերը ... բոլոր բառերի քանակը, որոնք նրանք օգտագործել են,

2:27 - used, you will generate frequency lists of all these words and then rank them from the most

2:27 - դուք կստեղծեք այս բոլոր բառերի հաճախականության ցուցակներ եւ ապա դրանք դասակարգեք ամենաշատից

2:33 - frequent word to the least frequent word. now say after doing this you get the following results: The total number of words: 800

2:33 - հաճախ օգտագործվող բառից մինչեւ ամենաքիչ օգտագործվող բառը։ Ենթադրենք, այս ամենից հետո դուք ստանում եք հետեւյալ արդյունքները՝

2:39 - the total numbers of words, the total number sorry of words that your students have used is

2:39 - ընդհանուր բառերի քանակը, ներողություն, ընդհանուր բառերի քանակը, որոնք ձեր ուսանողները օգտագործել են, կազմում է

2:45 - 800 and the three most frequent ones are "the" which occurred 48 times "for" which occurred

2:45 - 800 եւ երեք ամենահաճախ օգտագործվողները «the»-ն է, որը հանդիպել է 48 անգամ, «for»-ը, որը հանդիպել է

2:52 - 20 times and "I" which occurred 12 times. so concerning the first task, give yourself

2:52 - 20 անգամ եւ «I»-ն, որը հանդիպել է 12 անգամ։ Այսպիսով, առաջին առաջադրանքի վերաբերյալ, շնորհավորեք ինքներդ ձեզ,

2:59 - a round of applause, you have successfully completed it. now how about the second task?

2:59 - դուք հաջողությամբ ավարտել եք այն։ Իսկ ինչ կասեք երկրորդ առաջադրանքի մասին։

3:04 - remember, you were interested in seeing how they use each of these words. so in order to see how

3:04 - հիշեք, դուք հետաքրքրված էիք տեսնելու, թե ինչպես են նրանք օգտագործում այս բառերից յուրաքանչյուրը։ Այսպիսով, որպեսզի տեսնեք, թե ինչպես

3:09 - they use the word 'the' you need again to go back to the papers and look for all of the 48 instances

3:09 - նրանք օգտագործում են «the» բառը, դուք պետք է նորից վերադառնաք գրություններին եւ փնտրեք բոլոր 48 դեպքերը

3:15 - of the word "the" do the same for "for" and then do the same for "I".. as you can already imagine

3:15 - «the» բառի, նույնը կատարեք «for»-ի համար եւ ապա նույնը կատարեք «I»-ի համար։ Ինչպես արդեն պատկերացնում եք,

3:22 - this is a laborious activity. it will take so much time and so much effort and chances are you may

3:22 - սա աշխատատար գործունեություն է։ Դա կպահանջի շատ ժամանակ եւ շատ ջանքեր, եւ հավանական է, որ դուք կարող եք

3:28 - make certain mistakes calculating the number of words and so on and so forth.. because hey, we're

3:28 - կատարել որոշ սխալներ բառերի քանակի հաշվարկի եւ այլնի մեջ... որովհետեւ մենք բոլորս մարդիկ ենք,

3:33 - all humans we are not right all the time right? and imagine if you had large amounts of data,

3:33 - մենք միշտ ճիշտ չենք, չէ՞։ Եվ պատկերացրեք, եթե դուք ունենայիք մեծ քանակությամբ տվյալներ,

3:39 - say thousands of words or millions of words, it would be quite impossible wouldn't you say? yeah

3:39 - ասենք հազարավոր բառեր կամ միլիոնավոր բառեր, դա բավականին անհնար կլիներ, չէ՞։ Այո,

3:46 - so it would be lovely if there were some software that can do this for you. well lucky for us here

3:46 - այնպես որ, լավ կլիներ, եթե լիներ մի ծրագրակազմ, որը կարող էր դա անել ձեզ համար։ Դե, մեզ համար բախտավոր է,

3:54 - there are some software available that do exactly this and more. so these software are what corpus

3:54 - կան որոշ ծրագրակազմեր, որոնք անում են հենց դա եւ ավելին։ Այս ծրագրակազմերն են, որոնք կորպուսային

4:01 - linguists use in order to carry out linguistic research. so in a nutshell this is what corpus

4:01 - լեզվաբանները օգտագործում են լեզվաբանական հետազոտություններ իրականացնելու համար։ Այսպիսով, կարճ ասած, սա է կորպուսային

4:07 - linguistics is all about. you as a researcher are interested in a certain linguistic phenomenon you

4:07 - լեզվաբանության ամբողջ իմաստը։ Դուք՝ որպես հետազոտող, հետաքրքրված եք որոշակի լեզվաբանական երեւույթով,

4:14 -... collect your data or your corpus accordingly that is according to your research objectives and then

4:14 - հավաքում եք ձեր տվյալները կամ ձեր կորպուսը համապատասխանաբար՝ ըստ ձեր հետազոտական նպատակների, եւ ապա

4:20 - in order to analyze the data you use some specific software so yeah this is an oversimplification of

4:20 - տվյալների վերլուծության համար օգտագործում եք որոշակի ծրագրակազմ։ Այսպիսով, այո, սա կորպուսային լեզվաբանության

4:29 - what corpus linguistics. so up until this point, we have given a very simplistic definition (yeah

4:29 - չափազանց պարզեցում է։ Այսպիսով, մինչ այս պահը, մենք տվել ենք շատ պարզ սահմանում (այո,

4:36 - I used that word a lot, right?) anyway we have given a very broad and very simplistic

4:36 - ես շատ եմ օգտագործել այդ բառը, չէ՞)։ Ամեն դեպքում, մենք տվել ենք շատ լայն եւ շատ պարզ

4:41 - definition and it doesn't really do justice to what corpus linguistics is.. but yeah it's helpful

4:41 - սահմանում, եւ դա իսկապես արդարություն չի անում կորպուսային լեզվաբանությանը... բայց այո, դա օգտակար է

4:46 - to to get us started and to have a general idea of what is it that corpus linguists do?

4:46 - մեզ համար սկսելու եւ ընդհանուր գաղափար ունենալու համար, թե ինչ են անում կորպուսային լեզվաբանները։

4:52 - now we will move to more informative and more detailed definition we start with the corpus so we What is a Corpus?

4:52 - հիմա մենք կանցնենք ավելի ինֆորմատիվ եւ ավելի մանրամասն սահմանմանը։ Մենք սկսում ենք կորպուսից, այնպես որ

5:01 - have seen that a corpus is a collection of texts but it's more than that a corpus is a principled

5:01 - մենք տեսել ենք, որ կորպուսը տեքստերի հավաքածու է, բայց դա ավելին է, քան դա։ Կորպուսը սկզբունքային

5:07 - and large collection or body of authentic texts that are stored in a computer and analyzed using

5:07 - եւ մեծ հավաքածու կամ մարմին է իսկական տեքստերի, որոնք պահվում են համակարգչում եւ վերլուծվում են

5:14 - software designed for corpus analysis. now I know that this is a large definition but

5:14 - ծրագրակազմի միջոցով, որը նախատեսված է կորպուսի վերլուծության համար։ Հիմա գիտեմ, որ սա մեծ սահմանում է, բայց

5:20 - it's really interesting. now let's read this once again corpus is a principled and large collection

5:20 - դա իսկապես հետաքրքիր է։ Հիմա եկեք նորից կարդանք սա՝ կորպուսը սկզբունքային եւ մեծ հավաքածու է

5:27 - of authentic texts that are stored in a computer and analyzed using software designed for corpus

5:27 - իսկական տեքստերի, որոնք պահվում են համակարգչում եւ վերլուծվում են կորպուսի վերլուծության համար նախատեսված ծրագրակազմի միջոցով։

5:33 - analysis. now we have a bunch of keywords here and we need to stop at each one of them. so I'll

5:33 - Հիմա մենք ունենք մի շարք հիմնաբառեր, եւ մենք պետք է կանգնենք դրանցից յուրաքանչյուրի վրա։ Այսպիսով, ես

5:38 - highlight them for you here they are: principled, large collections, authentic texts, stored in a

5:38 - դրանք կդարձնեմ ձեզ համար։ Ահա դրանք՝ սկզբունքային, մեծ հավաքածուներ, իսկական տեքստեր, պահված

5:44 - computer, and software. now take a second here, pause the video again if you'd like, and think

5:44 - համակարգչում եւ ծրագրակազմ։ Հիմա մի պահ մտածեք այստեղ, դադարեցրեք տեսանյութը նորից, եթե ցանկանում եք, եւ մտածեք

5:50 - about the following: when we say principled, what do we mean by principled? and when we say large

5:50 - հետեւյալի մասին՝ երբ մենք ասում ենք սկզբունքային, ինչ ենք մենք հասկանում սկզբունքային ասելով։ Եվ երբ մենք ասում ենք մեծ

5:55 - collection of authentic texts, what does authentic texts refer to? and how large should it be? is it

5:55 - հավաքածու իսկական տեքստերի, ինչ է նշանակում իսկական տեքստեր։ Եվ ինչքան մեծ պետք է լինի դա։ Արդյո՞ք դա

6:02 - hundreds of words? thousands of words? millions? dare I say billions? stored in a computer, what

6:02 - հարյուրավոր բառեր։ հազարավոր բառեր։ միլիոնավոր։ համարձակվեմ ասել՝ միլիարդավոր։ պահված համակարգչում, ինչ

6:11 - can a computer do other than give us frequencies? and so on and so forth and what can't a computer

6:11 - կարող է անել համակարգիչը, բացի մեզ հաճախականություններ տալուց։ եւ այլն եւ այլն, եւ ինչ չի կարող անել համակարգիչը։

6:16 - do? and finally software, what software are we talking about? and are there any software

6:16 - եւ վերջապես ծրագրակազմ, ինչ ծրագրակազմի մասին ենք խոսում։ եւ արդյո՞ք կան ծրագրակազմեր,

6:22 - available for the public? that is for free ;) all right so think about these questions and I will

6:22 - հասանելի հանրության համար։ այսինքն՝ անվճար ;) լավ, մտածեք այս հարցերի մասին, եւ ես

6:27 -... continue again in three two and one so a principle collection of texts let us go back to the example A principled collection of texts

6:27 -... կշարունակեմ նորից երեք, երկու եւ մեկ։ Այսպիսով, սկզբունքային տեքստերի հավաքածու։ Եկեք վերադառնանք օրինակին,

6:36 - that we have started our conversation with, in which you were the teacher, you were interested

6:36 - որով մենք սկսել ենք մեր զրույցը, որտեղ դուք ուսուցիչ էիք, դուք հետաքրքրված էիք

6:40 - in investigating your students' language and so on and so forth. so remember, you were interested in

6:40 - ձեր ուսանողների լեզուն հետազոտելու եւ այլն եւ այլն։ Այսպիսով, հիշեք, դուք հետաքրքրված էիք

6:44 - seeing how your students use English in their writings. so what did you do? did you collect

6:44 - տեսնելու, թե ինչպես են ձեր ուսանողները օգտագործում անգլերենը իրենց գրություններում։ Այսպիսով, ինչ արեցիք։ Արդյո՞ք դուք հավաքեցիք

6:50 - your students oral reproduction? did you collect your students grammar assignments? No, you've

6:50 - ձեր ուսանողների բանավոր վերարտադրությունը։ Արդյո՞ք դուք հավաքեցիք ձեր ուսանողների քերականական առաջադրանքները։ Ոչ, դուք

6:55 - collected your students writings. so since you have already a goal or an objective in mind then

6:55 - հավաքեցիք ձեր ուսանողների գրությունները։ Այսպիսով, քանի որ դուք արդեն ունեք նպատակ կամ խնդիր մտքում, ապա

7:01 - you collect your data according to that objective. so this is what we mean by principled collection

7:01 - դուք հավաքում եք ձեր տվյալները ըստ այդ նպատակի։ Այսպիսով, սա է այն, ինչ մենք հասկանում ենք սկզբունքային հավաքածու ասելով։

7:08 - of texts. collecting the texts for the corpus is a planned operation and not random and researchers

7:08 - տեքստերի։ Տեքստերի հավաքումը կորպուսի համար պլանավորված գործողություն է եւ ոչ պատահական, եւ հետազոտողները

7:16 - normally have a research question in mind before they start compiling or designing the corpus.

7:16 - սովորաբար ունենում են հետազոտական հարց իրենց մտքում, նախքան կորպուսը կազմելն ու նախագծելը։

7:20 - so yeah collecting data for the corpus is not a random operation you cannot just collect random

7:20 - Այսպիսով, այո, կորպուսի համար տվյալների հավաքումը պատահական գործողություն չէ։ Դուք չեք կարող պարզապես պատահականորեն հավաքել

7:26 - texts and claim that these are the texts for the corpus it doesn't really work that way so

7:26 - տեքստեր եւ պնդել, որ դրանք են կորպուսի տեքստերը։ Դա իսկապես այդպես չի աշխատում։

7:31 - you need to have a goal in mind or an objective, a research objective, and then collect your data

7:31 - Դուք պետք է ունենաք նպատակ կամ հետազոտական նպատակ, եւ ապա հավաքեք ձեր տվյալները

7:36 - according to that objective. so that is it for principled. now what about large collection of

7:36 - ըստ այդ նպատակի։ Այսպիսով, դա է սկզբունքայինի մասին։ Հիմա ինչ կասեք մեծ հավաքածուի մասին

7:42 - authentic texts? what do we mean by authentic texts? well to put it very simply authentic texts

7:42 - իսկական տեքստերի։ Ինչ ենք մենք հասկանում իսկական տեքստեր ասելով։ Դե, շատ պարզ ասած, իսկական տեքստերը

7:48 - refer to naturally occurring examples of language be them spoken or written, and to give a quote by

7:48 - վերաբերում են լեզվի բնական օրինակներին, լինի դա բանավոր կամ գրավոր, եւ Սինքլերի խոսքերով ասած

7:56 - Sinclair by the way Sinclair is one of the most important scholars in Corpus linguistics and I

7:56 - ի դեպ, Սինքլերը կորպուսային լեզվաբանության ամենակարեւոր գիտնականներից մեկն է, եւ ես

8:02 - highly suggest that you read his work. anyway to use Sinclair's words, authentic texts refer to

8:02 - շատ եմ խորհուրդ տալիս կարդալ նրա աշխատանքները։ Ամեն դեպքում, Սինքլերի խոսքերով, իսկական տեքստերը վերաբերում են

8:09 - genuine communications of people going about their normal business. so I think that you already have

8:09 - մարդկանց իրական հաղորդակցություններին, որոնք զբաղվում են իրենց սովորական գործերով։ Այսպիսով, ես կարծում եմ, որ դուք արդեն ունեք

8:16 - an idea about what authentic texts refer to, naturally-occurring examples of language, so,

8:16 - գաղափար, թե ինչ են նշանակում իսկական տեքստեր, լեզվի բնական օրինակներ, այսպիսով,

8:20 - not artificial not controlled types of language but rather how people use their language naturally

8:20 - ոչ արհեստական, ոչ վերահսկվող լեզվի տեսակներ, այլ ինչպես մարդիկ օգտագործում են իրենց լեզուն բնական

8:26 -... normally again to give a very simplistic example let's go back to the example in which you were

8:26 -... սովորաբար։ Նորից շատ պարզ օրինակ տալու համար եկեք վերադառնանք օրինակի, որտեղ դուք

8:31 - the teacher and you were again interested in investigating how your students use their English

8:31 - ուսուցիչ էիք, եւ դուք նորից հետաքրքրված էիք հետազոտելու, թե ինչպես են ձեր ուսանողները օգտագործում իրենց անգլերենը

8:35 - but this time you're interested in seeing how they use their language orally. so you can't give

8:35 - բայց այս անգամ դուք հետաքրքրված եք տեսնելու, թե ինչպես են նրանք օգտագործում իրենց լեզուն բանավոր։ Այսպիսով, դուք չեք կարող տալ

8:43 - them dialogues that are already provided in the course book and make them repeat these dialogues,

8:43 - նրանց երկխոսություններ, որոնք արդեն տրամադրված են դասագրքում, եւ ստիպել նրանց կրկնել այդ երկխոսությունները,

8:50 - record them, transcribed them, and claim that this is your corpus. it's not really a corpus

8:50 - ձայնագրել դրանք, տառադարձել դրանք, եւ պնդել, որ սա ձեր կորպուսն է։ Դա իսկապես կորպուս չէ,

8:54 - because that text is not an authentic text. that oral production is not how your students

8:54 - քանի որ այդ տեքստը իսկական տեքստ չէ։ Այդ բանավոր արտադրությունը ձեր ուսանողների

9:01 - use their language naturally. it did not come from them. rather they just repeated what other people

9:01 - լեզուն բնականորեն օգտագործելու ձեւը չէ։ Դա նրանցից չի եկել։ Նրանք պարզապես կրկնել են այն, ինչ ուրիշ մարդիկ

9:06 - have already written. so in order to collect authentic texts from your students your students,

9:06 - արդեն գրել են։ Այսպիսով, ձեր ուսանողներից իսկական տեքստեր հավաքելու համար ձեր ուսանողները

9:13 - have to use their language naturally. so this is what we mean by authentic texts. now, for "a large

9:13 - պետք է օգտագործեն իրենց լեզուն բնականորեն։ Այսպիսով, սա է այն, ինչ մենք հասկանում ենք իսկական տեքստեր ասելով։ Հիմա, «մեծ

9:21 - collection of authentic texts". how large should it be? well there isn't really a straightforward

9:21 - հավաքածու իսկական տեքստերի»։ Ինչքան մեծ պետք է լինի։ Դե, իսկապես չկա միանշանակ

9:27 - answer there isn't one definitive answer rather sorry yeah it will depend on the type of the

9:27 - պատասխան, չկա միանշանակ պատասխան, ներողություն, այո, դա կախված կլինի կորպուսի տեսակից

9:34 - corpus and the research objectives. so I'll give you an example, the British national corpus,

9:34 - եւ հետազոտական նպատակներից։ Այսպիսով, ես կտամ ձեզ մի օրինակ՝ Բրիտանական ազգային կորպուսը,

9:41 - the BNC, is a general corpus. so it reflects how British people use English in a variety

9:41 - BNC-ն, ընդհանուր կորպուս է։ Այն արտացոլում է, թե ինչպես են բրիտանացիները օգտագործում անգլերենը տարբեր

9:47 - of contexts. so that is why the British national corpus is made of 100 million words yeah more than

9:47 - համատեքստերում։ Այսպիսով, այդ պատճառով Բրիտանական ազգային կորպուսը կազմված է 100 միլիոն բառերից, այո, ավելի քան

9:55 - 100 million words. so it's quite large, but why? because the British national corpus contains texts

9:55 - 100 միլիոն բառերից։ Այն բավականին մեծ է, բայց ինչու։ Քանի որ Բրիտանական ազգային կորպուսը պարունակում է տեքստեր

10:02 - that are collected from journals, from newspapers, from TV shows, from academic writings, novels,

10:02 - որոնք հավաքված են ամսագրերից, թերթերից, հեռուստահաղորդումներից, ակադեմիական գրություններից, վեպերից,

10:09 - people's normal everyday conversations, formal informal and so on and so forth. so it's a large

10:09 - մարդկանց սովորական ամենօրյա խոսակցություններից, պաշտոնական ոչ պաշտոնական եւ այլն։ Այսպիսով, դա մեծ

10:15 - amount of data but why? because it should reflect how British people use English generally, in a

10:15 - քանակությամբ տվյալներ են, բայց ինչու։ Քանի որ այն պետք է արտացոլի, թե ինչպես են բրիտանացիները օգտագործում անգլերենը ընդհանուր առմամբ, տարբեր

10:22 - variety of contexts. so in this case, you need large amounts of data, but if you're interested

10:22 - համատեքստերում։ Այս դեպքում, ձեզ անհրաժեշտ է մեծ քանակությամբ տվյալներ, բայց եթե դուք հետաքրքրված եք

10:27 - in seeing how just a limited or a certain very specific group of people use their language,

10:27 - տեսնելու, թե ինչպես է միայն սահմանափակ կամ որոշակի շատ հատուկ խումբ մարդիկ օգտագործում իրենց լեզուն,

10:32 - be it English or Spanish or whatever.. then you wouldn't need that huge amount of data. A few

10:32 - լինի դա անգլերեն կամ իսպաներեն կամ ինչ էլ որ լինի։ Այդ դեպքում ձեզ անհրաժեշտ չէ այդքան մեծ քանակությամբ տվյալներ։ Մի քանի

10:39 - million words would suffice.... so how large should the corpus be? it would depend on your research

10:39 - միլիոն բառերը բավական կլինեն։ Այսպիսով, ինչքան մեծ պետք է լինի կորպուսը։ Դա կախված կլինի ձեր հետազոտական

10:45 - objectives and the type of the corpus that you're going for, but the convention is that it's usually

10:45 - նպատակներից եւ կորպուսի տեսակից, որը դուք ընտրում եք, բայց սովորաբար դա միլիոնավոր բառեր է։

10:50 - millions of words. although it's not always the case. so you do your own readings and you you'll

10:50 - թեեւ դա միշտ չէ, որ այդպես է։ Այսպիսով, դուք կատարեք ձեր սեփական ընթերցումները եւ դուք կգտնեք

10:57 - discover things on your own. anyway, why large and why authentic? well remember that a corpus

10:57 - բաներ ինքնուրույն։ Ամեն դեպքում, ինչու մեծ եւ ինչու իսկական։ Հիշեք, որ կորպուսը

11:05 - is a representative sample of language use. you cannot possibly collect all of the instances of

11:05 - լեզվի օգտագործման ներկայացուցչական նմուշ է։ Դուք հնարավոր չէ հավաքել բոլոր դեպքերը

11:11 - any language. it's quite impossible. you'd need to to be with all of the people at the

11:11 - ցանկացած լեզվի։ Դա բավականին անհնար է։ Դուք պետք է լինեք բոլոր մարդկանց հետ

11:17 - same time and record their conversations and so on all the time.. that's quite impossible,

11:17 - միաժամանակ եւ ձայնագրեք նրանց խոսակցությունները եւ այլն։ Դա բավականին անհնար է,

11:22 - so a corpus should be large enough and authentic enough so that it represents

11:22 - այնպես որ կորպուսը պետք է լինի բավականին մեծ եւ իսկական, որպեսզի այն ներկայացնի

11:29 - the language you intend to investigate. so that is why we need as large as possible amounts of

11:29 - այն լեզուն, որը դուք մտադիր եք հետազոտել։ Այդ պատճառով մեզ անհրաժեշտ է հնարավորինս մեծ քանակությամբ

11:36 - data and of course it should be authentic. Alright moving on. "Stored in a computer"

11:36 - տվյալներ, եւ իհարկե, դա պետք է լինի իսկական։ Լավ, անցնենք առաջ։ «Պահված համակարգչում»

11:44 - why do we need to sort our data in a computer? I think it's quite obvious come on! storing texts

11:44 - ինչու մենք պետք է պահենք մեր տվյալները համակարգչում։ Ես կարծում եմ, դա բավականին ակնհայտ է։ Տեքստերի պահպանումը

11:51 - in a computer makes the corpus analysis easy, more precise, and more accurate. so the computer allows

11:51 - համակարգչում կորպուսի վերլուծությունը դարձնում է հեշտ, ավելի ճշգրիտ եւ ավելի ճիշտ։ Այսպիսով, համակարգիչը թույլ է տալիս

11:59 - for fast and accurate analysis of large amounts of data. now why did they use the word the word

11:59 - արագ եւ ճշգրիտ վերլուծություն մեծ քանակությամբ տվյալների։ Հիմա ինչու նրանք օգտագործեցին բառը

12:05 - accurate between inverted commas? of course the the computer can give you very precise and very

12:05 - «ճշգրիտ» կրկնակի չակերտների մեջ։ Իհարկե, համակարգիչը կարող է տալ ձեզ շատ ճշգրիտ եւ շատ

12:13 - accurate numbers. there is no doubt about that. but is the analysis accurate? well that would

12:13 - ճշգրիտ թվեր։ Դրանում կասկած չկա։ Բայց արդյո՞ք վերլուծությունը ճշգրիտ է։ Դե, դա կախված կլինի

12:19 - depend on how you design the corpus, what statistical measures you use to analyze your

12:19 - այն բանից, թե ինչպես եք դուք նախագծում կորպուսը, ինչ վիճակագրական միջոցներ եք օգտագործում ձեր

12:26 - data and so on... we will talk about statistics in corpus linguistics in later videos. so what more?

12:26 - տվյալների վերլուծության համար եւ այլն։ Մենք կխոսենք վիճակագրության մասին կորպուսային լեզվաբանության մեջ հետագա տեսանյութերում։ Այսպիսով, ինչ ավելին։

12:33 - yeah computers can give insights into patterns not easily detectable by humans. well since the

12:33 - այո, համակարգիչները կարող են տալ պատկերացումներ այն ձեւերի մասին, որոնք հեշտությամբ չեն հայտնաբերվում մարդկանց կողմից։ Քանի որ

12:39 - computer analyzes millions and millions of data then of course some patterns will emerge and these

12:39 - համակարգիչը վերլուծում է միլիոնավոր եւ միլիոնավոր տվյալներ, ապա իհարկե որոշ ձեւեր կհայտնվեն, եւ այս

12:45 - patterns may not be easily detectable by us or by following our intuition. so the computer has that

12:45 - ձեւերը հեշտությամբ չեն հայտնաբերվի մեզ կամ մեր ինտուիցիայով։ Այսպիսով, համակարգիչն ունի այդ

12:53 - advantage and unfortunately since everything has its limitations,... well a computer too, no matter

12:53 - առավելությունը, եւ ցավոք, քանի որ ամեն ինչ ունի իր սահմանափակումները,... դե, համակարգիչն էլ, անկախ

13:01 - how good it is, has its limitations. I'll give you an example. there is an interesting research

13:01 - որքան լավ է, ունի իր սահմանափակումները։ Ես կտամ ձեզ մի օրինակ։ Կա հետաքրքիր հետազոտություն

13:06 - carried out by this gentleman here, Dr. Brezina who is also by the way one of the most important

13:06 - իրականացված այս պարոնի կողմից, դոկտոր Բրեզինայի, ով ի դեպ կորպուսային լեզվաբանության ամենակարեւոր

13:14 - scholars in modern corpus linguistics, what can corpora tell us about learning a foreign language?

13:14 - գիտնականներից մեկն է։ Ի՞նչ կարող են կորպուսները մեզ ասել օտար լեզու սովորելու մասին։

13:21 - quite a lot actually. anyway he did a very interesting research in which he found that male

13:21 - իրականում շատ բան։ Ամեն դեպքում, նա կատարեց շատ հետաքրքիր հետազոտություն, որի արդյունքում պարզեց, որ տղամարդ

13:30 - british speakers use personal pronouns less than female british speakers. now this is something

13:30 - բրիտանացի խոսնակները անձնական դերանուններ ավելի քիչ են օգտագործում, քան կին բրիտանացի խոսնակները։ Սա այն է,

13:38 - that the computer can tell you in terms of numbers and frequencies and so on.. but a computer cannot

13:38 - ինչ համակարգիչը կարող է ասել ձեզ թվերի եւ հաճախականությունների առումով եւ այլն։ Բայց համակարգիչը չի կարող

13:44 - tell you why. why do female British speakers use personal pronouns more than male speakers do? the

13:44 - ասել, թե ինչու։ Ինչու են կին բրիտանացի խոսնակները ավելի շատ օգտագործում անձնական դերանուններ, քան տղամարդ խոսնակները։

13:51 - computer cannot tell you that so it is up to you the researcher to give qualitative explanations

13:51 - համակարգիչը չի կարող ասել դա, այնպես որ դա ձեր՝ հետազոտողի գործն է տալ որակական բացատրություններ

13:56 - to the data. so a computer can do quantitative analysis very precisely and very accurately,

13:56 - տվյալներին։ Այսպիսով, համակարգիչը կարող է կատարել քանակական վերլուծություն շատ ճշգրիտ եւ շատ ճիշտ,

14:03 - and it's up to you the researcher to do whatever qualitative interpretations of that data. all

14:03 - եւ դա ձեր՝ հետազոտողի գործն է կատարել որակական մեկնաբանություններ այդ տվյալների վերաբերյալ։

14:11 - right now "software for corpus analysis" and I know that this is what you are interested in. you

14:11 - հիմա «ծրագրակազմ կորպուսի վերլուծության համար» եւ ես գիտեմ, որ սա է այն, ինչ ձեզ հետաքրքրում է։ Դուք

14:17 - want to have some fun investigating whatever language you are interested in. so anyway,

14:17 - ցանկանում եք զվարճանալ հետազոտելով այն լեզուն, որը ձեզ հետաքրքրում է։ Ամեն դեպքում,

14:23 - software for corpus analysis. are there any software available for free? are there any

14:23 - ծրագրակազմ կորպուսի վերլուծության համար։ Արդյո՞ք կան ծրագրակազմեր, որոնք հասանելի են անվճար։ Արդյո՞ք կան

14:27 - good ones? well my friend yes! there are a bunch of them but I highly suggest these two. Lancsbox

14:27 - լավերը։ Դե, իմ ընկեր, այո՛։ Կան դրանցից մի քանիսը, բայց ես շատ եմ խորհուրդ տալիս այս երկուսը։ Lancsbox

14:35 - and AntConc. they are available for free. they will not take much space in your computer,

14:35 - եւ AntConc։ Դրանք հասանելի են անվճար։ Դրանք շատ տեղ չեն զբաղեցնի ձեր համակարգչում,

14:39 - which is always a plus, and they're user friendly. they are fairly easy to use and yeah you can carry

14:39 - ինչը միշտ դրական է, եւ դրանք օգտագործողի համար հարմար են։ Դրանք բավականին հեշտ են օգտագործման համար, եւ այո, դուք կարող եք կատարել

14:46 - out your first corpus analyses using either one of these two and I will talk about them in

14:46 - ձեր առաջին կորպուսային վերլուծությունները՝ օգտագործելով այս երկուսից որեւէ մեկը, եւ ես կխոսեմ դրանց մասին

14:51 - future videos. anyway so what does a corpus look like? very simply this is a corpus, it's just a

14:51 - հետագա տեսանյութերում։ Ամեն դեպքում, ինչպիսի՞ն է կորպուսը։ Շատ պարզ՝ սա է կորպուսը, դա պարզապես

15:01 - collection of texts which are collected according to one's research objectives. that's it. so what

15:01 - տեքստերի հավաքածու է, որոնք հավաքվում են ըստ մեկի հետազոտական նպատակների։ Այդքանը։ Այսպիսով, ինչ

15:08 - is corpus linguistics?... to go back to the question that we have started our presentation with. yes

15:08 - է կորպուսային լեզվաբանությունը։ Վերադառնանք այն հարցին, որով մենք սկսեցինք մեր ներկայացումը։ Այո,

15:14 - we have seen that corpus linguistics is the study of language using corpora. what else?

15:14 - մենք տեսանք, որ կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է կորպուսների միջոցով։ Ինչ ավելին։

15:21 - corpus linguistics is not a theory of language. so it does not explain how we acquire language

15:21 - Կորպուսային լեզվաբանությունը լեզվի տեսություն չէ։ Այսպիսով, այն չի բացատրում, թե ինչպես ենք մենք ձեռք բերում լեզուն

15:26 - or whatever any of that. it's just a tool or a method to study language and investigate

15:26 - կամ նման բաներ։ Դա պարզապես գործիք է կամ մեթոդ՝ լեզուն ուսումնասիրելու եւ հետազոտելու

15:33 - linguistic phenomena. that's it. so to conclude, what have we learned today? I'll ask you some

15:33 - լեզվաբանական երեւույթները։ Այդքանը։ Այսպիսով, եզրափակելու համար, ինչ սովորեցինք այսօր։ Ես կտամ ձեզ մի քանի

15:39 - questions do not cheat and make sure to answer them to see if you have grasped most of the ideas

15:39 - հարցեր, մի խաբեք եւ համոզվեք, որ պատասխանում եք դրանց՝ տեսնելու համար, թե արդյոք դուք հասկացել եք այս տեսանյութում ներկայացված գաղափարների մեծ մասը։

15:45 - presented in this video. so what is a corpus? yeah a corpus is a large collection of authentic texts

15:45 - Այսպիսով, ի՞նչ է կորպուսը։ Այո, կորպուսը իսկական տեքստերի մեծ հավաքածու է,

15:55 - that are stored in a computer analyzed using software designed for corpus analysis. Why

15:55 - որոնք պահվում են համակարգչում եւ վերլուծվում են կորպուսի վերլուծության համար նախատեսված ծրագրակազմի միջոցով։ Ինչու

16:01 - principled and large collections of authentic texts? yeah, according to one's objectives,

16:01 - սկզբունքային եւ մեծ հավաքածուներ իսկական տեքստերի։ Այո, ըստ մեկի նպատակների,

16:11 - a corpus should be a representative sample of language use in light of those objectives. so if

16:11 - կորպուսը պետք է լինի լեզվի օգտագործման ներկայացուցչական նմուշ՝ այդ նպատակների լույսի ներքո։ Այսպիսով, եթե

16:16 - you're interested in seeing how people use, for instance Spanish orally in Spain, then you need

16:16 - դուք հետաքրքրված եք տեսնելու, թե ինչպես են մարդիկ օգտագործում, օրինակ, իսպաներենը բանավոր Իսպանիայում, ապա դուք պետք է

16:22 - to collect oral data of Spanish production again in Spain, so on so forth. what else? yeah what is

16:22 - հավաքեք իսպաներենի բանավոր արտադրության տվյալներ նորից Իսպանիայում, եւ այլն։ Ինչ ավելին։ Այո, ինչ է

16:30 - corpus linguistics? this is a fairly easy question and I know that you'll get this one right! yeah

16:30 - կորպուսային լեզվաբանությունը։ Սա բավականին հեշտ հարց է, եւ ես գիտեմ, որ դուք ճիշտ կպատասխանեք այս մեկին։ Այո,

16:36 - yeah corpus linguistics is the study of language simply using corpora. it is not a theory of

16:36 - այո, կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է պարզապես կորպուսների միջոցով։ Դա լեզվի տեսություն չէ,

16:41 - language. it's only a tool or a method to investigate linguistic phenomena. so yeah some of

16:41 - դա միայն գործիք է կամ մեթոդ՝ լեզվաբանական երեւույթները հետազոտելու համար։ Այսպիսով, այո, որոշ

16:48 - the important scholars, and these are by no means the most important ones, but some of them, there's

16:48 - կարեւոր գիտնականներ, եւ սրանք ամենեւին էլ ամենակարեւորները չեն, բայց նրանցից մի քանիսը՝ կան

16:54 - Leech, Biber, Conrad McCarthy and of course Brezina. I highly suggest that you read some

16:54 - Լիչը, Բիբերը, Կոնրադ ՄաքՔարթին եւ իհարկե Բրեզինան։ Ես շատ եմ խորհուրդ տալիս, որ դուք կարդաք

17:01 - of their their work. they're really informative. but many consider Sinclair to be one of the most

17:01 - նրանց աշխատանքներից։ Դրանք իսկապես ինֆորմատիվ են։ Բայց շատերը համարում են Սինքլերին ամենակարեւոր

17:09 - important scholars in Corpus linguistics or at least modern corpus linguistics and I highly

17:09 - գիտնականներից մեկը կորպուսային լեզվաբանության մեջ կամ առնվազն ժամանակակից կորպուսային լեզվաբանության մեջ, եւ ես շատ

17:15 - suggest that you read Sinclair's work. so here are some references to get you started. You can start

17:15 - խորհուրդ եմ տալիս, որ դուք կարդաք Սինքլերի աշխատանքները։ Այսպիսով, ահա մի քանի հղումներ՝ սկսելու համար։ Դուք կարող եք սկսել

17:23 - by any one of these. they are highly informative. they helped me a lot when I first started learning

17:23 - դրանցից ցանկացածով։ Դրանք շատ ինֆորմատիվ են։ Դրանք շատ օգնեցին ինձ, երբ ես առաջին անգամ սկսեցի սովորել

17:29... about corpus linguistics and I highly suggest that you read them, or at least one of them. so this

17:29... կորպուսային լեզվաբանության մասին, եւ ես շատ խորհուրդ եմ տալիս, որ դուք կարդաք դրանք կամ առնվազն դրանցից մեկը։ Այսպիսով, սա

17:35 - brings us to the end of the video I hope that you have enjoyed it and I hope that you have learned

17:35 - մեզ բերում է տեսանյութի ավարտին։ Հուսով եմ, որ դուք հաճույք ստացաք դրանից, եւ հուսով եմ, որ դուք սովորեցիք

17:42 - or at least I have answered some of your questions and if you have further questions don't hesitate

17:42 - կամ առնվազն ես պատասխանեցի ձեր հարցերից մի քանիսին, եւ եթե դուք ունեք հետագա հարցեր, մի հապաղեք

17:47 - to leave your questions in the comment section down below. I'll do my best to answer all of

17:47 - թողնել ձեր հարցերը մեկնաբանությունների բաժնում ներքեւում։ Ես կանեմ հնարավորը՝ պատասխանելու ձեր բոլոր

17:51 - your questions. If the question requires another video I'll gladly post another video and yeah have

17:51 - հարցերին։ Եթե հարցը պահանջում է մեկ այլ տեսանյութ, ես սիրով կտեղադրեմ մեկ այլ տեսանյութ, եւ այո, ունեցեք

17:57 - a good week have a good month have a good year and see you the next video bye bye ciao ciao...

17:57 - լավ շաբաթ, լավ ամիս, լավ տարի, եւ տեսնվենք հաջորդ տեսանյութում։ Ցտեսություն, ցտեսություն...

Summarizing the Transcript

Ամփոփում

Դասախոսության զուգահեռ փոխադրումը անգլերեն եւ հայերեն

Recent Posts

Comments