If the activities described in this page are illegal, please let me know - I do not want AI induced headache.
Using the instructions provided by Download the Transcript of a YouTube video chat and mimic my exchange with Perplexity you can get similar to below output for any YouTube lecture (video) that has auto- or manual transcription on.
This is the result (note that the Summary is human wirriten - compare with the one generated by Perplexity):
#1 Introduction to Corpus Linguistics - What is Corpus Linguistics?
Ամփոփում
Տեսանյութը կորպուսային լեզվաբանության ներածական ակնարկ է։ Կորպուսային լեզվաբանությունը այն ոլորտն է, որն ուսումնասիրում է խոսքը կորպուսների` բնական լեզվով տեքստերի հավաքածուների (շտեմարանների), միջոցով։ Կորպուսը պետք է լինի մեծ եւ իրական (ոչ մեքենական կամ հատուկ գրված), որպեսզի լիարժեք ներկայացնի լեզվի օգտագործումը։ Կորպուսի կառուցումը ներառնում է տեքստերի հավաքումը, համակարգչում դարանումը, եւ հատուկ ծրագրերի միջոցով վերլուծությունը։ Այսպիսի ծրագրերի օրինակներն են LancsBox-ը եւ AntConc-ը։ Կորպուսային լեզվաբանությունը լեզվի տեսություն չէ, այլ մեթոդաբանական գործիք։ Այս ոլորտի կարեվոր գիտնականներ են` Սինքլերը եւ Բրեզինան. նրանց աշխատություններին ծանոթանալը կօգնի ավելի խորը հասկանալ կորպուսային լեզվաբանությունը:
Դասախոսության զուգահեռ փոխադրումը անգլերեն եւ հայերեն
0:00 - hello and welcome to this series of videos on corpus linguistics. In the next couple of weeks,
0:00 - Բարեւ եւ բարի գալուստ այս տեսանյութերի շարքին կորպուսային լեզվաբանության մասին։ Հաջորդ մի քանի շաբաթների ընթացքում
0:05 - we'll be talking about what corpus linguistics is. we'll start from the very basic notions and
0:05 - մենք կխոսենք, թե ինչ է կորպուսային լեզվաբանությունը։ Մենք կսկսենք ամենահիմնական հասկացություններից եւ
0:11 - things that you need to understand in order to get you started and then step-by-step will move
0:11 - այն բաներից, որոնք պետք է հասկանալ, որպեսզի սկսենք, եւ ապա աստիճանաբար կանցնենք
0:15 - on to more advanced topics related to the field. so yeah without wasting your time with meaningless
0:15 - ավելի բարդ թեմաների։ Այսպիսով, առանց ավելորդ ներկայացումների,
0:23 - introductions let us jump right into it. so corpus linguistics such an interesting field wouldn't you
0:23 - եկեք անմիջապես սկսենք։ Կորպուսային լեզվաբանությունը շատ հետաքրքիր ոլորտ է, չէ՞։
0:29 - say? all right so what is corpus linguistics? to give you a very simple, very broad definition, What is Corpus Linguistics?
0:29 - Լավ, ինչ է կորպուսային լեզվաբանությունը։ Շատ պարզ եւ լայն սահմանմամբ, ինչ է կորպուսային լեզվաբանությունը։
0:35 - corpus linguistics is the study of language using corpora, which is plural for corpus. I know that
0:35 - Կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է կորպուսների միջոցով, որը կորպուսի հոգնակի ձեւն է։
0:42 - this is a weird plural but hey! Who am I to judge? I am not even a native speaker of English. anyway
0:42 - Գիտեմ, որ սա տարօրինակ հոգնակի ձեւ է, բայց ով եմ ես, որ դատեմ։ Ես նույնիսկ անգլերենի բնիկ խոսնակ չեմ։
0:48 - so what does a corpus mean? "study languages using a corpus." well corpus is a word which is derived
0:48 - Ինչ է նշանակում կորպուս։ «ուսումնասիրել լեզուները կորպուսի միջոցով»։ Կորպուսը բառ է, որը գալիս է
0:54 - from the latin word, surprise surprise, corpus which literally translates to body. now obviously
0:54 - լատիներեն բառից, զարմանք զարմանք, կորպուս, որը բառացիորեն թարգմանվում է որպես մարմին։
1:02 - body here does not refer to the physical body rather it refers to a body of texts. so a corpus
1:02 - Այստեղ մարմինը չի վերաբերում ֆիզիկական մարմնին, այլ վերաբերում է տեքստերի մարմնին։
1:09 - is simply or to put it very broad a collection or a body of texts. so corpus linguistics is studying
1:09 - Այսպիսով, կորպուսը պարզապես կամ լայնորեն ասած տեքստերի հավաքածու է։ Կորպուսային լեզվաբանությունը ուսումնասիրում է
1:18 - language using a collection of texts. how is this done? you might be wondering. I am glad you
1:18 - լեզուն տեքստերի հավաքածուի միջոցով։ Ինչպես է դա արվում։ Դուք կարող եք հետաքրքրվել։ Ես ուրախ եմ, որ
1:25 - asked! well let us give an example to illustrate these points. say that you're an English teacher,
1:25 - հարցրեցիք։ Եկեք տանք մի օրինակ՝ այս կետերը պարզաբանելու համար։ Ենթադրենք, դուք անգլերենի ուսուցիչ եք,
1:31 - alright and the happy little ones are your students, and say that you have been teaching
1:31 - եւ ուրախ փոքրիկները ձեր աշակերտներն են, եւ ենթադրենք, որ դուք նրանց դասավանդում եք
1:38 - them for about two years now and at this point you are interested in seeing how they use their
1:38 - արդեն մոտ երկու տարի եւ այս պահին դուք հետաքրքրված եք տեսնելու, թե ինչպես են նրանք օգտագործում իրենց
1:43 - English. more specifically, you're interested in investigating the following: what are the three
1:43 - անգլերենը։ Ավելի կոնկրետ, դուք հետաքրքրված եք հետազոտելու հետեւյալը՝ որոնք են երեք
1:49 - most frequent words that my students use in their writings, and you would also like to know how they
1:49 - ամենահաճախ օգտագործվող բառերը, որոնք իմ ուսանողները օգտագործում են իրենց գրություններում, եւ դուք կցանկանայիք իմանալ, թե ինչպես են նրանք
1:55 - use these words in their writings. so take a second here and think how would you do this
1:55 - օգտագործում այս բառերը իրենց գրություններում։ Այսպիսով, մի պահ մտածեք, թե ինչպես կկատարեիք դա
2:02 - how would you investigate these two questions? pause the video if you like and I will continue
2:02 - ինչպես կքննեք այս երկու հարցերը։ Դադարեցրեք տեսանյութը, եթե ցանկանում եք, եւ ես կշարունակեմ
2:08 -... in three two and one. so as you have rightly predicted you'll start by collecting your students
2:08 -... երեք, երկու եւ մեկ։ Այսպիսով, ինչպես ճիշտ կանխատեսեցիք, դուք կսկսեք ձեր ուսանողների գրությունները հավաքելով։
2:16 - writings. then you will calculate the number of words that they have used in their writings,
2:16 - Հետո դուք կկատարեք նրանց գրություններում օգտագործված բառերի քանակի հաշվարկը,
2:22 - and then once you have calculated all the words ... the number of all the words that they have
2:22 - եւ հետո երբ դուք հաշվարկեք բոլոր բառերը ... բոլոր բառերի քանակը, որոնք նրանք օգտագործել են,
2:27 - used, you will generate frequency lists of all these words and then rank them from the most
2:27 - դուք կստեղծեք այս բոլոր բառերի հաճախականության ցուցակներ եւ ապա դրանք դասակարգեք ամենաշատից
2:33 - frequent word to the least frequent word. now say after doing this you get the following results: The total number of words: 800
2:33 - հաճախ օգտագործվող բառից մինչեւ ամենաքիչ օգտագործվող բառը։ Ենթադրենք, այս ամենից հետո դուք ստանում եք հետեւյալ արդյունքները՝
2:39 - the total numbers of words, the total number sorry of words that your students have used is
2:39 - ընդհանուր բառերի քանակը, ներողություն, ընդհանուր բառերի քանակը, որոնք ձեր ուսանողները օգտագործել են, կազմում է
2:45 - 800 and the three most frequent ones are "the" which occurred 48 times "for" which occurred
2:45 - 800 եւ երեք ամենահաճախ օգտագործվողները «the»-ն է, որը հանդիպել է 48 անգամ, «for»-ը, որը հանդիպել է
2:52 - 20 times and "I" which occurred 12 times. so concerning the first task, give yourself
2:52 - 20 անգամ եւ «I»-ն, որը հանդիպել է 12 անգամ։ Այսպիսով, առաջին առաջադրանքի վերաբերյալ, շնորհավորեք ինքներդ ձեզ,
2:59 - a round of applause, you have successfully completed it. now how about the second task?
2:59 - դուք հաջողությամբ ավարտել եք այն։ Իսկ ինչ կասեք երկրորդ առաջադրանքի մասին։
3:04 - remember, you were interested in seeing how they use each of these words. so in order to see how
3:04 - հիշեք, դուք հետաքրքրված էիք տեսնելու, թե ինչպես են նրանք օգտագործում այս բառերից յուրաքանչյուրը։ Այսպիսով, որպեսզի տեսնեք, թե ինչպես
3:09 - they use the word 'the' you need again to go back to the papers and look for all of the 48 instances
3:09 - նրանք օգտագործում են «the» բառը, դուք պետք է նորից վերադառնաք գրություններին եւ փնտրեք բոլոր 48 դեպքերը
3:15 - of the word "the" do the same for "for" and then do the same for "I".. as you can already imagine
3:15 - «the» բառի, նույնը կատարեք «for»-ի համար եւ ապա նույնը կատարեք «I»-ի համար։ Ինչպես արդեն պատկերացնում եք,
3:22 - this is a laborious activity. it will take so much time and so much effort and chances are you may
3:22 - սա աշխատատար գործունեություն է։ Դա կպահանջի շատ ժամանակ եւ շատ ջանքեր, եւ հավանական է, որ դուք կարող եք
3:28 - make certain mistakes calculating the number of words and so on and so forth.. because hey, we're
3:28 - կատարել որոշ սխալներ բառերի քանակի հաշվարկի եւ այլնի մեջ... որովհետեւ մենք բոլորս մարդիկ ենք,
3:33 - all humans we are not right all the time right? and imagine if you had large amounts of data,
3:33 - մենք միշտ ճիշտ չենք, չէ՞։ Եվ պատկերացրեք, եթե դուք ունենայիք մեծ քանակությամբ տվյալներ,
3:39 - say thousands of words or millions of words, it would be quite impossible wouldn't you say? yeah
3:39 - ասենք հազարավոր բառեր կամ միլիոնավոր բառեր, դա բավականին անհնար կլիներ, չէ՞։ Այո,
3:46 - so it would be lovely if there were some software that can do this for you. well lucky for us here
3:46 - այնպես որ, լավ կլիներ, եթե լիներ մի ծրագրակազմ, որը կարող էր դա անել ձեզ համար։ Դե, մեզ համար բախտավոր է,
3:54 - there are some software available that do exactly this and more. so these software are what corpus
3:54 - կան որոշ ծրագրակազմեր, որոնք անում են հենց դա եւ ավելին։ Այս ծրագրակազմերն են, որոնք կորպուսային
4:01 - linguists use in order to carry out linguistic research. so in a nutshell this is what corpus
4:01 - լեզվաբանները օգտագործում են լեզվաբանական հետազոտություններ իրականացնելու համար։ Այսպիսով, կարճ ասած, սա է կորպուսային
4:07 - linguistics is all about. you as a researcher are interested in a certain linguistic phenomenon you
4:07 - լեզվաբանության ամբողջ իմաստը։ Դուք՝ որպես հետազոտող, հետաքրքրված եք որոշակի լեզվաբանական երեւույթով,
4:14 -... collect your data or your corpus accordingly that is according to your research objectives and then
4:14 - հավաքում եք ձեր տվյալները կամ ձեր կորպուսը համապատասխանաբար՝ ըստ ձեր հետազոտական նպատակների, եւ ապա
4:20 - in order to analyze the data you use some specific software so yeah this is an oversimplification of
4:20 - տվյալների վերլուծության համար օգտագործում եք որոշակի ծրագրակազմ։ Այսպիսով, այո, սա կորպուսային լեզվաբանության
4:29 - what corpus linguistics. so up until this point, we have given a very simplistic definition (yeah
4:29 - չափազանց պարզեցում է։ Այսպիսով, մինչ այս պահը, մենք տվել ենք շատ պարզ սահմանում (այո,
4:36 - I used that word a lot, right?) anyway we have given a very broad and very simplistic
4:36 - ես շատ եմ օգտագործել այդ բառը, չէ՞)։ Ամեն դեպքում, մենք տվել ենք շատ լայն եւ շատ պարզ
4:41 - definition and it doesn't really do justice to what corpus linguistics is.. but yeah it's helpful
4:41 - սահմանում, եւ դա իսկապես արդարություն չի անում կորպուսային լեզվաբանությանը... բայց այո, դա օգտակար է
4:46 - to to get us started and to have a general idea of what is it that corpus linguists do?
4:46 - մեզ համար սկսելու եւ ընդհանուր գաղափար ունենալու համար, թե ինչ են անում կորպուսային լեզվաբանները։
4:52 - now we will move to more informative and more detailed definition we start with the corpus so we What is a Corpus?
4:52 - հիմա մենք կանցնենք ավելի ինֆորմատիվ եւ ավելի մանրամասն սահմանմանը։ Մենք սկսում ենք կորպուսից, այնպես որ
5:01 - have seen that a corpus is a collection of texts but it's more than that a corpus is a principled
5:01 - մենք տեսել ենք, որ կորպուսը տեքստերի հավաքածու է, բայց դա ավելին է, քան դա։ Կորպուսը սկզբունքային
5:07 - and large collection or body of authentic texts that are stored in a computer and analyzed using
5:07 - եւ մեծ հավաքածու կամ մարմին է իսկական տեքստերի, որոնք պահվում են համակարգչում եւ վերլուծվում են
5:14 - software designed for corpus analysis. now I know that this is a large definition but
5:14 - ծրագրակազմի միջոցով, որը նախատեսված է կորպուսի վերլուծության համար։ Հիմա գիտեմ, որ սա մեծ սահմանում է, բայց
5:20 - it's really interesting. now let's read this once again corpus is a principled and large collection
5:20 - դա իսկապես հետաքրքիր է։ Հիմա եկեք նորից կարդանք սա՝ կորպուսը սկզբունքային եւ մեծ հավաքածու է
5:27 - of authentic texts that are stored in a computer and analyzed using software designed for corpus
5:27 - իսկական տեքստերի, որոնք պահվում են համակարգչում եւ վերլուծվում են կորպուսի վերլուծության համար նախատեսված ծրագրակազմի միջոցով։
5:33 - analysis. now we have a bunch of keywords here and we need to stop at each one of them. so I'll
5:33 - Հիմա մենք ունենք մի շարք հիմնաբառեր, եւ մենք պետք է կանգնենք դրանցից յուրաքանչյուրի վրա։ Այսպիսով, ես
5:38 - highlight them for you here they are: principled, large collections, authentic texts, stored in a
5:38 - դրանք կդարձնեմ ձեզ համար։ Ահա դրանք՝ սկզբունքային, մեծ հավաքածուներ, իսկական տեքստեր, պահված
5:44 - computer, and software. now take a second here, pause the video again if you'd like, and think
5:44 - համակարգչում եւ ծրագրակազմ։ Հիմա մի պահ մտածեք այստեղ, դադարեցրեք տեսանյութը նորից, եթե ցանկանում եք, եւ մտածեք
5:50 - about the following: when we say principled, what do we mean by principled? and when we say large
5:50 - հետեւյալի մասին՝ երբ մենք ասում ենք սկզբունքային, ինչ ենք մենք հասկանում սկզբունքային ասելով։ Եվ երբ մենք ասում ենք մեծ
5:55 - collection of authentic texts, what does authentic texts refer to? and how large should it be? is it
5:55 - հավաքածու իսկական տեքստերի, ինչ է նշանակում իսկական տեքստեր։ Եվ ինչքան մեծ պետք է լինի դա։ Արդյո՞ք դա
6:02 - hundreds of words? thousands of words? millions? dare I say billions? stored in a computer, what
6:02 - հարյուրավոր բառեր։ հազարավոր բառեր։ միլիոնավոր։ համարձակվեմ ասել՝ միլիարդավոր։ պահված համակարգչում, ինչ
6:11 - can a computer do other than give us frequencies? and so on and so forth and what can't a computer
6:11 - կարող է անել համակարգիչը, բացի մեզ հաճախականություններ տալուց։ եւ այլն եւ այլն, եւ ինչ չի կարող անել համակարգիչը։
6:16 - do? and finally software, what software are we talking about? and are there any software
6:16 - եւ վերջապես ծրագրակազմ, ինչ ծրագրակազմի մասին ենք խոսում։ եւ արդյո՞ք կան ծրագրակազմեր,
6:22 - available for the public? that is for free ;) all right so think about these questions and I will
6:22 - հասանելի հանրության համար։ այսինքն՝ անվճար ;) լավ, մտածեք այս հարցերի մասին, եւ ես
6:27 -... continue again in three two and one so a principle collection of texts let us go back to the example A principled collection of texts
6:27 -... կշարունակեմ նորից երեք, երկու եւ մեկ։ Այսպիսով, սկզբունքային տեքստերի հավաքածու։ Եկեք վերադառնանք օրինակին,
6:36 - that we have started our conversation with, in which you were the teacher, you were interested
6:36 - որով մենք սկսել ենք մեր զրույցը, որտեղ դուք ուսուցիչ էիք, դուք հետաքրքրված էիք
6:40 - in investigating your students' language and so on and so forth. so remember, you were interested in
6:40 - ձեր ուսանողների լեզուն հետազոտելու եւ այլն եւ այլն։ Այսպիսով, հիշեք, դուք հետաքրքրված էիք
6:44 - seeing how your students use English in their writings. so what did you do? did you collect
6:44 - տեսնելու, թե ինչպես են ձեր ուսանողները օգտագործում անգլերենը իրենց գրություններում։ Այսպիսով, ինչ արեցիք։ Արդյո՞ք դուք հավաքեցիք
6:50 - your students oral reproduction? did you collect your students grammar assignments? No, you've
6:50 - ձեր ուսանողների բանավոր վերարտադրությունը։ Արդյո՞ք դուք հավաքեցիք ձեր ուսանողների քերականական առաջադրանքները։ Ոչ, դուք
6:55 - collected your students writings. so since you have already a goal or an objective in mind then
6:55 - հավաքեցիք ձեր ուսանողների գրությունները։ Այսպիսով, քանի որ դուք արդեն ունեք նպատակ կամ խնդիր մտքում, ապա
7:01 - you collect your data according to that objective. so this is what we mean by principled collection
7:01 - դուք հավաքում եք ձեր տվյալները ըստ այդ նպատակի։ Այսպիսով, սա է այն, ինչ մենք հասկանում ենք սկզբունքային հավաքածու ասելով։
7:08 - of texts. collecting the texts for the corpus is a planned operation and not random and researchers
7:08 - տեքստերի։ Տեքստերի հավաքումը կորպուսի համար պլանավորված գործողություն է եւ ոչ պատահական, եւ հետազոտողները
7:16 - normally have a research question in mind before they start compiling or designing the corpus.
7:16 - սովորաբար ունենում են հետազոտական հարց իրենց մտքում, նախքան կորպուսը կազմելն ու նախագծելը։
7:20 - so yeah collecting data for the corpus is not a random operation you cannot just collect random
7:20 - Այսպիսով, այո, կորպուսի համար տվյալների հավաքումը պատահական գործողություն չէ։ Դուք չեք կարող պարզապես պատահականորեն հավաքել
7:26 - texts and claim that these are the texts for the corpus it doesn't really work that way so
7:26 - տեքստեր եւ պնդել, որ դրանք են կորպուսի տեքստերը։ Դա իսկապես այդպես չի աշխատում։
7:31 - you need to have a goal in mind or an objective, a research objective, and then collect your data
7:31 - Դուք պետք է ունենաք նպատակ կամ հետազոտական նպատակ, եւ ապա հավաքեք ձեր տվյալները
7:36 - according to that objective. so that is it for principled. now what about large collection of
7:36 - ըստ այդ նպատակի։ Այսպիսով, դա է սկզբունքայինի մասին։ Հիմա ինչ կասեք մեծ հավաքածուի մասին
7:42 - authentic texts? what do we mean by authentic texts? well to put it very simply authentic texts
7:42 - իսկական տեքստերի։ Ինչ ենք մենք հասկանում իսկական տեքստեր ասելով։ Դե, շատ պարզ ասած, իսկական տեքստերը
7:48 - refer to naturally occurring examples of language be them spoken or written, and to give a quote by
7:48 - վերաբերում են լեզվի բնական օրինակներին, լինի դա բանավոր կամ գրավոր, եւ Սինքլերի խոսքերով ասած
7:56 - Sinclair by the way Sinclair is one of the most important scholars in Corpus linguistics and I
7:56 - ի դեպ, Սինքլերը կորպուսային լեզվաբանության ամենակարեւոր գիտնականներից մեկն է, եւ ես
8:02 - highly suggest that you read his work. anyway to use Sinclair's words, authentic texts refer to
8:02 - շատ եմ խորհուրդ տալիս կարդալ նրա աշխատանքները։ Ամեն դեպքում, Սինքլերի խոսքերով, իսկական տեքստերը վերաբերում են
8:09 - genuine communications of people going about their normal business. so I think that you already have
8:09 - մարդկանց իրական հաղորդակցություններին, որոնք զբաղվում են իրենց սովորական գործերով։ Այսպիսով, ես կարծում եմ, որ դուք արդեն ունեք
8:16 - an idea about what authentic texts refer to, naturally-occurring examples of language, so,
8:16 - գաղափար, թե ինչ են նշանակում իսկական տեքստեր, լեզվի բնական օրինակներ, այսպիսով,
8:20 - not artificial not controlled types of language but rather how people use their language naturally
8:20 - ոչ արհեստական, ոչ վերահսկվող լեզվի տեսակներ, այլ ինչպես մարդիկ օգտագործում են իրենց լեզուն բնական
8:26 -... normally again to give a very simplistic example let's go back to the example in which you were
8:26 -... սովորաբար։ Նորից շատ պարզ օրինակ տալու համար եկեք վերադառնանք օրինակի, որտեղ դուք
8:31 - the teacher and you were again interested in investigating how your students use their English
8:31 - ուսուցիչ էիք, եւ դուք նորից հետաքրքրված էիք հետազոտելու, թե ինչպես են ձեր ուսանողները օգտագործում իրենց անգլերենը
8:35 - but this time you're interested in seeing how they use their language orally. so you can't give
8:35 - բայց այս անգամ դուք հետաքրքրված եք տեսնելու, թե ինչպես են նրանք օգտագործում իրենց լեզուն բանավոր։ Այսպիսով, դուք չեք կարող տալ
8:43 - them dialogues that are already provided in the course book and make them repeat these dialogues,
8:43 - նրանց երկխոսություններ, որոնք արդեն տրամադրված են դասագրքում, եւ ստիպել նրանց կրկնել այդ երկխոսությունները,
8:50 - record them, transcribed them, and claim that this is your corpus. it's not really a corpus
8:50 - ձայնագրել դրանք, տառադարձել դրանք, եւ պնդել, որ սա ձեր կորպուսն է։ Դա իսկապես կորպուս չէ,
8:54 - because that text is not an authentic text. that oral production is not how your students
8:54 - քանի որ այդ տեքստը իսկական տեքստ չէ։ Այդ բանավոր արտադրությունը ձեր ուսանողների
9:01 - use their language naturally. it did not come from them. rather they just repeated what other people
9:01 - լեզուն բնականորեն օգտագործելու ձեւը չէ։ Դա նրանցից չի եկել։ Նրանք պարզապես կրկնել են այն, ինչ ուրիշ մարդիկ
9:06 - have already written. so in order to collect authentic texts from your students your students,
9:06 - արդեն գրել են։ Այսպիսով, ձեր ուսանողներից իսկական տեքստեր հավաքելու համար ձեր ուսանողները
9:13 - have to use their language naturally. so this is what we mean by authentic texts. now, for "a large
9:13 - պետք է օգտագործեն իրենց լեզուն բնականորեն։ Այսպիսով, սա է այն, ինչ մենք հասկանում ենք իսկական տեքստեր ասելով։ Հիմա, «մեծ
9:21 - collection of authentic texts". how large should it be? well there isn't really a straightforward
9:21 - հավաքածու իսկական տեքստերի»։ Ինչքան մեծ պետք է լինի։ Դե, իսկապես չկա միանշանակ
9:27 - answer there isn't one definitive answer rather sorry yeah it will depend on the type of the
9:27 - պատասխան, չկա միանշանակ պատասխան, ներողություն, այո, դա կախված կլինի կորպուսի տեսակից
9:34 - corpus and the research objectives. so I'll give you an example, the British national corpus,
9:34 - եւ հետազոտական նպատակներից։ Այսպիսով, ես կտամ ձեզ մի օրինակ՝ Բրիտանական ազգային կորպուսը,
9:41 - the BNC, is a general corpus. so it reflects how British people use English in a variety
9:41 - BNC-ն, ընդհանուր կորպուս է։ Այն արտացոլում է, թե ինչպես են բրիտանացիները օգտագործում անգլերենը տարբեր
9:47 - of contexts. so that is why the British national corpus is made of 100 million words yeah more than
9:47 - համատեքստերում։ Այսպիսով, այդ պատճառով Բրիտանական ազգային կորպուսը կազմված է 100 միլիոն բառերից, այո, ավելի քան
9:55 - 100 million words. so it's quite large, but why? because the British national corpus contains texts
9:55 - 100 միլիոն բառերից։ Այն բավականին մեծ է, բայց ինչու։ Քանի որ Բրիտանական ազգային կորպուսը պարունակում է տեքստեր
10:02 - that are collected from journals, from newspapers, from TV shows, from academic writings, novels,
10:02 - որոնք հավաքված են ամսագրերից, թերթերից, հեռուստահաղորդումներից, ակադեմիական գրություններից, վեպերից,
10:09 - people's normal everyday conversations, formal informal and so on and so forth. so it's a large
10:09 - մարդկանց սովորական ամենօրյա խոսակցություններից, պաշտոնական ոչ պաշտոնական եւ այլն։ Այսպիսով, դա մեծ
10:15 - amount of data but why? because it should reflect how British people use English generally, in a
10:15 - քանակությամբ տվյալներ են, բայց ինչու։ Քանի որ այն պետք է արտացոլի, թե ինչպես են բրիտանացիները օգտագործում անգլերենը ընդհանուր առմամբ, տարբեր
10:22 - variety of contexts. so in this case, you need large amounts of data, but if you're interested
10:22 - համատեքստերում։ Այս դեպքում, ձեզ անհրաժեշտ է մեծ քանակությամբ տվյալներ, բայց եթե դուք հետաքրքրված եք
10:27 - in seeing how just a limited or a certain very specific group of people use their language,
10:27 - տեսնելու, թե ինչպես է միայն սահմանափակ կամ որոշակի շատ հատուկ խումբ մարդիկ օգտագործում իրենց լեզուն,
10:32 - be it English or Spanish or whatever.. then you wouldn't need that huge amount of data. A few
10:32 - լինի դա անգլերեն կամ իսպաներեն կամ ինչ էլ որ լինի։ Այդ դեպքում ձեզ անհրաժեշտ չէ այդքան մեծ քանակությամբ տվյալներ։ Մի քանի
10:39 - million words would suffice.... so how large should the corpus be? it would depend on your research
10:39 - միլիոն բառերը բավական կլինեն։ Այսպիսով, ինչքան մեծ պետք է լինի կորպուսը։ Դա կախված կլինի ձեր հետազոտական
10:45 - objectives and the type of the corpus that you're going for, but the convention is that it's usually
10:45 - նպատակներից եւ կորպուսի տեսակից, որը դուք ընտրում եք, բայց սովորաբար դա միլիոնավոր բառեր է։
10:50 - millions of words. although it's not always the case. so you do your own readings and you you'll
10:50 - թեեւ դա միշտ չէ, որ այդպես է։ Այսպիսով, դուք կատարեք ձեր սեփական ընթերցումները եւ դուք կգտնեք
10:57 - discover things on your own. anyway, why large and why authentic? well remember that a corpus
10:57 - բաներ ինքնուրույն։ Ամեն դեպքում, ինչու մեծ եւ ինչու իսկական։ Հիշեք, որ կորպուսը
11:05 - is a representative sample of language use. you cannot possibly collect all of the instances of
11:05 - լեզվի օգտագործման ներկայացուցչական նմուշ է։ Դուք հնարավոր չէ հավաքել բոլոր դեպքերը
11:11 - any language. it's quite impossible. you'd need to to be with all of the people at the
11:11 - ցանկացած լեզվի։ Դա բավականին անհնար է։ Դուք պետք է լինեք բոլոր մարդկանց հետ
11:17 - same time and record their conversations and so on all the time.. that's quite impossible,
11:17 - միաժամանակ եւ ձայնագրեք նրանց խոսակցությունները եւ այլն։ Դա բավականին անհնար է,
11:22 - so a corpus should be large enough and authentic enough so that it represents
11:22 - այնպես որ կորպուսը պետք է լինի բավականին մեծ եւ իսկական, որպեսզի այն ներկայացնի
11:29 - the language you intend to investigate. so that is why we need as large as possible amounts of
11:29 - այն լեզուն, որը դուք մտադիր եք հետազոտել։ Այդ պատճառով մեզ անհրաժեշտ է հնարավորինս մեծ քանակությամբ
11:36 - data and of course it should be authentic. Alright moving on. "Stored in a computer"
11:36 - տվյալներ, եւ իհարկե, դա պետք է լինի իսկական։ Լավ, անցնենք առաջ։ «Պահված համակարգչում»
11:44 - why do we need to sort our data in a computer? I think it's quite obvious come on! storing texts
11:44 - ինչու մենք պետք է պահենք մեր տվյալները համակարգչում։ Ես կարծում եմ, դա բավականին ակնհայտ է։ Տեքստերի պահպանումը
11:51 - in a computer makes the corpus analysis easy, more precise, and more accurate. so the computer allows
11:51 - համակարգչում կորպուսի վերլուծությունը դարձնում է հեշտ, ավելի ճշգրիտ եւ ավելի ճիշտ։ Այսպիսով, համակարգիչը թույլ է տալիս
11:59 - for fast and accurate analysis of large amounts of data. now why did they use the word the word
11:59 - արագ եւ ճշգրիտ վերլուծություն մեծ քանակությամբ տվյալների։ Հիմա ինչու նրանք օգտագործեցին բառը
12:05 - accurate between inverted commas? of course the the computer can give you very precise and very
12:05 - «ճշգրիտ» կրկնակի չակերտների մեջ։ Իհարկե, համակարգիչը կարող է տալ ձեզ շատ ճշգրիտ եւ շատ
12:13 - accurate numbers. there is no doubt about that. but is the analysis accurate? well that would
12:13 - ճշգրիտ թվեր։ Դրանում կասկած չկա։ Բայց արդյո՞ք վերլուծությունը ճշգրիտ է։ Դե, դա կախված կլինի
12:19 - depend on how you design the corpus, what statistical measures you use to analyze your
12:19 - այն բանից, թե ինչպես եք դուք նախագծում կորպուսը, ինչ վիճակագրական միջոցներ եք օգտագործում ձեր
12:26 - data and so on... we will talk about statistics in corpus linguistics in later videos. so what more?
12:26 - տվյալների վերլուծության համար եւ այլն։ Մենք կխոսենք վիճակագրության մասին կորպուսային լեզվաբանության մեջ հետագա տեսանյութերում։ Այսպիսով, ինչ ավելին։
12:33 - yeah computers can give insights into patterns not easily detectable by humans. well since the
12:33 - այո, համակարգիչները կարող են տալ պատկերացումներ այն ձեւերի մասին, որոնք հեշտությամբ չեն հայտնաբերվում մարդկանց կողմից։ Քանի որ
12:39 - computer analyzes millions and millions of data then of course some patterns will emerge and these
12:39 - համակարգիչը վերլուծում է միլիոնավոր եւ միլիոնավոր տվյալներ, ապա իհարկե որոշ ձեւեր կհայտնվեն, եւ այս
12:45 - patterns may not be easily detectable by us or by following our intuition. so the computer has that
12:45 - ձեւերը հեշտությամբ չեն հայտնաբերվի մեզ կամ մեր ինտուիցիայով։ Այսպիսով, համակարգիչն ունի այդ
12:53 - advantage and unfortunately since everything has its limitations,... well a computer too, no matter
12:53 - առավելությունը, եւ ցավոք, քանի որ ամեն ինչ ունի իր սահմանափակումները,... դե, համակարգիչն էլ, անկախ
13:01 - how good it is, has its limitations. I'll give you an example. there is an interesting research
13:01 - որքան լավ է, ունի իր սահմանափակումները։ Ես կտամ ձեզ մի օրինակ։ Կա հետաքրքիր հետազոտություն
13:06 - carried out by this gentleman here, Dr. Brezina who is also by the way one of the most important
13:06 - իրականացված այս պարոնի կողմից, դոկտոր Բրեզինայի, ով ի դեպ կորպուսային լեզվաբանության ամենակարեւոր
13:14 - scholars in modern corpus linguistics, what can corpora tell us about learning a foreign language?
13:14 - գիտնականներից մեկն է։ Ի՞նչ կարող են կորպուսները մեզ ասել օտար լեզու սովորելու մասին։
13:21 - quite a lot actually. anyway he did a very interesting research in which he found that male
13:21 - իրականում շատ բան։ Ամեն դեպքում, նա կատարեց շատ հետաքրքիր հետազոտություն, որի արդյունքում պարզեց, որ տղամարդ
13:30 - british speakers use personal pronouns less than female british speakers. now this is something
13:30 - բրիտանացի խոսնակները անձնական դերանուններ ավելի քիչ են օգտագործում, քան կին բրիտանացի խոսնակները։ Սա այն է,
13:38 - that the computer can tell you in terms of numbers and frequencies and so on.. but a computer cannot
13:38 - ինչ համակարգիչը կարող է ասել ձեզ թվերի եւ հաճախականությունների առումով եւ այլն։ Բայց համակարգիչը չի կարող
13:44 - tell you why. why do female British speakers use personal pronouns more than male speakers do? the
13:44 - ասել, թե ինչու։ Ինչու են կին բրիտանացի խոսնակները ավելի շատ օգտագործում անձնական դերանուններ, քան տղամարդ խոսնակները։
13:51 - computer cannot tell you that so it is up to you the researcher to give qualitative explanations
13:51 - համակարգիչը չի կարող ասել դա, այնպես որ դա ձեր՝ հետազոտողի գործն է տալ որակական բացատրություններ
13:56 - to the data. so a computer can do quantitative analysis very precisely and very accurately,
13:56 - տվյալներին։ Այսպիսով, համակարգիչը կարող է կատարել քանակական վերլուծություն շատ ճշգրիտ եւ շատ ճիշտ,
14:03 - and it's up to you the researcher to do whatever qualitative interpretations of that data. all
14:03 - եւ դա ձեր՝ հետազոտողի գործն է կատարել որակական մեկնաբանություններ այդ տվյալների վերաբերյալ։
14:11 - right now "software for corpus analysis" and I know that this is what you are interested in. you
14:11 - հիմա «ծրագրակազմ կորպուսի վերլուծության համար» եւ ես գիտեմ, որ սա է այն, ինչ ձեզ հետաքրքրում է։ Դուք
14:17 - want to have some fun investigating whatever language you are interested in. so anyway,
14:17 - ցանկանում եք զվարճանալ հետազոտելով այն լեզուն, որը ձեզ հետաքրքրում է։ Ամեն դեպքում,
14:23 - software for corpus analysis. are there any software available for free? are there any
14:23 - ծրագրակազմ կորպուսի վերլուծության համար։ Արդյո՞ք կան ծրագրակազմեր, որոնք հասանելի են անվճար։ Արդյո՞ք կան
14:27 - good ones? well my friend yes! there are a bunch of them but I highly suggest these two. Lancsbox
14:27 - լավերը։ Դե, իմ ընկեր, այո՛։ Կան դրանցից մի քանիսը, բայց ես շատ եմ խորհուրդ տալիս այս երկուսը։ Lancsbox
14:35 - and AntConc. they are available for free. they will not take much space in your computer,
14:35 - եւ AntConc։ Դրանք հասանելի են անվճար։ Դրանք շատ տեղ չեն զբաղեցնի ձեր համակարգչում,
14:39 - which is always a plus, and they're user friendly. they are fairly easy to use and yeah you can carry
14:39 - ինչը միշտ դրական է, եւ դրանք օգտագործողի համար հարմար են։ Դրանք բավականին հեշտ են օգտագործման համար, եւ այո, դուք կարող եք կատարել
14:46 - out your first corpus analyses using either one of these two and I will talk about them in
14:46 - ձեր առաջին կորպուսային վերլուծությունները՝ օգտագործելով այս երկուսից որեւէ մեկը, եւ ես կխոսեմ դրանց մասին
14:51 - future videos. anyway so what does a corpus look like? very simply this is a corpus, it's just a
14:51 - հետագա տեսանյութերում։ Ամեն դեպքում, ինչպիսի՞ն է կորպուսը։ Շատ պարզ՝ սա է կորպուսը, դա պարզապես
15:01 - collection of texts which are collected according to one's research objectives. that's it. so what
15:01 - տեքստերի հավաքածու է, որոնք հավաքվում են ըստ մեկի հետազոտական նպատակների։ Այդքանը։ Այսպիսով, ինչ
15:08 - is corpus linguistics?... to go back to the question that we have started our presentation with. yes
15:08 - է կորպուսային լեզվաբանությունը։ Վերադառնանք այն հարցին, որով մենք սկսեցինք մեր ներկայացումը։ Այո,
15:14 - we have seen that corpus linguistics is the study of language using corpora. what else?
15:14 - մենք տեսանք, որ կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է կորպուսների միջոցով։ Ինչ ավելին։
15:21 - corpus linguistics is not a theory of language. so it does not explain how we acquire language
15:21 - Կորպուսային լեզվաբանությունը լեզվի տեսություն չէ։ Այսպիսով, այն չի բացատրում, թե ինչպես ենք մենք ձեռք բերում լեզուն
15:26 - or whatever any of that. it's just a tool or a method to study language and investigate
15:26 - կամ նման բաներ։ Դա պարզապես գործիք է կամ մեթոդ՝ լեզուն ուսումնասիրելու եւ հետազոտելու
15:33 - linguistic phenomena. that's it. so to conclude, what have we learned today? I'll ask you some
15:33 - լեզվաբանական երեւույթները։ Այդքանը։ Այսպիսով, եզրափակելու համար, ինչ սովորեցինք այսօր։ Ես կտամ ձեզ մի քանի
15:39 - questions do not cheat and make sure to answer them to see if you have grasped most of the ideas
15:39 - հարցեր, մի խաբեք եւ համոզվեք, որ պատասխանում եք դրանց՝ տեսնելու համար, թե արդյոք դուք հասկացել եք այս տեսանյութում ներկայացված գաղափարների մեծ մասը։
15:45 - presented in this video. so what is a corpus? yeah a corpus is a large collection of authentic texts
15:45 - Այսպիսով, ի՞նչ է կորպուսը։ Այո, կորպուսը իսկական տեքստերի մեծ հավաքածու է,
15:55 - that are stored in a computer analyzed using software designed for corpus analysis. Why
15:55 - որոնք պահվում են համակարգչում եւ վերլուծվում են կորպուսի վերլուծության համար նախատեսված ծրագրակազմի միջոցով։ Ինչու
16:01 - principled and large collections of authentic texts? yeah, according to one's objectives,
16:01 - սկզբունքային եւ մեծ հավաքածուներ իսկական տեքստերի։ Այո, ըստ մեկի նպատակների,
16:11 - a corpus should be a representative sample of language use in light of those objectives. so if
16:11 - կորպուսը պետք է լինի լեզվի օգտագործման ներկայացուցչական նմուշ՝ այդ նպատակների լույսի ներքո։ Այսպիսով, եթե
16:16 - you're interested in seeing how people use, for instance Spanish orally in Spain, then you need
16:16 - դուք հետաքրքրված եք տեսնելու, թե ինչպես են մարդիկ օգտագործում, օրինակ, իսպաներենը բանավոր Իսպանիայում, ապա դուք պետք է
16:22 - to collect oral data of Spanish production again in Spain, so on so forth. what else? yeah what is
16:22 - հավաքեք իսպաներենի բանավոր արտադրության տվյալներ նորից Իսպանիայում, եւ այլն։ Ինչ ավելին։ Այո, ինչ է
16:30 - corpus linguistics? this is a fairly easy question and I know that you'll get this one right! yeah
16:30 - կորպուսային լեզվաբանությունը։ Սա բավականին հեշտ հարց է, եւ ես գիտեմ, որ դուք ճիշտ կպատասխանեք այս մեկին։ Այո,
16:36 - yeah corpus linguistics is the study of language simply using corpora. it is not a theory of
16:36 - այո, կորպուսային լեզվաբանությունը լեզվի ուսումնասիրությունն է պարզապես կորպուսների միջոցով։ Դա լեզվի տեսություն չէ,
16:41 - language. it's only a tool or a method to investigate linguistic phenomena. so yeah some of
16:41 - դա միայն գործիք է կամ մեթոդ՝ լեզվաբանական երեւույթները հետազոտելու համար։ Այսպիսով, այո, որոշ
16:48 - the important scholars, and these are by no means the most important ones, but some of them, there's
16:48 - կարեւոր գիտնականներ, եւ սրանք ամենեւին էլ ամենակարեւորները չեն, բայց նրանցից մի քանիսը՝ կան
16:54 - Leech, Biber, Conrad McCarthy and of course Brezina. I highly suggest that you read some
16:54 - Լիչը, Բիբերը, Կոնրադ ՄաքՔարթին եւ իհարկե Բրեզինան։ Ես շատ եմ խորհուրդ տալիս, որ դուք կարդաք
17:01 - of their their work. they're really informative. but many consider Sinclair to be one of the most
17:01 - նրանց աշխատանքներից։ Դրանք իսկապես ինֆորմատիվ են։ Բայց շատերը համարում են Սինքլերին ամենակարեւոր
17:09 - important scholars in Corpus linguistics or at least modern corpus linguistics and I highly
17:09 - գիտնականներից մեկը կորպուսային լեզվաբանության մեջ կամ առնվազն ժամանակակից կորպուսային լեզվաբանության մեջ, եւ ես շատ
17:15 - suggest that you read Sinclair's work. so here are some references to get you started. You can start
17:15 - խորհուրդ եմ տալիս, որ դուք կարդաք Սինքլերի աշխատանքները։ Այսպիսով, ահա մի քանի հղումներ՝ սկսելու համար։ Դուք կարող եք սկսել
17:23 - by any one of these. they are highly informative. they helped me a lot when I first started learning
17:23 - դրանցից ցանկացածով։ Դրանք շատ ինֆորմատիվ են։ Դրանք շատ օգնեցին ինձ, երբ ես առաջին անգամ սկսեցի սովորել
17:29... about corpus linguistics and I highly suggest that you read them, or at least one of them. so this
17:29... կորպուսային լեզվաբանության մասին, եւ ես շատ խորհուրդ եմ տալիս, որ դուք կարդաք դրանք կամ առնվազն դրանցից մեկը։ Այսպիսով, սա
17:35 - brings us to the end of the video I hope that you have enjoyed it and I hope that you have learned
17:35 - մեզ բերում է տեսանյութի ավարտին։ Հուսով եմ, որ դուք հաճույք ստացաք դրանից, եւ հուսով եմ, որ դուք սովորեցիք
17:42 - or at least I have answered some of your questions and if you have further questions don't hesitate
17:42 - կամ առնվազն ես պատասխանեցի ձեր հարցերից մի քանիսին, եւ եթե դուք ունեք հետագա հարցեր, մի հապաղեք
17:47 - to leave your questions in the comment section down below. I'll do my best to answer all of
17:47 - թողնել ձեր հարցերը մեկնաբանությունների բաժնում ներքեւում։ Ես կանեմ հնարավորը՝ պատասխանելու ձեր բոլոր
17:51 - your questions. If the question requires another video I'll gladly post another video and yeah have
17:51 - հարցերին։ Եթե հարցը պահանջում է մեկ այլ տեսանյութ, ես սիրով կտեղադրեմ մեկ այլ տեսանյութ, եւ այո, ունեցեք
17:57 - a good week have a good month have a good year and see you the next video bye bye ciao ciao...
17:57 - լավ շաբաթ, լավ ամիս, լավ տարի, եւ տեսնվենք հաջորդ տեսանյութում։ Ցտեսություն, ցտեսություն...
Commentaires