Этот перевод What is language? получился в результате общения с моим старым другом -:).
Я специально не редактировал сгенерированный текст, чтобы показать уровень перевода, который я считаю блестящим. Тем у кого после чтения перевода останутся сомнения и они захотят понять, почему я так считаю, предлагаю ознакомиться с главой Impressions в Tree banks usage in linguistics.
Я только:
добавил пропущенную концовку главы Доказательства (отсутствие) красным цветом.
отформатировал текст как в оригинале.
добавил HTTP линки
скопировал список литературы из оригинала.
## Введение
Перечитывая технические и популярные публикации по лингвистике – на этот раз внимательно – я осознал, что свободное использование терминов язык и речь, сознание, мышление, мысль, семантика, значение и т.д. вызывает недопонимание; написание книги под названием "Что такое язык?" может быть хорошей идеей. Пока это просто блог.
## Язык и речь
"Чтобы говорить ясно и точно, нам нужен точный и хорошо определенный язык" [Aho1972::1]. Давайте начнем с определения терминов язык и речь.
Отсутствие ясности очевидно в различении языка и речи: речевой акт обычно отделяется от языка, но речь как объект, вещь, комбинация знаков: лексемы и фразы, предложение – нет. В лучшем случае эти два понятия либо используются взаимозаменяемо, либо речь считается частью языка [Cho1959].
Вот определения языка и речи из словаря Random House Dictionary [Ran1996]:
язык - 1) Совокупность слов и систем их использования, общих для людей, принадлежащих к одному сообществу или нации, одной географической области или одной культурной традиции. 2) общение голосом характерным для человека способом, использующим произвольные звуки в разговорной манере с общепринятыми значениями, речь. 3) система лингвистических знаков или символов, рассматриваемая абстрактно (в противоположность речи). 4) любой набор или система таких символов, используемых более или менее единообразно группой людей, которые таким образом могут понятно общаться друг с другом. 5) любая система формализованных символов, знаков, звуков, жестов или тому подобного, используемая или задуманная как средство общения мыслей, эмоций и т.д. 6) средства общения, используемые животными. …
речь - 1) способность или сила говорения; устное общение; способность выражать свои мысли и эмоции с помощью речевых звуков и жестов. 2) акт говорения. 3) что-то произнесенное; высказывание, замечание или заявление. 4) форма общения на разговорном языке, осуществляемая говорящим перед аудиторией.... 5) любое отдельное высказывание актера в ходе пьесы, кинофильма и т.д. 6) форма высказывания, характерная для определенного народа или региона; язык или диалект.
Я предполагаю, что лексикографы в Random House профессионально выполнили свою работу и задокументировали наиболее часто приписываемые значения словам в умах англоговорящих: задача лексикографов – наблюдать и документировать. Распространение четких и точных определений или значений – это задача ученых, исследователей и научных писателей.
Примечательно, что в случае речи определения не так далеки от современного взгляда большинства лингвистов (я надеюсь), хотя они преимущественно описывают речевой акт. Я думаю, что замена "способности выражать" на "выражение" в третьем из первых трех значений сделает определение довольно точным.
Для языка ситуация отчаянная. Пропуская подробный анализ согласованности, точности и четкости определений, давайте просто отметим, что они в основном о "коммуникации"; некоторые из них о "вещи", другие – о "процессе", и ни одно из них не упоминает ничего близкого к грамматическим правилам. Однако первое значение можно сделать менее расплывчатым, добавив "системы правил их использования", точка.
Из моего далеко не исчерпывающего обзора технической литературы я нашел только одно близкое к реальности определение языка:
Социально разделяемый код или условная система для представления понятий посредством использования произвольных символов и управляемых правилами комбинаций этих символов. [Owe1988::453]
Это очень точное определение языка: после удаления "Социально разделяемый код или" с начала и добавления "как разделяемый код для значения" в конце его можно считать совершенным.
Определение речи, с другой стороны, там не столь последовательно или точно:
речь - Динамический нейромышечный процесс производства речевых звуков для общения; вербальное средство передачи. [Owe1988::456]
речевой акт - Основная единица коммуникации, преднамеренное,... вербально закодированное сообщение, которое включает намерения говорящего, значение говорящего, значение сообщения и интерпретацию слушателя. Понятие, определенное Серлем. [Owe1988::456]
Четкое определение и разграничение таких сложных явлений, как сознание, мысль, язык и речь, очень важно не только для ясного говорения: для большинства из нас говорение не является самоцелью. Это средство выражения нашего восприятия вселенной, реальности и передачи его другим для понимания.
Прежде чем перейти к определениям языка и речи, важно упомянуть, что термин письменная речь в английской технической литературе не совсем распространен. Однако фразы устная речь, письменная речь или жестовая речь звучат естественно для армянских или русских лингвистов (иногда текст используется для обоих - см., например, #8 в разделе Լեզվաբա-նություն եւ ՀԹՏ в Լեզվաբանություն, ԱԲ, եւ ՀԹՏ): см. определение языка на 4:40 и текста - 6:25)
### Имеет ли язык что-то общее с коммуникацией?
Я бы сказал Нет, но это зависит от того, что подразумевается под коммуникацией. Подробнее см. в разделе "Является ли язык системой коммуникации?" ниже.
Вы можете рассматривать двух людей, обменивающихся вербальными, письменными или жестовыми сообщениями, закодированными на определенном языке, как базовую систему коммуникации, включающую речь. Их два разума являются пользователями или операторами системы: один (разум говорящего) 1) генерирует мысли, 2) используя "языковой орган" кодирует мысль в [письменную, голосовую или жестовую] речь, в то время как другой (разум слушающего) 3) анализирует (декодирует) речь (сообщения), используя тот же "языковой орган", и 4) преобразует ее в мысль - понимает. Здесь "тот же" означает "того же типа" и аналогично настроенный, потому что каждый мозг содержит отдельный "языковой орган". В этой схеме фонемы, тонемы, графемы или жестемы являются просто физическими представлениями знаков (символов). Набор знаков (символов) и правила их комбинирования в более сложные знаки известны обоим: Говорящему и Слушающему. Знание знака включает знание соответствующих означающих – значения....
Люди без нарушений могут использовать все их типы, но фонемы (тонемы) являются базовыми. Однако важен знак, символ, а не фонема: мы говорим, используя символы. Интересно, что писатели не уделяют этому много внимания. Они пишут звуки, а не символы или знаки – см., например, [Cho1967::397], [Cha2018, в подзаголовке и в других местах текста].
Разница между языком и речью была впервые (насколько мне известно) отмечена Ф. де Соссюром. Он подчеркнул диахроническую природу языка и синхроническую – речи [Cry2010::431, Ջահ1974::21], но под речью он имел в виду речевой акт. Диахрония абсолютивна по своей природе, в то время как синхрония – относительна. "Во время применения языка, т.е. во время речи, синхронные единицы, вовлеченные в процесс, лишены временного измерения. Речь как процесс растягивается на определенную продолжительность времени. Однако такую динамику не следует отождествлять с историей. С точки зрения динамического явления речь не имеет истории - это преходящее явление в истинном смысле слова, то есть записываемое и сравнимое с другими случаями речи в той мере, в какой оно записывается как язык. Истинным носителем истории является язык, отдельные проявления которого можно последовательно сравнивать. В то же время речь имеет непрерывный характер (паузы также являются носителями смысла и входят в речь как необходимый элемент), язык прерывист (дискретен)" [Ջահ1974::21].
Единицы (знаки, слова) языка соотносятся парадигматически (ассоциативно), в то время как отношения единиц (знаков, слов) речи синтагматические [Cry2010::431] – линеаризованная иерархическая, древовидная структура.
Хомский, который явно не различает язык и речь [Cho1959], "провел фундаментальное различие (подобное langue и parole Соссюра) между знанием человеком правил языка и фактическим использованием этого языка в реальной ситуации. Первое он назвал компетенцией; второе – исполнением. Лингвистика должна заниматься изучением компетенции,... а не ограничиваться исполнением – что было характерно для предыдущих лингвистических исследований в их опоре на образцы (или 'корпусы') речи (например, в форме коллекции магнитофонных записей)" [Cry2010::433].
В этом тексте мы будем использовать следующие определения языка и речи:
язык – набор [морфологических и синтаксических] правил, которые производят новые знаки или последовательности знаков путем их комбинирования из ранее доступных знаков. Язык – это система, производящая речь. [Հայ2022::282]
речь - комбинации знаков определенного языка, произведенные в соответствии с грамматическими правилами, для передачи информации (содержания) от говорящего к слушающему. Речь – это продукт языка. [Հայ2022::283]
"Различие между языком и речью имеет свою параллель в различии между сознанием и мышлением. Таким образом, мы должны говорить не о связи между языком и мышлением, а скорее проводить параллели между языком и сознанием и между речью и мышлением соответственно. Действительно, мышление, как и речь, имеет прямой и процессуальный характер, в то время как сознание – нет. Это не что иное, как некое существующее состояние. Каждый акт мышления опирается на сознание и превращается в факт сознания. Однако мы должны иметь в виду, что неосознанные явления (ср. междометия) также играют важную роль в языке" [Ջահ1974::21-22].
Резюме: язык – это набор значимых знаков (терминов) и набор правил для их комбинирования в новые значимые знаки – элементы речи (я не могу использовать термин Части Речи, потому что он [не очень точно] присвоен для обозначения лингвистических, относящихся к языку категорий знаков, таких как существительное, прилагательное и т.д.). Речь – это древовидная комбинация знаков, которая часто относится к некоторым восприятиям реальности. Отношение между языком и речью – это отношение производителя к продукту. Подобно: завод Ford Motors к автомобилю Ford; форма для печенья к печенью; принтер к книге, дерево к плоду, язык программирования C++ к программе, написанной на C++, и т.д.
## Смысл и референция
Ф. де Соссюр рассмотрел еще одну пару лингвистических понятий: знак и его значение. Он "признал две стороны изучения значения,... но подчеркнул, что отношения между ними произвольны (с.428). Его обозначения для двух сторон - signifiant ('то, что обозначает', или 'звуковой образ') и signifié ('то, что обозначается', или 'концепт'). Эти отношения обозначаемого и обозначающего Соссюр называет лингвистическим знаком. Знак является базовой единицей коммуникации в сообществе: langue рассматривается как 'система знаков'" [Cry2010::431].
Примерно в то же время, чуть раньше [Fre1892], оказалось, что простое сопоставление не совсем точно. К сожалению, лингвистическое сообщество до сих пор не оценило работу Фреге (по крайней мере, в [Cry2010] нет упоминания о Фреге, в то время как менее точный подход Соссюра описан).
"Математик-философ конца девятнадцатого века Готлоб Фреге предоставил четкое различие между этими двумя часто путаемыми аспектами значения слова. Он различал смысл термина и его референцию. Смысл - это идея, которая возникает в уме при рассмотрении конкретного слова или фразы. Это отличается от референции того же слова или фразы, которая является чем-то в мире, что соответствует этому термину и его смыслу" [Dea1998::61].
Эти разработки прояснили процесс передачи идей из одного разума в другой. Конкретный язык представляет собой реестр категоризированных знаков – морфем - и их возможного смысла (значения) и/или грамматических функций – Словарь. Это также реестр комбинаторных Правил – синтаксиса - для кодирования более сложных понятий, категорий, [собственных] имен, явлений, отсутствующих в Словаре. Коды в Словаре и новые коды имеют смысл для сообщества индивидов, которые согласились 1) на коды Словаря и их отображение в вещи или концепции, а также 2) на Правила кодирования новых вещей и концепций. Правила ограничивают комбинацию категоризированных знаков (частей речи) и их производных (парадигматических форм) в коды, которые имеют смысл. Морфологические правила можно считать частью синтаксиса,... потому что они также создают новые коды – лексемы, которые обычно называются словами - очень расплывчатое понятие.
Коды, которые имеют смысл, мы называем грамматическими или грамматически правиль-ными. На стороне говорящего функция языка завершается в момент создания кода. Для слушателя функция языка начинается в момент восприятия речи и заканчивается после ее разбора в синтаксическую структуру. Референция присваивается динамически синтаксической структуре после разбора. Для слушателя это не обязательно та же референция, что и для говорящего. Это то, что вызывает недопонимание.
Термин динамический означает, что референция не прикреплена или не связана с кодом (экземпляром речи, текстом) статически в Словаре или в момент создания нового грамматического кода. Значение морфемы или комбинации морфем зависит также от контекста, в котором они находятся [Հայ2022::160-163].
Нельзя построить грамматическое предложение, используя только синтаксис. Обычно это рекурсивный процесс 1) построения грамматического кода, 2) вычисления референции, а затем повторения 1) и 2) на следующем уровне. Язык – точнее набор синтаксических правил - это инструмент для создания речи, которая имеет смысл. Это независимая ценность синтаксиса, основа его автономии [Cho1975::138].
Важно прояснить значение термина смысл в вышеуказанном контексте. Это смысл Фреге [Fre1892], а не повседневное значение: как в имеет [не имеет] смысла. Смысл Фреге эквивалентен понятному, грамматической фразе. С этой точки зрения предложение "Бесцветные зеленые идеи яростно спят" [Cho1975::138] имеет смысл, но не имеет референции - оно бессмысленно.
Эта связь очень похожа на последний шаг связывания-редактирования [Aho1972::721] компилятора языка программирования, когда разобранный код, который изначально был написан на языке программирования высокого уровня, редактируется для того, чтобы сделать его исполняемым. Мы могли бы назвать это фрегевским связыванием.
Резюме: значение имеет 2 аспекта - смысл и референцию (см. также Իմաստային պարադոքսներ). Смысл - это содержание фразы, а референция - то, что означает это содержание.
### Слова для понятий: кодирование и декодирование образов
В повседневной жизни мы свободно сопоставляем слова с вещами или понятиями. В повседневной жизни это работает хорошо даже в крайне нелепых случаях. Например, люди прекрасно поняли, что под социальной дистанцией органы здравоохранения на самом деле имели в виду физическую дистанцию. Благодаря "сообразительности" и гибкости нашего мышления – но точнее, благодаря позднему связыванию (фрегевскому связыванию) речи – большинство из нас соблюдало физическую дистанцию (6 футов) и в некоторой степени помогло взять под контроль недавнюю пандемию.
В повседневной жизни мы прекрасно обходимся, используя слово язык для обозначения речи и наоборот. Эта двусмысленность не сильно влияет на наше понимание мира и друг друга. Контекст позволяет нам правильно связать его с нужным понятием на лету. Когда контекста недостаточно, собеседники могут задавать вопросы и обогащать его.
Благодаря фрегевскому связыванию "неточные" фразы вроде часть речи, универсальная грамматика, социальная дистанция, большая языковая модель и т.д. приобретают единственное четкое значение в конкретном контексте, в момент понимания. В этих фразах некоторые слова (лексемы) имеют ожидаемую связь – часть, грамматика, дистанция, большая модель. Когда меньше или вообще нет лексем с ожидаемой связью, и неожиданная, новая связь становится все сильнее и сильнее со временем, мы получаем идиому.
То же самое может происходить и происходит с научной терминологией: когда нет консенсуса, процесс связывания не сходится к единому значению. Это особенно верно для сложных, трудно определяемых терминов, таких как сознание, мысль, мышление, язык, речь, значение и т.д. Очень важно четко определять такие термины. Четкое определение важно, потому что даже если никто с ним не согласится, оно сделает обсуждение и аргументацию осмысленными.
Ученые используют четкие определения терминов, чтобы установить контекст, который упрощает связывание их речи с описанием реальности, вселенной. Политики, с другой стороны, рассматривают множество контекстов:... один, который обеспечивает динамическое связывание для сторонников, другой – для оппонентов, еще один – для обычных людей, которые больше не хотят их слушать. Лучшие, самые умелые политики производят такие речи, что каждый сегмент аудитории однозначно связывает значение в соответствии с намерением политика. Предполагается, что сторонники свяжут такое значение, что они не убегут от партии политика, оппоненты – будут испытывать трудности с поиском возражений и опровержений, а обычные люди – подумают, что цель оратора не в получении власти, а скорее – наконец-то – в том, чтобы сделать что-то хорошее для них. Это научное объяснение двоемыслия (см. Дж. Оруэлл. "1984").
Противоречия в науке означают, что философы находятся в процессе определения/уточнения терминов, связывания смысла с референцией. Я не говорил этого – это сказал Витгенштейн (см. [Wittgenstein], например, ## 36, 43, 90, 118). Он сделал это филологически, в то время как я пытаюсь передать то же самое логически, технически, описывая точное место непонимания с использованием теории значения Фреге.
Резюме: В повседневной речи мы свободно приписываем значение словам, что вызывает недопонимание и требует дополнительных вопросов. В научной, технической литературе термины должны иметь четкое, однозначное значение.
## Лингвистический детерминизм и относительность
### Происхождение
Теория лингвистического детерминизма и относительности утверждает, что 1) человеческое мышление, мировоззрение формируется языком (детерминизм) и 2) существуют непереводимые утверждения (относительность). Эта цитата считается определением основ теории:
"Мы расчленяем природу в направлении, подсказанном нашим родным языком. Мы выделяем в мире явлений те или иные категории и типы совсем не потому, что они (эти категории и типы) самоочевидны; напротив, мир предстает перед нами как калейдоскопический поток впечатлений, который должен быть организован нашим сознанием, а это значит в основном – языковой системой, хранящейся в нашем сознании. Мы расчленяем мир, организуем его в понятия и распределяем значения так, а не иначе в основном потому, что мы участники соглашения, предписывающего подобную систематизацию. Это соглашение имеет силу для определенного речевого коллектива и закреплено в системе моделей нашего языка [...] все наблюдатели не приходят к одной и той же картине вселенной, если их языковые основы не сходны или, по крайней мере, не могут быть как-то соотнесены" [Who1956::212-214].
Этот отрывок цитируется в [Bea1959::587], [Pin1994::49], [Cry2010::15]; версия выше взята из Википедии.
### Анализ
Я бы утверждал – как и многие уже делали – что верно обратное: язык не имеет ничего общего с картиной вселенной. Просто теоретизируя о когнитивных путях, используя только четко определенные термины, можно прийти к очень естественному, даже тривиальному выводу, что мысли формируют язык.
"Люди разбирают образы, поступающие в мозг от органов чувств, на онтологические, реляционные и логические понятия. Окружающая среда (в более широком смысле) представлена как отношения изобретенных понятий, их разбиение и группировка. Это составляет человеческое восприятие вселенной и того, что они отождествляют в своем мозгу с реальностью. Это картина реальности. Современная наука до сих пор не знает, как эта картина формируется и хранится в мозге. Люди судят об этом на основе представления и передачи друг другу образа реальности. Общение осуществляется посредством речи, будь то естественная (включая математическую и логическую) или изобразительная (рисунок, картина) или другого типа. Естественная речь вместе с органами чувств передает информацию об окружающей среде. Этим она участвует в построении Семантической сети (СС) [Hof1979::370-372]. Таким образом, построение СС осуществляется 1) когнитивными и 2) доказательными процессами. Чувства ⇒ Образ ⇒ ((Сознание)) ⇒ [[Мышление]] ⇒ Понятие ⇒ СС: ССгов.Понятие ⇒ ((язык)) ⇒ [[Говорение]] ⇒ ((язык)) ⇒ Понятие ⇒ СС. В вышеприведенных пунктах действия заключены в двойные квадратные скобки, а наборы законов или структур (в отличие от вещей) – в двойные круглые скобки. СС говорящего помечена гов, чтобы отличить СС говорящего от СС слушающего. Первое – это схематическое описание мышления – процесса познания, а второе – процесса коммуникации. С помощью последнего люди сообщают друг другу о том, что они видели, слышали,... думали о реальности и событиях (см. ниже более подробно)" [Հայ2022::179 - извините за самоцитирование].
Цель этой цитаты – показать, что Понятия и их отношения – содержание СС, которая представляет реальность в наших мозгах – формируются на основе данных или информации, поступающей от 5 чувств и речи. Вы можете считать "языковой орган" 6-м чувством. Если глаз передает визуальные образы в мозг для преобразования их в Понятия, то "языковой орган" передает речь в мозг. Однако есть большая разница: 5 чувств являются первичными, непосредственными источниками образов, в то время как речь является вторичным, опосредованным источником – кто-то уже увидел, услышал, понюхал, потрогал или попробовал что-то на вкус или вообразил соответствующий образ, прежде чем преобразовать его в Понятие, а затем сгенерировать речь с помощью "языкового органа".
Если мы примем вышеприведенное описание наблюдения за миром и разговора о нем, то мы можем заметить, что:
1. Набор понятий в индивидуальном сознании может быть создан/обновлен путем
a. наблюдения (в более общем смысле – ощущения и мышления) мира
b. прослушивания описания понятий, которые находятся в сознании других людей
2. Язык не может влиять на мышление, потому что мы не думаем на естественном, родном языке (см. раздел "Думают ли люди на языке?" ниже)
3. Любое понятие должно быть сначала сформировано путем ощущения/мышления (в предковом сознании).
4. В любом моноязычном сообществе мышление формирует язык через:
a. Словарь морфем, обозначающих понятия,
b. Синтаксис путем процесса грамматикализации [Cor2011::29-31] – грубо говоря: процесс утраты онтологического или метафизического смысла и приобретения грамматического: генезис служебных слов, суффиксов, адпозиций и т.д.
5. В моноязычном обществе единственный способ, которым язык может повлиять на содержание СС или повлиять на познание или мировоззрение – это невозможность закодировать понятие, высказать его.
### Доказательства (отсутствие)
Сторонники лингвистической относительности в 20-50-х годах и недавно пытались найти доказательства для пункта #5 выше. Два утверждения, которые считались доказательствами лингвистической относительности:... 1) в эскимосском языке есть около 100 слов (начиналось с 4 и затем умножалось журналистами) для снега и 2) в языке хопи нет времени, не являются фактическими. См. подробности, например, в [Pin1994::50-54], [Dev1997::108-112], [Prn2011::181-183].
"Эмпирические исследования, обсуждаемые в предыдущих разделах (частично стимулированные собственными оригинальными идеями Уорфа), указывают на то, что изученные до сих пор когнитивные процессы в значительной степени независимы от особенностей любого естественного языка и, фактически, что познание может развиваться до определенной степени при отсутствии знания какого-либо языка. Обратное не верно; рост и развитие языка, по-видимому, требуют определенного минимального состояния зрелости и специфичности познания" [Len1967::364].
Не нужно обращаться к экзотическим языкам, чтобы обнаружить, что некоторые понятия не имеют предопределенного знака (слова) в языке. Вся цель языка состоит в том, чтобы предоставить инструменты для создания комбинаторных знаков для них. В индоевропейской семье можно найти языки, в которых нет слов для дяди по материнской линии, старшего брата, жажды и т.д. Но это не означает, что носители этих языков не могут представить – иметь понятие – дяди по материнской линии, старшего брата или никогда не чувствуют или не думают, что они испытывают жажду.
Также не должно удивлять, что у эскимосов, которые большую часть времени проводят в окружении снега, который приобретает разные цвета, текстуры, формы в течение года, есть много слов для снега, в то время как у масаев может не быть ни одного. То же самое верно для языков, в которых нет времен или слов для чисел. В таких языках грамматикализация понятий, связанных со временем, еще не произошла и может никогда не произойти; чи'слa и счет не нужны для полного счастья.
Все это объясняется давлением окружающей среды (на самом деле, его отсутствием): вездесущим принципом наименьшего усилия.
## Логика (отсутствие)
Представьте ботаника, который смотрит на выросшее дерево с апельсинами и спрашивает: "Почему все говорят, что апельсины растут на деревьях? Давайте революционизируем ботанику. Представим, что апельсины производят дерево. Сначала представьте, что апельсины находятся в тех же местах, что и сейчас, без дерева.... Оранжевые сферы будут выглядеть красиво на фоне этого глубокого синего неба с небольшими пятнами ярко-белых облаков. Что если вдруг они начнут выращивать ветви с темно-зелеными листьями, которые начнут сливаться и направляться к земле? И наконец, эти ветви объединятся в здоровый, тяжелый ствол; гравитационная сила затем вобьет его глубоко в почву. Разве это не прекрасно? Фон, цвета, формы. … Мне нужно это записать: 'Мы расчленяем природу вдоль линий…'."
Затем приходит новое поколение ботаников и указывает, что революция зашла слишком далеко и это не совсем правильно: откуда вообще появляются апельсины в небе? "Но посмотрите", говорят они, "апельсины действительно формируют дерево. Они красиво изогнули ветви в идеальные арки… а тяжелые даже сломали их, … удивительно"
Имеют ли в виду сторонники Уорфа такой вид изгибания, когда говорят, что язык влияет на мышление? Мы не знаем, потому что никто не объясняет, что они подразумевают под языком, мышлением, мыслью (чьей: говорящего или слушающего?), формированием и т.д.
Два аспекта формирования дерева апельсинами важны: 1) апельсины меняют внешний вид дерева, а не его сущность, 2) апельсины формируют дерево не в силу своей сущности, не потому, что они апельсины, а скорее потому, что они тяжелые: кирпичи, висящие на дереве, могут иметь такой же или лучший эффект.
"Чтобы найти доказательства гипотезы Сепира-Уорфа, нам нужны три вещи: хорошо установленное лингвистическое различие между двумя языками, корреляция между этим различием и психологическим различием между носителями этих языков, и причина полагать, что последнее вызвано первым" [Pri2012].
Я не хочу придираться к этим 3 вещам - они абсолютно необходимы. Но достаточны ли они? Я думаю, что также абсолютно необходима четвертая вещь: причина полагать, что нет других различий, которые "вызывают первое". Для метафоры с апельсиновым деревом вам нужно установить, что только апельсины изгибают ветви: нет кирпичей, яблок, автомобильных деталей, предметов одежды и т.д., которые могут делать то же самое.... В этом случае вы можете быть уверены, что апельсины, а не вес, делают изгиб.
Логика теории Уорфа выглядит так:
1. Бог вложил языки в мозг людей:
a. "На всей земле был один язык и одно наречие."
b. "Если они, как один народ, говорящий на одном языке, начали это делать, то ничто из того, что они задумают делать, не будет для них невозможным. Сойдем же и смешаем там язык их, так чтобы один не понимал речи другого."
2. Добрый, мудрый и всемогущий Бог создал слова типа малыш, папочка, бабуля, котенок, мамочка, щенок, чтобы люди обожали и любили малышей, пап, бабушек, котят, мам, щенков
3. Если бы Бог не был добрым и мудрым, он/она назвал бы их байден, эрдоган, осама, пригожин, путин, си, и мы бы их ненавидели.
Резюме: Факты и эксперименты до сих пор указывают на вывод, что мышление формирует язык (скорее окружающая среда формирует глубину и ширину грамматикализации).
## Чем язык не является
### Является ли язык системой коммуникации?
Если мы примем определение языка, данное в этом тексте, то нет. Чтобы дать более подробный и точный ответ, нам нужно сначала определить систему коммуникации.
Вы можете назвать систему преобразования мыслей в речь системой коммуникации: язык в этом случае передает (преобразует) мысли в речь и речь в мысли. Цель системы коммуникации [communication system] - передача информации (новостей) через сообщения от источника к цели, от эмиттера к приемнику информации. Она состоит из 1) источника, 2) передатчика, 3) канала, 4) приемника и 5) пункта назначения [Sha1949].
Язык - это инструмент для производства (кодирования) и потребления (декодирования) сообщений, содержащих человеческие мысли. Различные системы коммуникации: телефон, радио, разговор тет-а-тет, писатель - рука и стилус - планшет - глаза - читатель, говорящий-рот (и некоторые окружающие органы) - воздух - ухо - слушатель.
### Есть ли у животных язык?
Если мы примем определение языка в этом тексте, то нет.... Язык - это система знаков и правил для динамического кодирования/декодирования неограниченного числа мыслей в новые знаки. Система коммуникации или, точнее, сигнализации животных основана на жестко закодированном, статическом [Cry2010::421] сопоставлении сигналов с действиями - таблице поиска. Они не могут комбинировать новые сигналы с новыми действиями - они не могут говорить. Более того, мы не можем научить их говорить на нашем языке, потому что у них нет биологических инструментов, органов для этого. Речь идет не об органах для реализации речи через жест или звук, а о "языковом органе" для производства и анализа речи. Они могут выполнять речь, но они не компетентны в ее генерации (производстве) или понимании (анализе). Даже танец пчел генетически жестко закодирован [Cry2010::421] параметризованной сигнализацией. По той же причине отсутствия подходящего органа - человеческого плеча - других животных нельзя научить бросать предметы (камни) конечностями.
### Думают ли люди на [естественном] языке?
Нет. См. цитату [Len1967::364] в разделе "Лингвистический детерминизм и относительность" выше и раздел Mentalese [Pin1994] для более подробного анализа. Выводы в последнем таковы: 1) мысли четкие [AH: они имеют одновершинные, колоколообразные распределения], слова размыты [AH: они имеют многовершинные (множественные значения) колоколообразные, цепочки пиков распределения], неоднозначны; 2) логика мыслей четкая, [английскому] языку не хватает логической эксплицитности [AH: я сомневаюсь в этом; примеры [Pin1994::70] очень тревожные, очень странные]; 3) кореференция (например, Джон, мужчина, он могут относиться к одному и тому же человеку); 4) контекстная интерпретация дейксиса [AH: Почему не "каждой лингвистической единицы"?]; 5) синонимия: одно событие может быть описано несколькими предложениями (например, активно и пассивно).
### Почему GPT не является языковой моделью?
Сначала нам нужно согласиться с тем, что такое модель. Неформально, просто говоря: это упрощенная копия вещей, объектов или явлений. GPT - это нейронная сеть, обученная продолжать строку символов в соответствии со статистикой, собранной на большом количестве текстов из Интернета. Это "автодополнение на стероидах" [Debunking the great AI lie | Noam Chomsky, Gary Marcus, Jeremy Kahn::15:59]. .... Если вы обучите модель, подавая строки пикселей, связанные со строками символов, описывающих картинку, то она начнет описывать сцены, которые вы предоставляете. Или наоборот: если вы подадите ей описание сцен, связанных с пиксельным представлением сцены, она начнет "рисовать" по вашей команде.
Вероятно, все согласятся, что нейронная сеть - это модель мозга. Это первый, базовый слой модели. На нем построен второй слой - предсказательная статистическая модель, которая предполагает, что речь может быть сгенерирована путем вычисления следующего символа (или слова) на основе некоторого числа предшествующих символов (или слов). Важно отметить, что это, вероятно, не то, как люди генерируют речь. Мы предполагаем, что существует врожденный "языковой орган", который строит, генерирует речь в соответствии с синтаксическими правилами или ограничениями. Согласно принятой в настоящее время модели, люди строят высказывания рекурсивно как древовидную структуру, а затем линеаризуют ее.
С этой точки зрения GPT - это модель генератора речи, а не языка, потому что она "не знает" грамматики, она не моделирует компетенцию - технический термин, который "относится к способности идеализированного говорящего-слушателя ассоциировать звуки и значения строго в соответствии с правилами его языка" [Cho1967::398]. Она моделирует исполнение - производство и потребление речи.
Но вот интересный вопрос: возможно ли, что языковая модель - третий слой - возникает в результате статистического обучения? Гипотеза врожденности языка имеет множество экспериментальных подтверждений, но нет твердых доказательств - никто не идентифицировал "языковой орган" в мозге. Может быть, "языковой орган" - это продукт статистического обучения младенцев? Может быть, мозг младенцев-людей предназначен для создания "языкового органа" на очень ограниченном, бедном входе. Бедность входа или стимула [Prn2011::144-157] является одним из основных аргументов в пользу врожденности.
Нейронные сети могут стать полезными инструментами для исследования человеческого мозга. Как он учится и как использует приобретенные "знания" [Հայ2022::179]? Есть новая, развивающаяся область исследований:... Механическая интерпретируемость [The Impact of chatGPT talks (2023) - Prof. Max Tegmark (MIT)::4:35]. GPT для этих исследований - то же, что БАК (Большой адронный коллайдер) для физиков. Еще одна интересная беседа - "Dr Stephen Wolfram says THIS about ChatGPT, Natural Language and Physics."
При проведении такого исследования мы должны помнить, что имеем дело с очень специфическим обучением: преобразованием одной строки чисел в другую. Если я потрачу время и тщательно, пиксель за пикселем скопирую Мону Лизу, могу ли я утверждать, что я художник или даже больше - Леонардо да Винчи?
С другой стороны, исследования в области Механической интерпретируемости могут пролить свет на усвоение языка. Возможный план эксперимента мог бы выглядеть так:
1. Определить фразы, которые люди произносят вокруг младенца до года.
2. Подать нейронной сети - seq2seq (описание можно найти в [Հայ2022::263-274]) или архитектуре Transformer - эти фразы, затем дать подсказку сети и записать результаты.
3. Добавить больше фраз в обучающие наборы, например, добавив те, которые ребенок может слышать к 1,5 годам.
4. Дать подсказку сети и записать результаты.
Последние два шага можно продолжить, постепенно добавляя фразы для 2, 3 и т.д. лет. Затем, анализируя результаты подсказок после каждой сессии обучения, мы можем выяснить, начинает ли сеть "слоговое лепетание", "бессмысленное лепетание", однословные высказывания, двухсловные строки и, наконец, полные предложения [Pin1994::273]. Используя инструменты и методы механической интерпретируемости, мы можем отслеживать, появляются ли "интересные" кластеры нейронов во время глубокого обучения. Есть ли паттерны активации во время ввода и вывода речи, которые можно идентифицировать с операциями анализа и генерации речи. Другими словами, есть ли доказательства того, что "языковой орган" или компетенция возникает в процессе статистического обучения.
Можно с уверенностью предположить бедность армянского ввода в GPT. Мы можем получить представление о возможном поведении для предложенного эксперимента, просмотрев ответ GPT на последний вопрос на странице "Интервью с chatGPT: Тест армянских корпусов и морфологии" [Interviewing chatGPT: Armenian Corpora and morphology test ].
## Эволюция языка
[Этот раздел вдохновлен вопросом к д-ру Н. Хомскому в видео #10.f (00:14:38, Существуют ли единицы культуры, такие как мемы?) - см. Լեզվաբանություն, ԱԲ, եւ ՀԹՏ).]
Я не собираюсь говорить об эволюции языка как таковой - я попытаюсь дать набросок возможного подхода. Ответ Хомского просто вызвал желание объяснить, что такое эволюция и, в частности, "эволюция языка" (как часть культурной эволюции). Существует много заблуждений и недоразумений вокруг эволюции как процесса. Несмотря на четкое определение и прекрасное объяснение Дарвина более 165 лет назад и неодарвинистов (например, Р. Докинза) в настоящее время, биологическая эволюция все еще вызывает путаницу, неверные интерпретации и опровержения с использованием слова Божьего, обмана, тайны и магии.
Отступление (извините): В последнее время научные неверные интерпретации исходят в основном от сообщества разумного замысла. Очень больно смотреть (поищите на YouTube "разумный замысел" или, еще лучше, "ученый доказывает существование Бога") на людей с научными степенями, серьезно обсуждающих полную чепуху. Им нравится доказывать математическую невозможность дарвиновской эволюции. Удивительно, но обученные математики демонстрируют элементарное непонимание теории вероятностей. [Отступление в отступлении; После написания "Удивительно" я понял, что это уже не должно никого удивлять - я настоятельно рекомендую прочитать раздел "Вероятность и неоднозначность" в [Gar2001], чтобы понять почему: "Чарльз Сандерс Пирс однажды заметил, что ни в одной другой области математики экспертам не так легко ошибиться, как в теории вероятностей" [Gar2001, стр.273]. Честные, хорошо обученные математики могут честно ошибаться. Здесь, в верхнем Отступлении, я говорю не о них. Конец ОвО.]
Мой "любимый" пример обоснования разумного замысла аргументом о невероятности - это цитирование сэра Фреда Хойла:... "Вероятность того, что высшие формы жизни могли возникнуть таким образом, сопоставима с вероятностью того, что торнадо, пронесшийся через свалку, может собрать Boeing 747 из находящихся там материалов". Это предложение может впечатлить дилетанта как журналистская блестящая мысль во время политических дебатов, но оно не имеет ничего общего с наукой или применением теории вероятностей. Существует подробный анализ заблуждения о Tорнадо на свалке [Junkyard tornado]. Я просто хочу еще раз подчеркнуть проблему высокого уровня во всех известных до сих пор вероятностных опровержениях дарвиновской эволюции (справедливости ради: сэр Фред Хойл не использовал эту фразу для опровержения эволюции; он говорил о происхождении жизни на Земле). Общая схема такова: 1) случайному процессу назначается цель, а затем 2) показывается, что цель не может быть достигнута случайным процессом в заданных временных рамках - в течение существования Земли или Вселенной. Для ясного объяснения того, как работает случайность в эволюционном процессе, см. программу Weasel. Конец отступления.
Давайте сначала уточним некоторые термины, чтобы не углублять путаницу. Очень трудно (для меня) определить, что такое изменение, потому что это одна из самых загадочных и фундаментальных вещей, которую со времен Парменида мы глубоко не понимаем. Здесь я буду придерживаться здравого смысла, нашего повседневного интуитивного понимания этого.
Существует 2 типа изменений: эволюция - постепенное, "пошаговое" изменение, и революция - резкое и насильственное изменение, обычно в противоположную сторону (отсюда и "ре-").
Существуют 3 основные области эволюции, которая временами превращается в революцию: 1) вся Вселенная и Земля как продукт и участник, 2) биосфера Земли и 3) ноосфера Земли, точнее, человеческая. Проще говоря, последние 2 - это биологическая и культурная эволюция соответственно.
Написание книги "Что такое эволюция?" есть в моем списке желаний (-:), но не в первой десятке. Крупными мазками я хотел бы дать некоторую перспективу понимания недоразумений.
Итак, эволюция - это постепенное изменение. Скорость эволюции разных областей значительно различается: для Земли - эоны, для жизни - миллиарды лет, для культуры - десятки тысяч лет. Вот почему мы не должны говорить о таких вещах, как биологическая и культурная коэволюция.... Для ясности нам нужно предположить, что биоэволюция происходит в мгновение (моргание глаза) эволюции Вселенной, а культурная - в мгновение биологической. С точки зрения временной шкалы культурной эволюции нет эволюции в формах жизни, с точки зрения биологической эволюции - нет изменений во Вселенной. Когда мы рассматриваем биоэволюцию, Вселенная статична, когда мы рассматриваем культурную эволюцию - жизнь статична.
Хомский разделяет эту точку зрения, когда говорит, что язык не эволюционирует. Под этим он подразумевает, что "языковой орган", биологическая способность, поддерживающая человеческую лингвистическую способность (компетенцию), [глубинная] структура языка не меняется. Я надеюсь, что я также понимаю, почему он говорит, что язык меняется, а не эволюционирует.
Биологическая эволюция имеет четкую единицу, которая реплицируется и эволюционирует - ген. Ни Вселенная, ни Культура не имеют этого. Все замечательные концепции, такие как мем [Daw2005::189-201] или культурген [Wil2006::238-274], не выходят за рамки удобного термина, названия. Они не ссылаются ни на какую значимую, самодостаточную сущность. В отличие от генов, эти концепции не добавляют к нашему пониманию культурной эволюции; они не дают объяснений вещам, которые мы объясняем без них. Гены - задолго до открытия структуры ДНК - объясняли, в частности, распределение наследственных признаков. Состав генов, структура и механизм репликации общи для всех форм жизни. Что общего у мемов в живописи, выращивании и курении табака, рассказывании анекдотов или охоте на броненосцев, изготовлении стульев и вере в Бога? Шаблоны проектирования, популярные в инженерии и архитектуре [Ale1977], могут быть хорошей отправной точкой для поиска. ["Что такое мем или культурген?" также в списке книг (-:), но эта даже не в первой двадцатке.]
Теперь вернемся к эволюции языка. Эволюция определенно имеет место, и язык имеет какие-то "гены" (или ДНК). Представьте себе все лексемы языка, классифицированные и представленные морфемами, все фонологические и альтернационные правила, все комбинаторные (грамматические) правила, категоризированные и записанные в одну строку в BNF или любой нотации.... Это языковая ДНК. Элементы речи - это "белки", из которых мы строим организмы - тексты, рассказы, монологи, диалоги, трансляции и т.д. Существуют также правила и процессы, обеспечивающие 1) постоянство - медленное изменение лексикона и грамматики, 2) плодовитость - копирование языковых генов экспоненциально (как число человеческих мозгов): дети учатся рано и быстро (менее успешно взрослые), 3) высокоточное копирование - когда мы учим язык, мы вынуждены точно копировать лексикон и правила, потому что иначе нас никто не поймет. Эти атрибуты успешного репликатора [Daw2005::18, 193-195] наряду с изменчивостью языковых генов (мутацией) присутствуют в языке.
Важно отметить "высокоточное копирование" - если бы оно было "абсолютно точным копированием", у нас не было бы эволюции. Эволюция существует благодаря балансу постоянства и изменения: при меньшей точности нет постоянства, при большей точности - нет гибкости, нет попыток чего-то нового и потенциально лучшего.
Все это требует тщательной концептуализации и исследований, чтобы стать полезной теорией для изучения речевых организмов. Пока ни одна концепция эволюции языка не обладает объяснительной силой лингвистики.
Лингвистический "геном" - лангном - можно построить аналогично предложенному в [Հայ2022] для восточноармянского языка. Он будет содержать языковые ДНК для всех существующих в настоящее время и ранее диалектов. Мы строим изолированные и частичные лингвистические "протеомы" в корпусах. Но они не изолируют лингвистические "белки" - Контекстные Деревья - как предложено в [Հայ2022] .
## Языковые исследования и лингвистика
Лингвистика является частью языковых наук, которые включают:
1. Теоретическая лингвистика, которая занимается:
a. Общей лингвистикой: типологией, парадигматическими системами, грамматикой и метаязыком описания грамматики (неточно названным Универсальной Грамматикой), универсальными детерминистическими языковыми моделями и т.д.
b. Грамматикой конкретного языка, диалекта; орфографией; детерминистическими специальными языковыми моделями.
c. Сравнительной лингвистикой; исторической лингвистикой; эволюцией и классификацией языков,... сравнением детерминистических специальных языковых моделей.
d. Фонологией
2. Компьютерная лингвистика
a. Дизайн корпусов; стемминг, тегирование, лемматизация
b. Методология статистических исследований
c. Статистическое моделирование языка
3. Экспериментальная лингвистика
a. Лексикография.
b. Этимология.
c. Обогащение корпусов: выборка устной и письменной речи.
4. Филология
a. Формы повествования; история и эволюция форм повествования.
b. Обогащение корпусов: выборка литературы и фольклора.
c. Прагматика - это может быть хорошо классифицировано как часть теоретической лингвистики или, скорее, отдельная часть на этом уровне. Другая возможность - часть семантики (или синоним семантики)
5. Психолингвистика
a. Усвоение языка; обучение
b. Языковая компетенция (генерация и понимание речи)
6. Нейролингвистика
a. Активность мозга при генерации и понимании речи
b. Лингвистические нарушения
Существуют хорошо установленные теории: теория формальных грамматик [Гро1971], [Cho1959], [Cho1967], чтобы упомянуть лишь некоторые, теория компиляции [Aho1972], теория смысла Фреге, Пирса, Рассела, Тарского и др. Чего не хватает в теоретической лингвистике, так это теории референции, которая будет учитывать несколько уровней контекста [Հայ2022::161] для уточнения смысла и вычисления референции.
## Заключение
"Чтобы говорить ясно и точно, нам нужен точный и хорошо определенный язык" [Aho1972::1]. Это значительно улучшит взаимопонимание и устранит недоразумения в научных дебатах. Лингвистическое сообщество может никогда не принять единую интерпретацию сознания и мысли, языка и речи, производителя и продукта. Если мы признаем эту ситуацию и проясним наши позиции через определения, мы, по крайней мере, получим шанс быть понятыми. Принятие - это совершенно другой и крайне сложный вопрос.
Небрежность в определениях и выражении мыслей в лингвистическом (на самом деле любом) содержании выглядит как основная причина недопонимания. Неспособность выразить и нежелание понять выражение вызывает эмоциональные взрывы,... которые заканчиваются классификацией определенных теорий как "общепринятой нелепости" [Pin1994::47] или переходом к аргументу ad hominem.
Мини-обзор [Cry2010]. Странно, что в [Cry2010] нет упоминания о том, что для подтверждения теории лингвистической относительности использовались недействительные доказательства/факты. [Стоит исследовать, серьезно ли относились к лингвистической относительности в континентальной Европе. Похоже, что такого рода теории (другой пример - теория разумного замысла) характерны для Северной Америки.]
Основные теоретические достижения Панини, стоиков и Пор-Рояля упоминаются вскользь, мимоходом. Нет упоминания о Фреге, который объяснил (или напомнил) о двух аспектах значения.
Если мы примем положения этого текста, то 1) мышление не осуществляется на каком-либо конкретном языке, 2) язык - это набор инструментов для кодирования мыслей в речь и декодирования речи в мысли.
Теоретическая лингвистика - это точная наука, очень похожая на физику. Вот почему лингвистические теории являются предварительными, временными.
Citations:
References
[Aho1972] A.V. Aho, J.D. Ullman. The Theory of Parsing, Translation, and Compiling. V. I: Parsing. Prentice-Hall, Inc., Englewood Cliffs, N.J. 1972.
[Ale1977] C. Alexander, S. Ishikawa, M. Silverstein, M. Jacobson, I. Fiksdahl-King, S. Angel. A Pattern Language. Oxford University Press, 1977.
[Bea1959] R.L.Beals, H.Hoijer. Introduction to Anthropology. The MacMillan Company. NY. 1959.
[Bob2006] S. Bobzien. Ancient Logic. In Stanford Encyclopedia of Philosophy (online). 2006. [Cha2018] W. Chafe. Thought-Based Linguistics; How Languages Turn Thoughts into Sounds. Cambridge University Press, 2018
[Cho1959] N. Chomsky. On certain formal properties of grammars. Information and Control. 2 (2): 137–167, 1959
[Cho1967] N. Chomsky. The formal nature of language, Appendix A in [Len1967].
[Cry2010] D. Crystal. The Cambridge Encyclopedia of the English language, 3rd edition. Cambridge University Press, 2010.
[Cor2011] M.C. Corballis. The Recursive Mind. Princeton Univ. Press, Princeton and Oxford. 2011.
[Daw2005] R. Dawkins. The Selfish Gene (30th anniversary ed.). Oxford University Press. 2005.
[Dev1997] K.Devlin. Goodbye, Descartes. Wiley, John & Sons. NY, 1997.
[Gar2001] Gardner, M. The Colossal Book of Mathematics. W.W. Norton & Company, NY,. 2001.
[Jac1992] R.S.S. Jackendoff. Semantic Structures (Current Studies in Linguistics. MIT Press. Cambridge, 1992
[Fre1892] Über Sinn und Bedeutung (On Sense and Reference), Zeitschrift für Philosophie und philosophische Kritik, vol. 100, 1892
[Hof1979] D.R. Hofstadter. Gödel, Escher, Bach: An Eternal Golden Braid. (20th anniversary edition) Basic Books, 1999.
[Len1967] E. H. Lenneberg. Biological foundations of language. Wiley, NY, 1967.
[Lav2009] J. Laver. The Phonetic Description of Voice Quality (Cambridge Studies in Linguistics, Series Number 31), Digital printing, Cambridge University Press, L. 1980
[Owe1988] R.E. Owens, Jr. Language Development. An introduction. 2-nd ed. Merrill Publishing Company. Columbus. 1988
[Pin1994] S. Pinker. The Language Instinct. William Morrow & Co (HarperCollins Publishing) London, 1994.
[Pri2012] J.J. Printz. Beyond Human Nature. How Culture and Experience Shape the Human Mind. W. W. Norton & Company. NY. 2012
[Ran1996] Random House Compact Unabridged Dictionary. Special 2-nd ed. Random House. NY. 1996
[Rei1947] H. Reichenbach. Elements of symbolic logic. Macmillan. L. 1947.
[Sha1949] C. E.Shannon, W. Weaver. The Mathematical Theory of Communication. University of Illinois Press. 1964
[Who1956] B.L. Whorf. Language, Thought, and Reality: Selected Writings of Benjamin Lee Whorf (edited by J. B. Carroll). Cambridge, MIT Press 1956.
[Wil2006] E.O. Wilson. Nature Revealed. Selected Writings 1949-2006 (A summary of the Genes, Mind and Culture (by C.J.Lumsden and E.O. Wilson. Cambridge, Mass., Harvard University Press, 1981) with critic is in section Précis Genes, Mind and Culture). John Hopkins University Press, Baltimore. 2006.
[Гро1971] М. Гросс, А. Лантен. Теория формальных грамматик. Мир. М. 1971.
[Հայ2022] Ա. Հայրապետյան. Բնական խոսքի ընդհանրական ներկայացման մի տարբերակի մասին. Agoulis, Concord, 2022
[Ջահ1974] Գ. Ջահուկյան. Ժամանակակից հայերենի տեսության հիմունքները. ՀՍՍՀ գիտությունների ակադեմիայի հրատարակչություն, Ե., 1974:
Comments