If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.
You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

Russian

Page history last edited by Anne Tamm 14 years, 5 months ago

Проект типологической базы данных уральских языков

Изначально уралистика предполагала генеалогическое сравнение языков, в принципе она сохраняет этот характер и в наши дни. Это понятно, поскольку исходная задача уралистики состояла в открытии этих языков для науки, в доказательстве их родства, в конструировании их родословного древа, реконструкции их языка-основы, одним словом, уралистика относилась к сравнительно-историческому языкознанию. В соответствии с этим остальные два компаративных подхода, ареальный и типологический, в прошлом не отделялись от генеалогического. Однако они не пользовались таким же вниманием, хотя нельзя отрицать, что в этом отношении в последние десятилетия произошли некоторые изменения в лучшую сторону. Задача уралистики, как языковедческой науки, состоит, в конечном счете, в научном рассмотрении уральских языков и их презентации в ряду языков мира. Однако выполнять эту задачу сегодня уже невозможно, если не выходить за рамки уральских языков. Тот, кто желает приобрести углубленные знания в области уралистики, сегодня должен выйти за рамки внутреннего исследования этой языковой семьи, должен смотреть дальше во времени и пространстве. А этот желаемый обширный горизонт может быть достигнут именно путем ареального и типологического исследования уральских языков. Настоящий проект обращен на их типологическую разработку.

Типология уральских языков решает, как правило, две задачи. Одна из них – это типологическое рассмотрение этих языков для определения их места среди языков мира. Вторая – состоит в том, чтобы типологически представить уральские языки для общей лингвистической типологии. Другими словами, приблизить друг к другу общую типологию языков, как таковую, и уралистику. Сегодня мы сталкиваемся с очевидными недостатками в обеих отраслях. При описании уральских языков, а также в объяснении их диахронных связей, часто недостает учета типологических знаний, касающихся других языков мира; а что касается типологических характеристик уральских языков в анализах языков мира, написанных не-уралистами, то в них специалисты отдельных уральских языков часто находят странные, поверхностные или же вовсе неправильные высказывания.

Представляется логичным преодоление этих недостатков путем обоюдного сближения этих дисциплин. Тем не менее, мне кажется, что решение этой задачи скорее приходиться на долю уралистов, ориентирующихся на типологические вопросы (ввиду их непосредственной заинтересованности), чем на типологов, ориентирующихся на уралистику.

Для типологического описания уральской языковой семьи предлагается ряд возможностей. Можно было бы, к примеру, поставить цель составления полного типологического описания каждого уральского языка, на основе совсем нового анализа, конечно, следуя какой-то заранее определенной единой концепции. Такое представление не является выдумкой, такие попытки имели место. Стоит только привести самый известный пример: Бернард Комри и Норвал Смит в 1977 году составили подробный вопросник, ответив на вопросы которого, мы могли бы прийти к объемной характеристике отдельных языков где-то на полпути между дескриптивной грамматикой и типологической характеристикой. (Заметим, что такие работы были выполнены по венгерскому и финскому языкам. Это интересные исследования, но в силу их упомянутой «жанровой неопределенности» они могут быть использованы скорее только как пособия для типологической характеристики.)

Задача могла быть решена и другим путем, если бы в свое время проект Майтинской и Феенкера, который предполагал создание серии монографий единого описания уральских диалектов, был претворен в жизнь. Мы имеем ввиду, что в идеальном – и как раз поэтому никогда не осуществимом – случае, работа типолога начинается там, где работа дескриптивиста заканчивается. Если бы мы располагали этим материалом, типологическая «выписка» из него была бы осуществима сравнительно легко. Впрочем, в виде известного типа справочников, такие описания с единой структурой выходили в свет, а именно в монографиях и сериях советской, а потом Российской Академии Наук (таких как «Языки народов СССР» и «Языки мира»). Несмотря на все это, мы так и не располагаем достаточно подробным и по своей структуре единым образом организованным описанием уральских языков, из которого мог бы исходить типологический анализ.

Решение третьего типа, которое может быть поставлено на повестку дня в уралистике – это проект создания типологической базы данных уральских языков. Я выступил с инициативой создания такого проекта, и сегодня можно сказать, что для осуществления этого проекта уже сформировалась высокопрофессиональная международная группа.

Идея создания типологической базы данных возникла у меня в начале этого десятилетия, была обдумана, и в 2005 году она была предложена уралистам на десятом Международном конгрессе финно-угроведов в Йошкар-Оле. Собралось около тридцати коллег, они выслушали проект с интересом, некоторые даже с энтузиазмом, многие записались в список возможных участников. Большое значение имело создание собственного вебсайта проекта (http://www.univie.ac.at/urtypol/index.html, http://uralictypology.pbworks.com/), который продолжает работать и ныне, по моим предположениям, в будущем его роль будет расти все больше.

Вначале мне показалось, что базу данных можно создать за пять лет. Однако это представление оказалось утопическим. Несмотря на то, что среди замечаний, приходящих на вебсайт, было много положительных идей, работа как таковая в период после конгресса не началась. И стало ясно, что мы нуждаемся в новом импульсе. Именно поэтому была выдвинута идея организации так называемой стартовой конференции, которая состоялась в Вене осенью 2008 года. Но прежде чем рассказать об этом мероприятии, я хочу кратко представить суть идеи самой типологической базы данных уральских языков, как это было изложено мной во вступительном докладе на конференции (полный текст на английском языке см. на вышеупомянутом вебсайте).

Типологическую базу данных при первом знакомстве можно представить как имагинарную онлайн таблицу, то есть множество данных, размещенных в столбцах и строках. Столбцы таблицы – это уральские (финно-угорские и самодийские) языки, как например, венгерский, марийский, нганасанский и т.д. Строки таблицы представляют типологические параметры, как например, основной порядок слов, притяжательная конструкция, условные придаточные предложения и т.д. Количество столбцов – минимум 18, столько, как правило, насчитывается уральских языков. Конечно, зависит только от нашего решения разделить некоторые языки на несколько диалектов, в силу чего число столбцов может несколько увеличиться. Количество же строк неограничено; если мы придем к полному составу типологических параметров языков, их может насчитываться несколько сотен.

Таким образом, таблица состоит из клеток, каждая из которых находится в определенной точке пересечения строк и столбцов, как в любой таблице. Каждая определенная клетка содержит значение типологического параметра (критерия) соответствующей строки. Если, например, 48-ая строка представляет тип синтагм с числительными во всех языках, а 7-ой столбец принадлежит эрзя-мордовскому языку, тогда клетка, находящаяся в точке их пересечения, то есть в 48-ой строке 7-го столбца, представляет типологическую характеристику синтагмы с числительными эрзя–мордовского языка. В клетках, находящихся непосредственно слева и справа от нее – то есть в той же строке – можно найти, например, синтагмы с числительными марийского и мокша-мордовского языков, а в клетках непосредственно под и над ней – другие типологические параметры, например, притяжательные или адпозиционные синтагмы, конечно, в том же эрзя-мордовском, ведь в том столбце все относится к данному языку. Можно посмотреть не только одну строку и один столбец таблицы, но сразу и несколько строк и столбцов, если в этом возникает необходимость. В то же время из них можно выделить и любой частный состав. Например, мы можем интересоваться только одной строкой, пусть это будут снова конструкции с числительными, но только в прибалтийско-финских языках. Тогда таблица будет показывать только данные, соответствующие столбцам прибалтийско-финских языков. Таким же образом, мы можем выделить два любых столбца, будь они на любом расстоянии друг от друга в таблице. Например, мы можем сравнить типологические характеристики конструкций с числительным в финском и эрзя-мордовском языке, пропуская все остальные уральские языки. Выделение относится, конечно, и к сокращению анализируемой части столбцов. Мы можем выделить описание всех определительных синтагм данного языка (то есть практически от 5 до 10 клеток из данного столбца), при этом не обращая внимания на все остальные данные столбца. Фильтрация обоих видов может применяться и одновременно, если мы хотим выделить больше одного, но все-таки ограниченное количество типологических параметров, больше чем в одном, но все-таки в ограниченном количестве языков, например, все определительные синтагмы в пермских языках.

Щелкнув на любую из клеток первого, крайнего левого столбца – то есть типологических параметров, – мы можем найти общее описание сути данного типологического параметра и его возможных вариантов в языках мира. Там же можно привести основную литературу по вопросу, а также ссылки на базы данных уже представленных в интернете. Это было бы важно, во-первых, для специалистов-уралистов, имеющих умеренные познания по общим типологическим сведениям, относящимся к данному языковому явлению. Конечно, описание и/или литературу и ссылки можно приобщить и к столбцам верхней строки, то есть к отдельным языкам и диалектам, а это в интересах типологов-не-уралистов, желающих побольше знать о тех языках, из которых они и берут свои примеры или проверяют данные других авторов.

Целесообразно вкратце рассмотреть оформление параметров. В качестве простого примера, приведу параметр Синкретизм падежей у существительных:

Синкретизм падежей у существительных

NoCase

NoSyncCase

SyncCoreCase

SyncNonCoreCase

SyncCase

Комментарий

W 28

В первой строке задано название параметра. Потом следуют возможные значения данного параметра, о которых предполагается, что из них одно и только одно приписывается каждому языку мира, в нашем случае исследуемому финно-угорскому языку (диалекту). Значения заданы в кодировке, основанной на англоязычных определениях. Следует место переключения к комментариям, а затем ссылка на тождественный или близкий параметр в других типологических базах данных, в данном случае на статью 28 WALS-а, Всемирного атласа лингвистических структур, который, вместе с типологической базой данных Драйера и послужил мне источником для подбора состава и, отчасти, оформления параметров.

Щелкнув на гиперссылку Комментарий, мы можем увидеть объяснение к параметру и его значениям. В данном случае оно может быть оформлено примерно следующим образом:

Синкретизм падежей – это их парадигматический синтетизм.^* Синкретизм падежей имен существительных наблюдается, когда в системе склонения одно и то же падежное оформление (напр. тот же самый падежный аффикс) выполняет функцию нескольких падежей. Наличие какого-то падежа (падежной функции) устанавливается в языке, если в последнем имеет место склонение существительных, и данная функция приобретает оформление, отличное от других падежей, хотя бы у некоторых групп существительных или их подклассов.^**

Типы падежного синкретизма:

NoCase: в языке нет склонения существительных.

NoSyncCase: в языке есть склонение существительных, и падежи никогда не синкретичны.

SyncCoreCase: в языке есть склонение существительных, и синкретизм имеет место исключительно у основных^*** падежей.

SyncNonCoreCase: в языке есть склонение существительных, и синкретизм имеет место исключительно у не-основных падежей.^****

SyncCase: в языке есть склонение существительных, и синкретизм имеет место как у основных, так и у не-основных падежей.

*, ** и т.д. – дальнейшие объяснения в сносках, которые здесь не приводятся.

Комментарии, таким образом, выполняют троякую функцию. Во-первых, они объясняют суть самого параметра. Во-вторых, осведомляют о том, как раскрыть данное явление в языке (указывая, если необходимо, на возможные ошибки идентификации явления, напр. предупреждая о подобных, но к данному параметру не относящихся явлениях). В-третьих, объясняются сами значения, т.е. указывается, в каком случае данному языку то или иное значение приписывается.

Перейдя к клеткам самой таблицы, ясно, что в результате их заполнения в них появляется как раз то значение параметра, которое установлено исследователем для данного языка (диалекта), т.е. подходящий код. (Например, при этом параметре для русского языка это было бы SyncCoreCase, ввиду того, что такое совпадение падежных форм в нем имеет место, но наблюдается только у именительного и винительного падежей некоторых типов существительных.) Пояснение значений параметров в кодировке необходимо для того, чтобы наша база данных могла быть связана с уже существующими базами данных (чтобы был обеспечен «свободный переход» в оба направления). В то же время, чтобы она была доступна для широкого круга лингвистов, то есть не только для типологов, ее содержание должно быть представлено и в текстуальной форме, с подробными объяснениями и набором примеров. Такой текст и должен появиться, если щелкнуть на код в клетке. Объяснительный текст представляет «фоновую» информацию к данному параметру конкретного языка (подробное описание характеризуемого явления с анализом отдельных примеров, указание на вопросы, нуждающиеся в дальнейших исследованиях, история заполнения клетки (авторство), важнейшая литература по вопросу). Его можно составить сначала на русском языке, в последствии он будет переведен и на английский. Вообще я представляю нашу базу данных работающей на двух языках (за исключением самой кодировки).

Таблица может находиться в процессе постоянного становления (потому, кстати, она и должна существовать в электронном виде, онлайн). Например, если кто-то предлагает включение нового параметра, то возникает новая строка в таблице в начале с пустыми клетками. Гораздо менее вероятно предложение нового столбца (диалекта), но и это не вызовет проблем, получится только серия новых пустых клеток, ждущих заполнения. Таблица со временем пополняется и количественно и качественно, причем, в то же самое время ею можно бесперебойно пользоваться на основе уже готового материала. Итак, типологическая база данных уральских языков составляется поколениями лингвистов, одновременно они могут и пользоваться ею.

Вот в общих чертах идея, которую я представил на упомянутой венской конференции. Тем, кто интересуется подробностями, предлагаю изучить вышеназванный вебсайт конференции, где можно найти не только имена докладчиков и подробную программу конференции, а также раздаточные материалы и слайды все накапливающегося количества докладов. Ограничимся здесь только напоминанием своеобразной концепции мероприятия. Это была конференция в виде семинара (workshop). Поскольку она представляла собой первый шаг на пути к созданию типологической базы данных уральских языков, участниками конференции были специалисты отчасти общей лингвистической типологии, отчасти уральских языков, причем каждый из них был специально приглашен. Более того, были заранее определены не только докладчики, но и темы их докладов. Специалисты общей типологии (в первую очередь, один из самых известных типологов Метью Драйер) сообщили о принципах и практике существующих типологических баз данных, другие же выступали с докладами общего вводного характера, касающимися типологического описания уральских языков. После этого – и в этом состояла настоящая новизна – были представлены спаренные доклады. Суть названного «жанра» состояла в том, что по определенной тематике было прочитано по два доклада: типолог говорил о том, какими основными знаниями располагает лингвистическая типология в области данного явления вообще в языках мира, а потом уралист дал отчет о том, как и в каких разновидностях наблюдается то же самое явление в уральских языках. Целью такой системы работы было представление, сопоставление и, если возможно, приближение друг к другу двух подходов, типолога и уралиста, ведь разработать типологическую базу данных уральских языков можно будет только лишь гармонизацией, интеграцией обоих подходов.

Как дальше? Суть задачи состоит в том, чтобы в предстоящий период запустить в какой-то мере гармоничные, но друг от друга независимые, предварительные или пробные проекты (по-английской традиции такие называются пилотными), «малые» проекты, которые, по моим представлениям, можно будет включить в общий «большой» проект. Любая такая работа требует сотрудничества типологов и специалистов уральских языков. (Сводя дело к самой сути, типолог спрашивает, а уралист отвечает. Конечно, может получиться, что с точки зрения уралиста вопрос типолога поставлен неправильно, или он не ставит нужный вопрос, в таком случае возникает ситуация обратной связи, когда уралистика обогащает типологический подход, модифицируя и пополняя сами типологические параметры.)

Здесь открывается поле для пилотных проектов. Мы можем выделить базу данных в качестве образца или ее тематическую часть (например, параметры/вопросы, касающиеся морфологии или определенных подобластей синтаксиса), мы можем определить круг исследуемых языков (в крайнем случае, мы даже могли бы ограничиться лишь одним единственным уральским языком для рассмотрения с данной точки зрения). С формальной стороны, такой проект может быть осуществлен в рамках тематических мини-конференций и/или тематических томов, при условии, что в итоге результаты можно будет свести в единый документ (мини-базу данных, таблицу).

Суть моего конкретного предложения – запустить такие пилотные проекты в области разных ветвей уральской языковой семьи. О запуске такого пилотного проекта, направленного на создание типологической базы данных для угорских языков, в принципе мы уже договорились с коллегами из Югорского государственного университета, но такие же начинания были бы желательны и в отношении пермских языков (удмуртского, коми, коми-пермяцкого), волжских языков (обоих мордовских и марийского) а также самодийских языков. Разработку каждой группы целесообразно вести в рамках и под управлением компетентных университетов (их компетентных кафедр) на местах, как напр. Удмуртского государственного университета в Ижевске, Марийского государственного университета в Йошкар-Оле и т.д. или же в соответствующих институтах языкознания. Окончательной целью таких пилотных проектов было бы составление типологической базы данных групп языков, но сферу деятельности в начальный период можно ограничить морфологией или/и определенными областями синтаксиса. Разработка параметров и предоставление их в распоряжение местных исследователей – это задача моя и моих сотрудников. Работа по этой части ведётся уже много месяцев, разработку основного состава параметров предполагается завершить к концу января 2010 года. Не буду скрывать, что при работе над параметрами возникло затруднительное обстоятельство. А именно, при первых попытках перевода комментариев на русский язык мы столкнулись с проблемой расхождения разных лингвистических традиций. Комментарии, составленные с использованием распространенной в мировой спецлитературе типологической терминологии (в том числе употребляемой моими главными источниками, т.е. в WALS-е и Драйером), должны сначала подвергаться своего рода «руссификации», чтобы они могли стать вполне освоенными и употребительными для финно-угроведов, работающих, как правило, на основе традиций российского языкознания. (При этом, конечно, и сами параметры, и их значения должны остаться в оригинальном виде, что здесь подвергается переработке – это сами комментарии, т.е. объяснения к параметрам и их возможным значениям.) Для преодоления этой проблемы нужно найти (к тому же добровольного) специалиста, одинаково сведущего в обеих традициях. Как раз с его помощью и можем достичь того оформления комментариев к параметрам, которое может лечь в основу исследовательской работы на местах.

Надеюсь, что проект создания типологической базы данных для уральской языковой семьи в целом и прилагаемых к нему пилотных проектов, в частности, вызывают интерес со стороны коллег–российских специалистов наших родственных языков. Без их сотрудничества проект неосуществим, а с их помощью мы можем создать такую прочную базу, на основе которой сокровища наших языков обогатят данные всемирной типологии, и вообще общего языкознания, данные о человеческом языке как таковом. При этом наши языки будут изучены и представлены для всех, в том числе и для нас самих, на уровне языкознания начала двадцать первого столетия.

По вопросам, связанным с проектом, прошу обратиться непосредственно ко мне по электронной почте «fhavas@ludens.elte.hu».

Зав. каф. финноугроведения

Будапештского университета ELTE

проф. Ференц ХАВАШ (Ferenc Havas)

fhavas@ludens.elte.hu

Тематика типологической базы данных уральских языков будет затрагиваться в рамках нескольких предстоящих мероприятий, как напр. коференции в Taллине и Ханты-Мансийске осенью 2009 года а также 11 международный конгресс финно-угроведов в Пилишчабе (лето 2010 г.), где ей будет посвящена добрая половина отдельного типологического симпозиума.

Mероприятя:

11th International Congress of Finno-Ugric Studies in Piliscsaba 2010, the typology symposium, August 9-14, 2010, Piliscsaba, Hungary: (fhavas@ludens.elte.hu).
Uralic Typology Days, November 26-27, 2009, Institute of the Estonian Language, Tallinn (anne.tamm@unifi.it)

Russian

Russian

Page Tools

Insert links

Comments (0)

Join this workspace

Navigator

SideBar

Recent Activity