О дискурсивной транскрипции
Для графического представления устных данных в проекте используются три вида дискурсивной транскрипции: полная, упрощенная и минимальная. Под дискурсивной транскрипцией понимается такая запись устной речи, при которой, в отличие от фонетической или фонологической транскрипции, основной целью становится не учет звукового состава отдельных словоформ, а фиксация явлений, связанных с организацией локальной дискурсивной структуры. По этой причине, в частности, во всех трех вариантах транскрипции слова за редкими исключениями записываются в стандартной орфографической форме. Все явления, фиксируемые в минимальной транскрипции, также отмечаются и в упрощенной версии, в которой, однако, добавлены некоторые дополнительные компоненты. Полная версия транскрипции включает в себя всю информацию, содержащуюся в упрощенной версии, а также ряд других обозначений, не используемых в упрощенной и минимальной транскрипциях.
Далее будут даны краткие описания трех типов транскрипции, а также приведен список всех используемых в проекте транскрипционных обозначений.
Минимальная транскрипция
Главная задача при выполнении дискурсивной транскрипции — определить, какие именно явления должны в ней отражаться. На наш взгляд, существует два центральных феномена, без отображения которых дискурсивная транскрипция не может считаться таковой. Во-первых, это сегментация речевого потока на минимальные кванты — мы называем их элементарными дискурсивными единицами (ЭДЕ). Во-вторых, это роли, которые ЭДЕ выполняют при построении локальной дискурсивной структуры, объединяясь в более крупные комплексы. Именно эти два явления и отмечаются в минимальной транскрипции. Ниже представлен скриншот минимальной транскрипции начального отрывка одного из рассказов корпуса.
Каждая ЭДЕ выделена в отдельную пронумерованную строку (в крайнем левом столбце содержится информация о времени начала произнесения ЭДЕ относительно абсолютного начала звукового файла). Строки 1, 3 и 4 представляют собой простые клаузы, и это самый частый тип ЭДЕ с точки зрения синтаксического наполнения. Возможны, однако, и другие случаи. Строка 5 целиком состоит из дискурсивного маркера вот; в строке 2 налицо случай множественной коррекции: испытывая трудности в процессе порождения речи, говорящая, бракуя неудачный фрагмент, сначала стремится «спасти» начатую ЭДЕ (в транскрипте это отмечается при помощи знака ‖), а затем отказывается от этого намерения (знак == в конце строки) и начинает свой дискурсивный шаг заново. Остальные четыре строки являются успешными, то есть завершенными в соответствии с планом говорящей. Их роль в локальной структуре обозначена в транскрипте при помощи конечных пунктуационных знаков: точка на конце ЭДЕ 4 означает, что эта строка демонстрирует лексико-грамматические и просодические симптомы завершения иллокуции сообщения; при помощи запятой в трех других ЭДЕ кодируется немаркированное значение дискурсивной незавершенности. Существуют и другие типы фазово-иллокутивных значений, отображаемых при помощи конечных пунктуационных знаков; см. книгу «Рассказы о сновидениях: Корпусное исследование устного русского дискурса» (М.: ЯСК, 2009) под редакцией А. А. Кибрика и В. И. Подлесской, а также расположенную внизу данной страницы таблицу транскрипционных обозначений.
Упрощенная транскрипция
Помимо всей информации, содержащейся в минимальной транскрипции, в упрощенной версии содержатся также указания на важнейшие просодические характеристики речевого потока, непосредственным образом влияющие на его сегментацию и определяющие тип иллокутивно-фазового значения. Ниже приведен скриншот упрощенной транскрипции того же отрывка, минимальная транскрипция которого рассматривалась ранее.
В строках 2, 3 и 5 приведенного примера наличествуют абсолютные паузы — перерывы в вокализации между произносимыми словами. Абсолютные паузы обозначаются при помощи поднятых точек, количество которых зависит от продолжительности паузы: паузы от 0.1 до 0.4 секунды оформляются двумя точками, от 0.5 до 0.9 секунды — тремя, начиная с 1.0 секунды — четырьмя. Кроме того, в упрощенной транскрипции при помощи иконических значков (слэшей) отмечаются движения тона в словах, несущих на себе главный акцент в ЭДЕ (ударные гласные этих слов дополнительно подчеркнуты). В частности, именно наличие ощутимого нисходящего акцента в слове вот оправдывает его выделение в отдельную ЭДЕ (строка 5). В целом, главные акценты (мы их также называем «несущими») выполняют три важные функции: выступают в качестве интонационного центра, поддерживающего целостность ЭДЕ; выделяют наиболее значимую для данного дискурсивного шага порцию информации; посредством связанного с акцентом направления движения тона определяют роль ЭДЕ в иллокутивной цепочке. Так, восходящее движение тона в строке 1 связано со значением иллокутивной незавершенности, кодируемым при помощи запятой; нисходящий акцент в строке 4 коррелирует со значением завершения иллокуции сообщения (точка). Однако соответствие между пунктуационными знаками и направлением движения тона не полное: в строках 3 и 5 наблюдается нисходящий тон в несущем акценте, но падение происходит в недостаточно глубокий уровень и поэтому на конце этих ЭДЕ стоят запятые.
Полная транскрипция
В полной транскрипции отображаются все явления, отмечаемые в минимальной и упрощенной нотациях, а также некоторые другие феномены, существенные при анализе локальной дискурсивной структуры. Ниже приведен скриншот уже рассмотренного выше отрывка транскрипции — на этот раз в полной нотации.
В полной транскрипции продолжительность пауз, определяющая количество точек, используемых для их обозначения, указывается в явном виде в скобках. Кроме того, в транскрипте отмечаются направления тона не только в несущих (главных) акцентах ЭДЕ, но и в прочих словах, произносимых с акцентным выделением — см. знаки перед словами ночью и портфель в строке 3 и словом очень в строке 4. Такие акценты мы называем вторичными, ударные гласные соответствующих слов, в отличие от ударных гласных слов с несущим акцентом, не выделяются подчеркиванием.
В полной транскрипции также отмечаются такие явления, как губные смычки (литера «w» в конце слова я в строке 2), придыхание, ускоренное произнесение, сниженный регистр и т. д. Список всех обозначений можно найти в книге «Рассказы о сновидениях: Корпусное исследование устного русского дискурса» (М.: ЯСК, 2009) под редакцией А. А. Кибрика и В. И. Подлесской, а также в таблице, приведенной в следующем разделе настоящей страницы.
Список транскрипционных обозначений
Ниже представлен список всех обозначений, используемых в полной версии транскрипции. Для каждого обозначения дается описание связанного с ним явления, а также указывается, сохранено ли оно в упрощенной и минимальной нотациях.
Обозначение | Явление | Отмечается ли в упрощенной транскрипции | Отмечается ли в минимальной транскрипции |
---|---|---|---|
Деление на строки | Деление на элементарные дискурсивные единицы (ЭДЕ) | да | да |
Выделение строки синим цветом | Реплика не принадлежит основному рассказчику | да | да |
[ ] | Наложение реплик разных участников записи | да | да |
#СВИСТ# #джжжи# | Идеофоны | да | да |
∙∙∙ ээ ’’’’ мм | Абсолютные (∙∙) и заполненные паузы: число символов зависит от длительности паузы | да | нет |
{ЦОКАНЬЕ} {ЧМОКАНЬЕ} | Неречевые звуки говорящего | да | нет |
(0.1), (0.5), (1.0) — после обозначения паузы или неречевого звука говорящего | Точная длительность паузы или неречевого звука говорящего | нет | нет |
/ \ – /\ и т. д. (перед словом) | Движения тона в акцентированных словах | только для несущих акцентов | нет |
Подчеркивание ударной гласной акцентированного слова | Несущий (главный) акцент ЭДЕ | да | нет |
↑ | Значимое повышение тона после нисходящего несущего акцента нефинальной ЭДЕ | нет | нет |
Заглавная бука в начале строки | Начало нового предложения | да | да |
. | Завершение иллокуции сообщения | да | да |
? | Завершение иллокуции вопроса | да | да |
¡ | Завершение иллокуции директива | да | да |
@ | Завершение иллокуции обращения | да | да |
! | Восклицательность | да | да |
... | Значение неполноты информации, совмещенное с завершением иллокуции | да | да |
, | Стандартная незавершенность иллокуции | да | да |
,,, | Значение неполноты информации, совмещенное с иллокутивной незавершенностью | да | да |
: | Незавершенность, восполняемая последующим контекстом | да | да |
Нуль знака на конце строки | Слитное произнесение двух ЭДЕ (с одним несущим) | да | да |
« » | Начало и конец прямой цитации | да | да |
— | Начало и конец сплита (разрыва ЭДЕ) | да | да |
( ) | Начало и конец парентезы (вставки предложения внутрь другого предложения) | да | да |
(* | «Односторонняя парентеза» (начатая, но не завершенная вставка предложения внутрь другого предложения) | да | да |
= | Обрыв слова | да | да |
‖ | Слабый фальстарт (точка прерывания при самоисправлении внутри ЭДЕ) | да | да |
== | Сильный фальстарт (точка прерывания при самоисправлении на границе ЭДЕ) | да | да |
~ | Обрыв ЭДЕ, которая расценивается говорящим как уместная и не подлежащая исправлению | да | да |
’ | Гортанная смычка | да | нет |
w | Губная смычка | нет | нет |
h | Придыхание | нет | нет |
ə | Гласный призвук в начале или конце слова | нет | нет |
а-а с-с й-я я-а | Удлиненная реализация фонем | да | нет |
Полужирный шрифт | Эмфатическое выделение | да | нет |
Выделение серым цветом | Редуцированное произнесение | да | нет |
Курсив | Ускоренный темп | нет | нет |
Уменьшенный кегль | Сниженный тональный регистр | нет | нет |
" " | Названия фильмов, машин и т. д. | да | да |
< > | Предположительная транскрипция неразборчивого фрагмента | да | да |
< | > | Варианты транскрипции неразборчивого фрагмента | да | да |
<НРЗБ2> | Неразборчивый фрагмент с указанием числа слогов | да | да |
> < | Разборчивый, но неидентифицируемый фрагмент | да | да |
>> | Технический обрыв в начале рассказа | да | да |
<< | Технический обрыв в конце рассказа | да | да |