О дискурсивной транскрипции

Для графического представления устных данных в проекте используются три вида дискурсивной транскрипции: полная, упрощенная и минимальная. Под дискурсивной транскрипцией понимается такая запись устной речи, при которой, в отличие от фонетической или фонологической транскрипции, основной целью становится не учет звукового состава отдельных словоформ, а фиксация явлений, связанных с организацией локальной дискурсивной структуры. По этой причине, в частности, во всех трех вариантах транскрипции слова за редкими исключениями записываются в стандартной орфографической форме. Все явления, фиксируемые в минимальной транскрипции, также отмечаются и в упрощенной версии, в которой, однако, добавлены некоторые дополнительные компоненты. Полная версия транскрипции включает в себя всю информацию, содержащуюся в упрощенной версии, а также ряд других обозначений, не используемых в упрощенной и минимальной транскрипциях.

Далее будут даны краткие описания трех типов транскрипции, а также приведен список всех используемых в проекте транскрипционных обозначений.

Минимальная транскрипция

Главная задача при выполнении дискурсивной транскрипции — определить, какие именно явления должны в ней отражаться. На наш взгляд, существует два центральных феномена, без отображения которых дискурсивная транскрипция не может считаться таковой. Во-первых, это сегментация речевого потока на минимальные кванты — мы называем их элементарными дискурсивными единицами (ЭДЕ). Во-вторых, это роли, которые ЭДЕ выполняют при построении локальной дискурсивной структуры, объединяясь в более крупные комплексы. Именно эти два явления и отмечаются в минимальной транскрипции. Ниже представлен скриншот минимальной транскрипции начального отрывка одного из рассказов корпуса.

Каждая ЭДЕ выделена в отдельную пронумерованную строку (в крайнем левом столбце содержится информация о времени начала произнесения ЭДЕ относительно абсолютного начала звукового файла). Строки 1, 3 и 4 представляют собой простые клаузы, и это самый частый тип ЭДЕ с точки зрения синтаксического наполнения. Возможны, однако, и другие случаи. Строка 5 целиком состоит из дискурсивного маркера вот; в строке 2 налицо случай множественной коррекции: испытывая трудности в процессе порождения речи, говорящая, бракуя неудачный фрагмент, сначала стремится «спасти» начатую ЭДЕ (в транскрипте это отмечается при помощи знака ), а затем отказывается от этого намерения (знак == в конце строки) и начинает свой дискурсивный шаг заново. Остальные четыре строки являются успешными, то есть завершенными в соответствии с планом говорящей. Их роль в локальной структуре обозначена в транскрипте при помощи конечных пунктуационных знаков: точка на конце ЭДЕ 4 означает, что эта строка демонстрирует лексико-грамматические и просодические симптомы завершения иллокуции сообщения; при помощи запятой в трех других ЭДЕ кодируется немаркированное значение дискурсивной незавершенности. Существуют и другие типы фазово-иллокутивных значений, отображаемых при помощи конечных пунктуационных знаков; см. книгу «Рассказы о сновидениях: Корпусное исследование устного русского дискурса» (М.: ЯСК, 2009) под редакцией А. А. Кибрика и В. И. Подлесской, а также расположенную внизу данной страницы таблицу транскрипционных обозначений.

Упрощенная транскрипция

Помимо всей информации, содержащейся в минимальной транскрипции, в упрощенной версии содержатся также указания на важнейшие просодические характеристики речевого потока, непосредственным образом влияющие на его сегментацию и определяющие тип иллокутивно-фазового значения. Ниже приведен скриншот упрощенной транскрипции того же отрывка, минимальная транскрипция которого рассматривалась ранее.

В строках 2, 3 и 5 приведенного примера наличествуют абсолютные паузы — перерывы в вокализации между произносимыми словами. Абсолютные паузы обозначаются при помощи поднятых точек, количество которых зависит от продолжительности паузы: паузы от 0.1 до 0.4 секунды оформляются двумя точками, от 0.5 до 0.9 секунды — тремя, начиная с 1.0 секунды — четырьмя. Кроме того, в упрощенной транскрипции при помощи иконических значков (слэшей) отмечаются движения тона в словах, несущих на себе главный акцент в ЭДЕ (ударные гласные этих слов дополнительно подчеркнуты). В частности, именно наличие ощутимого нисходящего акцента в слове вот оправдывает его выделение в отдельную ЭДЕ (строка 5). В целом, главные акценты (мы их также называем «несущими») выполняют три важные функции: выступают в качестве интонационного центра, поддерживающего целостность ЭДЕ; выделяют наиболее значимую для данного дискурсивного шага порцию информации; посредством связанного с акцентом направления движения тона определяют роль ЭДЕ в иллокутивной цепочке. Так, восходящее движение тона в строке 1 связано со значением иллокутивной незавершенности, кодируемым при помощи запятой; нисходящий акцент в строке 4 коррелирует со значением завершения иллокуции сообщения (точка). Однако соответствие между пунктуационными знаками и направлением движения тона не полное: в строках 3 и 5 наблюдается нисходящий тон в несущем акценте, но падение происходит в недостаточно глубокий уровень и поэтому на конце этих ЭДЕ стоят запятые.

Полная транскрипция

В полной транскрипции отображаются все явления, отмечаемые в минимальной и упрощенной нотациях, а также некоторые другие феномены, существенные при анализе локальной дискурсивной структуры. Ниже приведен скриншот уже рассмотренного выше отрывка транскрипции — на этот раз в полной нотации.

В полной транскрипции продолжительность пауз, определяющая количество точек, используемых для их обозначения, указывается в явном виде в скобках. Кроме того, в транскрипте отмечаются направления тона не только в несущих (главных) акцентах ЭДЕ, но и в прочих словах, произносимых с акцентным выделением — см. знаки перед словами ночью и портфель в строке 3 и словом очень в строке 4. Такие акценты мы называем вторичными, ударные гласные соответствующих слов, в отличие от ударных гласных слов с несущим акцентом, не выделяются подчеркиванием.

В полной транскрипции также отмечаются такие явления, как губные смычки (литера «w» в конце слова я в строке 2), придыхание, ускоренное произнесение, сниженный регистр и т. д. Список всех обозначений можно найти в книге «Рассказы о сновидениях: Корпусное исследование устного русского дискурса» (М.: ЯСК, 2009) под редакцией А. А. Кибрика и В. И. Подлесской, а также в таблице, приведенной в следующем разделе настоящей страницы.

Список транскрипционных обозначений

Ниже представлен список всех обозначений, используемых в полной версии транскрипции. Для каждого обозначения дается описание связанного с ним явления, а также указывается, сохранено ли оно в упрощенной и минимальной нотациях.

ОбозначениеЯвлениеОтмечается ли в упрощенной транскрипцииОтмечается ли в минимальной транскрипции
Деление на строки Деление на элементарные дискурсивные единицы (ЭДЕ)дада
Выделение строки синим цветомРеплика не принадлежит основному рассказчику да да
[   ] Наложение реплик разных участников записи да да
#СВИСТ#
#джжжи#
Идеофоны да да
∙∙∙
ээ
’’’’
мм
Абсолютные (∙∙) и заполненные паузы: число символов зависит от длительности паузыда нет
{ЦОКАНЬЕ}
{ЧМОКАНЬЕ}
Неречевые звуки говорящего да нет
(0.1), (0.5), (1.0) — после обозначения паузы или неречевого звука говорящего Точная длительность паузы или неречевого звука говорящегонет нет
/
\

/\ и т. д.
(перед словом)
Движения тона в акцентированных словах только для несущих акцентов нет
Подчеркивание ударной гласной акцентированного словаНесущий (главный) акцент ЭДЕданет
Значимое повышение тона после нисходящего несущего акцента нефинальной ЭДЕнет нет
Заглавная бука в начале строки Начало нового предложения дада
. Завершение иллокуции сообщения да да
? Завершение иллокуции вопроса да да
¡ Завершение иллокуции директива да да
@ Завершение иллокуции обращения да да
! Восклицательность да да
... Значение неполноты информации, совмещенное с завершением иллокуциида да
, Стандартная незавершенность иллокуции да да
,,, Значение неполноты информации, совмещенное с иллокутивной незавершенностьюда да
: Незавершенность, восполняемая последующим контекстомда да
Нуль знака на конце строки Слитное произнесение двух ЭДЕ (с одним несущим)да да
«   » Начало и конец прямой цитации да да
Начало и конец сплита (разрыва ЭДЕ) да да
(   ) Начало и конец парентезы (вставки предложения внутрь другого предложения)да да
(* «Односторонняя парентеза» (начатая, но не завершенная вставка предложения внутрь другого предложения)да да
= Обрыв слова да да
Слабый фальстарт (точка прерывания при самоисправлении внутри ЭДЕ)да да
== Сильный фальстарт (точка прерывания при самоисправлении на границе ЭДЕ)да да
~ Обрыв ЭДЕ, которая расценивается говорящим как уместная и не подлежащая исправлениюда да
Гортанная смычка да нет
w Губная смычка нет нет
h Придыхание нет нет
ə Гласный призвук в начале или конце слованет нет
а-а
с-с
й-я
я-а
Удлиненная реализация фонем да нет
Полужирный шрифт Эмфатическое выделение да нет
Выделение серым цветом Редуцированное произнесение да нет
Курсив Ускоренный темп нет нет
Уменьшенный кегль Сниженный тональный регистр нет нет
"    " Названия фильмов, машин и т. д. да да
<   > Предположительная транскрипция неразборчивого фрагментада да
< | > Варианты транскрипции неразборчивого фрагмента да да
<НРЗБ2> Неразборчивый фрагмент с указанием числа слоговда да
>  < Разборчивый, но неидентифицируемый фрагмент да да
>> Технический обрыв в начале рассказа да да
<< Технический обрыв в конце рассказа да да
Написать письмо администратору