РАССКАЗЫ О СНОВИДЕНИЯХ И ДРУГИЕ КОРПУСА ЗВУЧАЩЕЙ РЕЧИ
Работы по проекту в разное время были поддержаны
Программой фундаментальных исследований Президиума РАН «Корпусная лингвистика»,
«Фондом фундаментальных лингвистических исследований» (грант C-26)
и «Российским гуманитарным научным фондом» (грант 12-04-00258)
ОСНОВНЫЕ УЧАСТНИКИ ПРОЕКТА
А. А. Кибрик ИЯ РАН, МГУ
В. И. Подлесская РГГУ
Н. А. Коротаев РГГУ
А. О. Литвиненко МГУ
М. Л. Палько ИЯ РАН
М. Л. Буряков МГУ
Е. И. Ильина РГГУ
В. Г. Хуршудян INALCO
Э. Г. Варданян РГГУ
К. В. Орлова НГТУ
О ПРОЕКТЕ

Проект «Рассказы о сновидениях и другие корпуса звучащей речи» стал возможным благодаря сотрудничеству исследователей из Института языкознания РАН, Российского государственного гуманитарного университета, Московского государственного университета и Новосибирского государственного технического университета. В основе проекта — разрабатывавшаяся в течение нескольких лет концепция описания и дискурсивного аннотирования данных живой устной речи. Ее практическим воплощением стала система дискурсивной транскрипции — графической записи звукового сигнала, призванной в последовательной и наглядной форме отразить наиболее значимые дискурсивные феномены, сопутствующие порождению спонтанной устной речи и во многом определяющие форму языковых выражений. Подробнее об используемых в проекте транскрипционных обозначениях, а также от трех видах транскрипции, различающихся по степени подробности, можно прочитать в разделе «Виды транскрипции».

Никакая, даже самая тщательная, транскрипция не способна заменить звучащий текст, передать все его богатство. Поэтому мы полагаем необходимым сопровождать графическую нотацию аудиосигналом. Мы также уверены, что для полноценного понимания природы устной речи недостаточно анализировать небольшие отрывки исходных текстов: при таком подходе от исследователя может ускользать крайне важная информация об организации дискурсивной структуры речевого произведения. В связи с этим одним из принципов, которым мы руководствовались при создании настоящего ресурса, был принцип доступности полных версий исходных аудиофайлов.

В настоящее время проект объединяет три корпуса устной русской монологической речи: «Рассказы о сновидениях», «Рассказы сибиряков о жизни», «Весёлые истории из жизни» (имеющий также письменный вариант), а также группу корпусов «Истории о подарках и катании на лыжах». В нее помимо текстов на русском языке входят также образцы армянского и японского устного дискурса. Все они принадлежат к жанру монологического нарратива, и именно для устных текстов такой природы в максимальной степени приспособлена используемая в проекта система транскрипции. С более подробными сведениями о доступных корпусах можно ознакомиться в разделе «Корпуса». Там же содержатся списки всех имеющихся в наличии затранскрибированных рассказов. Их можно послушать, ознакомиться с их транскрипцией, а также проигрывать отдельные фрагменты звуковых файлов, соответствующие отрывкам транскриптов. О том, как это сделать, можно прочитать в разделе «Возможности».

Для части рассказов корпуса «Рассказы о сновидениях» сформирован пилотный набор файлов ELAN. Краткая справочная информация о принципах представления информации и методах работы в среде ELAN, а также список используемых обозначений приведены в разделе «Файлы ELAN», там же можно загрузить файлы себе на компьютер.

Написать письмо администратору