Корпус состоит из 129 рассказов детей и подростков от 7 до 17 лет об увиденном ими во сне. Рассказы записывались непосредственно после пробуждения. Общая длительность звучания — около 2 часов; объем корпуса — около 14 тысяч словоупотреблений.

Подробнее Скрыть описание

Рассказы разбиты на две группы: 60 рассказов взяты от детей и подростков из контрольной группы (номера 001z–060z в корпусе), 69 рассказов — от участников эксперимента с теми или иными невротическими расстройствами (061n–129n). Аудиозаписи корпуса были подвергнуты наиболее тщательному лингвистическому аннотированию, выполненному исследователями из Института языкознания РАН, РГГУ и МГУ: для каждого рассказа доступны полная, упрощенная и минимальная версия транскрипции, а также временная привязка элементарных дискурсивных единиц из транскриптов к фрагментам аудиофайлов. Для части корпуса (рассказы с 001z по 035z) также доступны файлы формата ELAN.

Корпус состоит из 17 рассказов взрослых жителей Новосибирска (от 19 до 70 лет) о каких-либо ярких событиях в их жизни. Общая длительность — около 40 минут звучания; объем — приблизительно 5 тысяч словоупотреблений.

Подробнее Скрыть описание

Аудиофайлы были получены в НГТУ К. В. Орловой, рассказы записывались на цифровой носитель в непринужденной обстановке; информантов не прерывали. В случае очень длинных рассказов в корпус был включен фрагмент (длительностью до 5 минут). Транскрипты рассказов, выполненные сотрудниками Института языкознания РАН, РГГУ и МГУ, представлены в трех формах: полной, упрощенной и минимальной; реализована также временная разметка элементарных дискурсивных единиц в звуковых файлах.

Корпус состоит из 40 пар рассказов взрослых людей (от 18 до 60 лет) о смешных происшествиях в их жизни. От каждого рассказчика было получено по 2 рассказа об одном и том же событии, устный и письменный. Общая длительность устной части корпуса — около 1 часа 10 минут; объем — около 7 тысяч словоупотреблений. Объем письменной части — около 10 тысяч словоупотреблений.

Подробнее Скрыть описание

Работа по сбору устных и письменных рассказов производилась в МГУ под руководством А. А. Кибрика. Всем информантам предлагалась одна и та же тема — веселые истории из жизни. Сбор производился в 2 этапа: сначала каждый информант рассказывал историю в устной форме, не зная, что необходимо будет записать ее, а через неделю от него требовалась письменная версия. Транскрипты устных рассказов (минимальная и упрощенные версии) были выполнены на базе РГГУ, с ноября 2012 года для них также доступна функция проигрывания определяемых пользователем отрывков звуковых файлов.

Группа корпусов «Истории о подарках и катании на лыжах»


Корпуса устных текстов, полученных от носителей различных языков в ходе двухступенчатого эксперимента. На первом этапе испытуемым последовательно предъявлялись два набора картинок: «Подарки» и «Катание на лыжах». Для каждого набора давалось несколько секунд на ознакомление с общим сюжетом, после чего информанты составляли рассказы по картинкам, имея их перед глазами. На втором этапе, производившемся через 6–8 часов после первого, испытуемым предлагалось пересказать те же истории по памяти, не смотря на картинки.

Корпус состоит из 20 рассказов и 20 пересказов десяти носителей русского языка. Записи производились в Москве в 2003–2004 гг. Все информанты являются москвичами, возраст информантов на момент записи — от 20 до 30 лет. Общая длительность звучания — около 35 минут; объем корпуса  — около 4,5 тысяч словоупотреблений. Транскрипты доступны в трех формах: полной, упрощенной и минимальной; доступно проигрывание определяемых пользователем отрывков.

Корпус состоит из 20 рассказов и 20 пересказов десяти носителей армянского языка. Записи производились в Ереване в 2004–2005 гг. Все информанты являются ереванцами, возраст информантов на момент записи — от 17 до 25 лет. Общая длительность звучания — около 42 минут; объем корпуса — около 4,5 тысяч словоупотреблений. Для корпуса выполнена модифицированная минимальная транскрипция, включающая в себя армянскую графику, латинизированную запись, глоссинг и русский перевод.

Корпус состоит из 20 рассказов и 20 пересказов носителей японского языка. Записи производились в Москве в 2005–2006 гг. Информантами являются японские студенты и аспиранты, проходившие стажировку в Российском гуманитарном государственном университете. Для всех говорящих японский язык является родным. Возраст говорящих — от 21 до 30 лет. Общая длительность звучания — около 45 минут; объем корпуса — около 4,1 тысяч словоформ. Для корпуса выполнена модифицированная минимальная транскрипция, включающая в себя латинизированную транскрипцию, глоссинг, запись в оригинальной японской графике и русский перевод.

Написать письмо администратору