Анализ макроструктуры дискурса производится в терминах дискурсивных грамматик, компонентов жанровой схемы рассказа (Bergelson et al., 2014; Labov, 2008; Longacre, 1996; Polanyi, 2003) и прагмалингвистического анализа (Jucker, 1986). Для этого проекта нами были выработаны виды разметки жанровой схемы в рамках метанарративного, оценочного и интерактивного компонентов рассказов, которые позволяют выявить особенности текстов заданного жанра (пересказ видеофильма).
Анализ нарратива на макроуровне для корпуса Russian CLiPS предполагает анализ пересказов с точки зрения соответствия его жанровой схеме рассказа. Этот анализ делится на две последовательные стадии: разбиение рассказа на сцены (станзы) и разметку по компонентам (приписывание каждой сцене тега, обозначающего один из компонентов жанровой схемы рассказа, и затем приписывание каждому высказыванию внутри сцены типа компонента). Сцена – это последовательность высказываний, произведенных в рамке одной перспективы, т. е. внутри сцены не происходит смена перспективы. И наоборот, граница между сценами определяется сменой перспективы.
С точки зрения метанарративного уровня сцены могут принадлежать одному из двух миров: миру истории, о котором повествует рассказчик, и миру рассказывания (Барт, 1987; Падучева, 2008; Norrick, 2000).
3.4.1. Мир истории
Внутри мира истории сцены получают тэги, описывающие их как зачин, кода, описание, ОЛ (основная линия) или оценка. Зачин и кода являются «устойчивыми» компонентами и чаще всего встречаются, соответственно, в начале и конце рассказа по одному вхождению компонента на рассказ.
Пример 1 (зачин)[4]. «Первое что мне понравилось это природа… картинка природы и приятная уху. звуки которые идут с пленки… по-моему это или Италия. Или Испания. Нет?»
Описание, ОЛ и оценка являются «подвижными» компонентами – могут перемежаться друг с другом, встречаться в разных местах истории и по нескольку раз в одном рассказе.
Сцены состоят из строк (ЭДЕ). Для целей анализа на макроуровне деление на высказывания не является существенным. Внутри сцены каждая строка получает тэг типа компонента.
Компонент описание может включать следующие типы компонентов: введение, добавление, пояснение, уточнение, содержание и цитация. Введение встречается в начале рассказа и представляет собой исходную картинку, экспозицию рассказа (тэг