Как известно, ядром и главным инструментом контент-анализа является система категорий. Каждая единица анализа должна быть закодирована, т. е. отнесена к одной или нескольким взаимоисключающим категориям. Главной особенностью контент-анализа является то, что категории должны устанавливаться исследователем перед началом кодирования. Если в процессе анализа выясняется, что какие-то необходимые категории отсутствуют, оказываются двусмысленными или никогда не используются, то весь текст подвергается повторному кодированию с учетом новых категорий. Система категорий должна быть сфокусирована на исследовательской задаче или вытекающей из нее гипотезе. Соответственно, можно создавать индуктивную схему категорий, используя данные, полученные в результате анализа текста другими методами, и дедуктивную схему, вытекающую из теоретических представлений (Titscher et al., 2000).
Классические варианты контент-анализа заключаются либо в оценке частоты употребления определенных категорий, либо к этому добавляется анализ их взаимозависимостей, т. е. оценка того, насколько вероятность упоминания об одной из них в связи с другой близка к случайной (реляционный контент-анализ). Применительно к первому варианту контент-анализа выделяют следующие восемь последовательных стадий или шагов, которые надо осуществить применительно к процессу кодирования категорий (Carley, 1992).
На первой стадии необходимо выбрать уровень анализа текстового материала. Исследователь определяет набор индикаторов, касающихся исследуемой проблемы, т. е. решает, кодировать ли отдельные слова, словосочетания или фразы. Таким образом, здесь речь идет о выборе единиц кодирования.
На второй стадии принимается решение о необходимом количестве подлежащих кодированию понятий (определение набора категорий). Кроме того, решается, будет ли возможно включать в предварительно сформированный список категорий такие, которые могут появиться в процессе анализа текста.
На третьей стадии дается ответ на ключевой вопрос о том, что будет оцениваться: присутствие или частота встречаемости в тексте определенной категории или темы. В первом случае учитывается только то, что та или иная категория встретилась в тексте (вне зависимости от количества раз), во втором случае подсчитывается количество случаев ее встречаемости, что делает анализ принципиально более содержательным.