Принципы количественного анализа в лингвистике

Материал из Letopisi.Ru — «Время вернуться домой»
Перейти к: навигация, поиск

Принципы количественного анализа в лингвистике

Рассматривая вопрос об индивидуальном стиле автора, мы говорим о том, что отрывки текстов одного и того же писателя, взятых или из разных мест одного и того же произведения, или даже из разных произведений имеют определенное сходство. Поэтому читательское впечатление стиля того или иного писателя связано с какими-то устойчивыми соотношениями в тексте различных языковых элементов, в частности, с устойчивыми и разными для этих писателей частотами хотя бы некоторых частей речи. Для определения частоты употребления той или иной части речи берутся отрывки текстов (так называемые выборки) одного и того же писателя, каждый из которых состоит из слов авторской речи, а не речи персонажей, то есть применяется количественный (или статистический) анализ текста. Количественные методы в языкознании – использование подсчетов и измерений при изучении языка и речи. В той мере, в какой они опираются на математическую статистику, они могут быть названы статистическими методами. Применение количественных методов в языкознании аналогично их использованию в других естественных и социальных науках. Основным объектом применения количественных методов в языкознании является речь, точнее, текст. Количественные показатели дают определенную информацию о самих текстах. На том факте, что различия между языковыми стилями и жанрами носят преимущественно статистический характер, основана так называемая статистическая стилистика. Возможность через лексику количественно отражать тематическую отнесенность текстов языка важна для некоторых приложений лингвистики. Широкое применение количественных методов для описания и классификации текстов (например, при атрибуции текстов, в частности при установлении авторства анонимных текстов) связано с тем, что большинство двусторонних единиц и конструкций языка могут служить для различения текстов или для их классификации. С другой стороны, количественные методы, примененные к текстам, открывают путь к изучению самого языка, поскольку сегменты текстов, являющиеся объектами подсчетов, соотнесены с единицами языка. Количественные методы позволяют количественно описывать поведение различных языковых единиц (фонем, букв, морфем, слов) в тексте: частоту употребления единиц, их распределение в текстах разного жанра, сочетаемость с другими единицами и т.п. Б.Н. Головин в книге «Язык и статистика» приводит пример такого анализа, откуда видно, что, например, у Шолохова имена существительные, имена прилагательные и причастия заметно активнее, чем у Симонова; у Симонова же заметно активнее, чем у Шолохова, местоимения, глаголы, наречия, а также союзы. На основе исследований доказано, что части речи играют немаловажную роль в формировании функционально-языковых стилей – таких, как публицистический, деловой, научный, художественный. Активность частей речи в произведениях проявляется регулярно: в разных местах разных произведений, следовательно, она закономерно характеризует стиль того или иного автора. Поэтому можно сказать, что статистика предоставляет большие возможности для систематического изучения и языкового функционирования и развития. Учитывая важность данных вышеописанного статистического материала, Б.Н. Головин ставит ряд важных вопросов, требующих творческого решения. 1. Связаны ли показываемые статистикой особенности функционирования частей речи, предложений и их членов в речи писателей некоторыми внутренними зависимостями, т.е. носят ли они системный характер? 2. Стоят ли за различиями активности частей речи, членов предложений и предложений у разных писателей устойчивые различия художественного содержания их произведений? 3. Следует ли думать, что в необследованных кусках текста (не вошедших в выборки) активность изучаемых элементов будет такой же, как и в выборках?

Персональные инструменты
Инструменты