Современные информационные технологии в социологических исследованиях

NovaInfo 34
Опубликовано
Раздел: Социологические науки
Просмотров за месяц: 43
CC BY-NC

Аннотация

Данная статья посвящена использованию современных информационных технологий на разных этапах социологических исследований. Приводится сравнительный анализ различных современных статистических пакетов.

Ключевые слова

СТАТ-ЭКСПЕРТ, STADIA, STATISTICA, ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, СОЦИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ, СТАТИСТИЧЕСКИЕ ПАКЕТЫ, STATA, SPSS

Текст научной работы

XXI век принято называть веком информационных технологий. Сегодня наблюдается стремительная информатизация всех сфер жизни общества, и игнорировать этот процесс просто невозможно. Информационные технологии окружают нас повсеместно, хотя порой мы этого и не осознаём. В частности наблюдается активное внедрение информационные технологий в сферу социологии [1].

Специфика проведения социологического исследования состоит в том, что исследователям приходится работать с огромными массивами данных, обрабатывать которые вручную задача весьма сложная, трудоёмкая, а иногда и вовсе невозможная. Так, например, в работах А.В. Мальцевой [2,3,4] анализ трансформации социальной структуры общества основывается на информации из производственных баз данных, содержащих сотни тысяч записей, результатах массовых социологический опросов и экспертных оценках. Проведение подобных полномаштабных работ занимает много времени и требует большой точности и аккуратности от исследователя, использование информационных технологий на каждом этапе позволяет автоматизировать часть работ и обеспечить большую точность результатов.

Использование различных программных и технических средств в процессе проведения социологического исследования позволяет решить многие проблемы, получить разнообразную информацию о различных областях жизни современного общества [5,6,7]. Сегодня на рынке существует большое число специализированных программных продуктов, облегчающих процесс проведения социологических исследований на разных этапах, от составления программы исследования до анализа полученных данных и составления отчёта о проделанной работе.

Основными этапами проведения социологического исследования являются три основных этапа: подготовительный этап, сбор данных и анализ данных. На каждом из них, так или иначе, используются различные информационные технологии. Рассмотрим возможности использования информационных технологий на каждом из этих этапов.

Первый этап исследования – подготовительный. На этом этапе происходит формулировка задачи исследования и её осмысление, предварительное изучение объекта исследования: рассмотрение его структуры, функций, целей. Составляется план исследования и разрабатывается программа.

Одним из основных технических средств, использующихся на данном этапе, является сеть Интернет. Она и служит источником информации о рассматриваемом объекте. Однако не всё, что найдено на просторах глобальной сети, можно слепо принимать на веру. Для проведения каких-либо серьёзных научных изысканий требуются надёжные источники информации, какими и являются различные базы и банки социологических данных. Наиболее известными и распространёнными банками социологических данных являются Банк социологических данных Института социологии РАН [9] и Единый архив экономических и социологических данных (ЕАЭСД) [10]. В них хранятся уникальные архивы данных, результаты различных исследований, проводимых ведущими научными центрами страны. Они могут стать незаменимыми источниками данных. Чтобы получить доступ к данным, исследователю нужно всего лишь заполнить специальную форму-запрос, в которой указывается, для какой работы необходимы данные, и выслать эту форму на электронный адрес. Данные предоставляются в формате SPSS, что очень удобно для дальнейшей работы.

На подготовительном этапе происходит разработка программы исследования, что подразумевает большие объёмы бумажной работы. Она предполагает описание целей, задач исследования, постановку проблемы, составление вопросов, если планируется анкетирование, разработку предварительного плана исследования. Наиболее известным инструментом, используемым на этом этапе, являются различные текстовые редакторы, например, Microsoft Office Word, стандартный блокнот Windows, Notepad и т.д. Они позволяет сохранить и упорядочить всю собранную информацию.

Одним из последних пунктов программы исследования является разработка анкеты. Сегодня существуют различные программы и онлайн – сервисы, которые позволяют облегчить процесс составления анкеты.

Ещё сравнительно недавно вопросы анкет и инструкции респондентам писались вручную, либо набирались исследователем в текстовом редакторе, что отнимало много времени, и было не очень удобно. На сегодняшний день существуют много различных возможностей, позволяющих упростить процесс разработки анкеты. Например, такие программы, как Microsoft Office InfoPath. Это средство для создания форм и сбора данных. С помощью этой программы можно создавать различные электронные формы для быстрого сбора информации. Пользователям предоставляется много возможностей для создания форм, в том числе большое количество шаблонов, возможности создания форм с нуля и т.д.

Среди программ для создания анкет можно также выделить такие как Interro-SL, iSpring QuizMaker и др. Эти программы обладают аналогичными функциями. Они также содержат ряд шаблонов, включают возможность составления отчёта по результатам анкетирования, который может быть представлен в табличной и графической форме.

Помимо этого, зачастую для создания анкет исследователи используют различные онлайн - сервисы. Преимуществом таких сервисов является полная анонимность респондентов. Благодаря этому люди охотнее соглашаются принять участие в опросе. Наиболее известными сервисами в среде социологов являются формы Google, сервис WebAnketa, Анкетёр, CreateSurvey, Анкетолог, Aeterna и многие другие. Они позволяют буквально за несколько простых шагов создать несложную анкету, что и является причиной их большой популярности. Также в процессе заполнения таких анкет автоматически формируется первичная статистика. Некоторые сервисы, как например формы Google, включают различные графические средства для представления результатов анкетирования.

Следующий этап проведения социологического исследования – сбор данных, или так называемый «полевой» этап. Интенсивность применения различных информационных технологий на этом этапе зависит от того, какой метод сбора данных выбран. Если это анкета или опрос, то, как уже сказано выше, может быть использован текстовый редактор для конструирования вопросов, специализированная программа, или онлайн - сервис. Анкеты могут быть разосланы респондентам с помощью программы электронной почты. Это удобно в том случае, когда опрашиваемый находится за тысячи километров от исследователя, или количество опрашиваемых слишком велико. Фиксировать ответы респондентов удобно в табличном редакторе или в базе данных, что впоследствии может облегчить анализ полученных данных.

Если в качестве метода сбора данных выбрано интервью, здесь возможны разные варианты. При личном контакте с респондентом на помощь исследователю придут такие технические средства как диктофон, видео камера и т.п. Съёмка видеокамерой позволяет фиксировать не только ответы респондентов, но и их жесты, интонации, мимику, всё, что может отражать истинное отношение респондента к предмету обсуждения. Если респондент находится на значительном расстоянии и личное присутствие на интервью невозможно, то вопросы можно переслать с помощью программы электронной почты. Кроме того, сегодня есть возможность проведения интервью с помощью программы бесплатных видеозвонков Skype

Видеосъёмка также окажет значительную помощь исследователю при проведении фокус-групп. В процессе проведения фокус-группы модератор не имеет возможности следить за всеми участниками сразу, поэтому в процессе дискуссии, как правило, ведётся аудио- и видеозапись. Это помогает в дальнейшем лучше понять отношение участника фокус-группы к тому или иному вопросу.

Возможен также вариант самозаполнения на компьютере. Сравнение результатов компьютерного самозаполнения с результатами интервью и анкетирования, проведенных различными авторами за 1967 - 1997 гг., позволило В.Л. Рихману и его коллегам утверждать, что форма представления данных респонденту влияет на категоричность его ответов. Когда опрашиваемый пишет или произносит ответы, он чаще выбирает какие-то нейтральные варианты ответов, избегая крайних позиций. И совсем иная ситуация складывается при компьютерном самозаполнении. Когда респонденты заполняют анкету в одиночестве, они ощущают себя более спокойно и раскованно, и их ответы являются более искренними.

После проведения исследования наступает этап обработки и анализа полученных данных. На этом этапе исследователю необходимо систематизировать массив полученных в результате анкетирования и опроса данных, расшифровать видеозаписи, упорядочить какие-либо количественные данные.

Результатом полевого этапа социологического исследования могут быть различные качественные данные: тексты интервью, материалы групповых дискуссий и т.д. Для анализа этих данных исследовательским комитетом «Системная социология» Российского общества социологов была разработана система Контент-Анализ Про. В данной программе реализованы 2 вида контент-анализа: смысловой и частотный. Смысловой предназначен для анализа смысла текста, подтекста, включённого автором в текст. Частотный - позволяет проанализировать частоту встречаемости в тексте различных фрагментов: слов, предложений и т.д. Существует множество аналогов этой системы. К ним можно отнести такие программы, как ВААЛ, Text Mining и др.

Для анализа количественных данных существует большое количество различных специализированных программ – статистических пакетов, каждый из которых обладает рядом достоинств и недостатков. Для реализации различных задач можно использовать разные статистические пакеты.

В разные статистические пакеты включены разнообразные методы статистики от простой описательной статистики до анализа главных компонент. Согласно существующей классификации, всё многообразие статистических пакетов можно делится на три группы:

  1. Интегрированные методоориентированные пакеты общего назначения. Такие пакеты ещё можно назвать универсальными, т.к они не ориентированы на какую-то конкретную предметную область. Они имеют относительно простой интерфейс, что позволяет работать с пакетом не только профессиональным исследователям, но и обычным пользователям. Но в то же время в таких пакетах содержится широкий диапазон статистических методов. К этой группе пакетов можно отнести SPSS, STATA, STATISTIKA и другие.
  2. Специализированные методоориентированные пакеты. Как правило, эти пакеты содержат методы 1-2 разделов статистики, применяемые в какой-либо предметной области. Зачастую это системы, ориентированные на корреляционно-регрессионный анализ, анализ временных рядов, кластерный или факторный анализ. К специализированным пакетам статистической обработки данных можно отнести отечественные программы STADIA, Олимп и др. Среди зарубежных пакетов можно выделить SAS, BMDP.
  3. Предметно- (или проблемно-) ориентированные пакеты. Эти пакеты предназначены для решения вопросов, связанных с конкретной предметной областью. Они ориентированы на высококвалифицированных специалистов. Зачастую в составе этих пакетов присутствуют оригинальные разработки авторского коллектива. К ним можно отнести такие пакеты, как BioStat, MESOSAUR, DATASCOPE.

Специалисты-социологи зачастую используют в своей работе универсальные и реже специализированные пакеты, наиболее распространёнными из которых являются зарубежные пакеты SPSS, STATA, STATISTICA, STATGTRAPHICS, SYSTAT, S-PLUS и т.п. Среди отечественных аналогов можно выделить STADIA, ЭВРИСТА, ОЛИМП: Стат-Эксперт, MESOSAUR, КЛАСС-МАСТЕР и др. В силу того что проблемно-ориентированные пакеты предназначены для высококвалифицированных профессионалов, они мало распространены и используются только при проведении каких-либо масштабных исследований.

Из перечисленных пакетов в России наиболее распространены следующие: SPSS, STATA, STATISTICA, STADIA, ОЛИМП: Стат-Эксперт др. Рассмотрим каждый из них более подробно.

Программа SPSS, согласно приведённой классификации, относится к пакетам общего назначения, однако обладает большим разнообразием функций.

Пакет является основным для преподавания статистического анализа студентам во многих гуманитарных университетах как зарубежных, так и отечественных.

IBM SPSS Statistics — это интегрированное семейство продуктов для аналитического процесса. Стоит отметить, что практически ежегодно компания выпускает новую версию SPSS, изменяет дизайн, включает новые возможности работы с пакетом. На сегодняшний день выпущена 23 версия пакета. Программа SPSS состоит из модулей. В базовом модуле содержится большой набор статистических процедур, который может быть дополнен за счет встраиваемых дополнительных модулей .

Пакет IBM SPSS Statistics поставляется в пяти редакциях:

  1. IBM SPSS Statistics Base
  2. IBM SPSS Statistics Standard
  3. IBM SPSS Statistics Professional
  4. IBM SPSS Statistics Premium
  5. IBM SPSS Statistics Campus Edition

Также к статистическим пакетам общего назначения относится программа STATA. Это пакет для решения задач в различных прикладных областях: экономике, медицине, социологии. Первая версия продукта появилась на рынке в 1985г. На сегодняшний день выпущена 13 версия программы.

STATA поставляется в четырёх редакциях:

  • Stata/MP
  • Stata/SE
  • Stata/IC
  • Small Stata

Stata традиционно являлась пакетом, который управляется при помощи команд, вводимых с клавиатуры, и работает в графическом или оконном режиме. Позднее в версии программы Stata 8 появился графический интерфейс пользователя для ввода команд. Stata также может оперировать с командной строкой на системах аналогичных UNIX. Количество переменных, которое можно вносить в программу Stata ограничено количеством 2047 в стандартной поставке Stata (IC), но может быть значительно большим в программе Stata/SE. Количество наблюдений ограничено только размерами памяти.

Также в пакете представлен широкий спектр графических возможностей, к которым относится построение графиков, схем, диаграмм. Графики могут экспортироваться в различном формате для включения в документы.

Ещё один не менее популярны статистический пакет STATISTICA, продукт компании StatSoft. Он относится к пакетам общего назначения. Компания StatSoft Russia – эксклюзивный представитель американской компании StatSoft Inc. на территории России и стран СНГ. Основным продуктом компании является пакет STATISTICA, первый релиз которого состоялся в 1997г. и сегодня выпущена уже 12.5 версия. Система STATISTICA Enterprise позволяет решать задачи анализа данных, data mining, text mining, визуализации, контроля качества в режиме реального времени».

Пакет «Олимп: СтатЭксперт», разработанный специалистами ТОО «Росэкспертиза», относится к категории специализированных методо-ориентированных пакетов, но не менее широко используется в различных социологических исследованиях. Программа продолжает развиваться и сегодня. Она предназначена для автоматизации обработки статистических данных. Данный пакет ориентирован на широкий круг пользователей, от новичков до профессиональных исследователей. Пакет “ОЛИМП” предоставляет большие возможности по статистическому анализу данных, от ввода первичных данных, их проверки и визуализации до проведения расчетов и анализа результатов. Средства графического отображения данных позволяют строить различные виды диаграмм и графиков.

Программа поставляется в базовом и профессиональном вариантах, которые отличаются набором методов. В базовый вариант включены методы анализа и прогнозирования одномерных временных рядов, средства описательной статистики количественных данных, регрессионный и корреляционный анализ. В профессиональную версию включены более сложные статистические процедуры, среди которых кластерный, спектральный и кросс - спектральный анализ, обработку нечисловой информации и т.д.

Помимо традиционных алгоритмов анализа, в пакет включены также авторские алгоритмы.

Пакет STADIA также относится к категории специализированных методо-ориентированных пакетов. Он разработан ведущими специалистами Московского Государственного Университета им.М.В.Ломоносова в конце 70-х годов. В отличие от SPSS пакет не поддерживает обработку миллионов наблюдений, но достаточно хорошо справляется с данными выборочных обследований нескольких сотен или тысяч респондентов. Пакет ориентирован на конкретные статистические расчёты и построение сопутствующих графиков во всех областях прикладной статистики.

В 2009 г. STADIA включена в качестве одного из рекомендуемых программных средств в Государственный образовательный стандарт РФ.

Для более наглядного представления возможностей различных пакетов в рамках данного исследования был проведён сравнительный анализ основных характеристик представленных статистических пакетов, результаты которого представлены в таблице.

Таблица 1. Сравнительный анализ статистических пакетов

Характеристика

SPSS

STATA

STATISTICA

Олимп: СтатЭксперт

STADIA

Базовые статистические методы

+

+

+

+

+

Общие линейные модели

+

+

+

+

+

Многомерные линейные модели

+

+

+

-

-

Панельные/повторные данные

-

+

-

-

-

Непараметрические методы

+

+

+

-

+

Многомерные методы

+

+

+

-

+

Кластерный анализ

+

+

+

+

+

Проверка гипотез

+

+

-

-

-

Временные ряды

 

+

-

+

+

Многомерное шкалирование

+

-

+

-

+

Графика

+

+

+

-

-

Наличие русифицированной версии

+

-

+

+

+

Ограничение на объём данных

-

-

1000000 * 500

16384 * 256

20000 чисел

Демо-версия

14 дней

-

30 дней EN

есть

ограничение на объём данных

Исходя из данных, представленных в таблице, можно сделать следующие выводы:

  1. Пакеты SPSS и STATA практически идентичны по своим функциям. Достоинством обоих пакетов является то, что объём входных данных ограничивается только мощностью компьютера и объёмом оперативной памяти, что позволяет использовать их при проведении масштабных исследований.
  2. Пакет STADIA немного уступает по функциям SPSS и STATA, имеет ограничение на объём входных данных.
  3. Все пакеты являются платными, и у всех имеется демо-версия, которую можно скачать с официального сайта. Но демо-версия STATA поставляется на английском языке. А демо-версия STADIA содержит ограничения на объём обрабатываемых данных.

Помимо статистических пакетов, сегодня появляются различные аналитические платформы, предоставляющие комплексные методы анализа данных. К наиболее известным производителям в этой области относятся: BaseGroup Labs, Business Objects, Cognos, SAS, Oracle и др. Это направление сравнительно молодое и достаточно перспективное, которое на сегодняшний день активно разрабатывается.

Подводя итог вышесказанному, можно с уверенностью говорить о том, что с приходом информационных технологий в социологию возможности проведения исследований серьёзно расширились. Во многом усовершенствовался процесс подготовки исследования. Глобальная компьютеризация позволила уменьшить объёмы бумажной работы, что в свою очередь значительно сократило временные затраты на подготовку исследования.

Претерпел значительные изменения характер проведения исследования. С внедрением информационных технологий в социологию усовершенствовались уже существующие методы проведения исследования и появились новые более эффективные. Также появилось много возможностей для обработки данных, полученных в ходе исследования.

Таким образом, можно сделать вывод о том, что внедрение компьютерных технологий в социологию - направление достаточно перспективное и требующее дальнейшей разработки.

Статья публикуются в рамках реализации проекта 15-06-02113 при финансовой поддержке РФФИ "Междисциплинарный подход к исследованию индикативной роли рынка труда в трансформации социальной структуры общества: социологическое и математическое моделирование".

Читайте также

Список литературы

  1. Мальцева, А.В. Современные информационные технологии в обеспечении прикладных исследовательских задач в социально-культурной сфере//Известия Алтайского государственного университета, 2009. №1. С.143.
  2. Мальцева А.В. Использование современных методов и технологий анализа данных для принятия управленческих решений (на примере решения задачи сегментации рынка труда//Вестник Евразийской академии административных наук. 2010. № 4. С. 28-40.
  3. Мальцева А.В. Индикативная роль социального института рынка труда в трансформации социальной структуры современного российского общества (на примере социологических исследований в алтайском крае): дис. … докт. соц. наук. Барнаул, 2011.
  4. Мальцева А.В., Шилкина Н.Е., Махныткина О.В., Пономарева К.В., Карпушкин А.Н., Осянкина К.С., Тюнина Т.В. Использование методики event-анализа для изучения процессов на рынке труда//Интернет-журнал Науковедение. 2012. №3 (12). С. 12.
  5. Шилкина Н.Е. Неопределенность и риск как составляющие повседневной деятельности//Вестник Орловского государственного университета. Серия: Новые гуманитарные исследования. 2011.№1(15). С. 90-97.
  6. Махныткина О.В. Оптимизация траектории развития слабоформализованного объекта с иерархической структурой//Известия Алтайского государственного университета. 2013. №1-1(77). С. 116-120.
  7. Шилкина Н.Е. Стратегии социальной адаптации современной студенческой молодежи в городском социальном пространстве (по материалам социологического исследования в г. Барнауле)//Среднерусский вестник общественных наук. 2013. № 1. С. 76-80.
  8. Петрунин, Ю.Ю Информационные технологии анализа данных/ Ю.Ю.Петрунин.- М.:КДУ, 2010.-288с.
  9. Банк социологических данных ИС РАН [Электронный ресурс]. - URL: http://www.isras.ru/Databank.html
  10. Единый архив экономических и социологических данных [Электронный ресурс].- URL: http://sophist.hse.ru/
  11. Описание программы "ОЛИМП:СтатЭксперт" [Электронный ресурс].- URL: http://www.k-press.ru/comp/1998/1/Rosexp/Rosexp.asp
  12. Решение сложных исследовательских и бизнес - задач с помощью анализа данных [Электронный ресурс].- URL: http://www-03.ibm.com/software/products/ru/spss-statistics
  13. Чураков, А.Н. Контент - Анализ Про (версия 1.6) [Электронный ресурс], 2011.- URL: http://ecsocman.hse.ru/text/35480087/
  14. IBM SPSS Statistics [Электронный ресурс].- URL: http://www.predictivesolutions.ru/software/statistics.htm
  15. Which STATA is right for me? [Электронный ресурс].- URL: http://www.stata.com/products/which-stata-is-right-for-me/

Цитировать

Иванова, И.А. Современные информационные технологии в социологических исследованиях / И.А. Иванова, О.В. Махныткина. — Текст : электронный // NovaInfo, 2015. — № 34. — URL: https://novainfo.ru/article/3709 (дата обращения: 24.01.2022).

Поделиться