Ресурсный центр по контролю над табаком
|
IV. Подготовка и обработка данных: простые шаги по построению вашей собственной базы данныхВыбор программного обеспеченияВ наше время статистики и аналитики могут использовать ряд компьютерных средств, которые помогают при работе с данными, построении и анализе переменных. В целом удачный пакет программ должен быть гибким и простым в использовании, и в то же время достаточно мощным, чтобы управляться с большими объемами данных в наименьшее возможное количество времени. Выбор программного обеспечения в основном зависит от бюджета и желаемых эксплуатационных качеств. Рыночная цена статистических пакетов варьирует у разных производителей, равно как и мощность и изысканность программ. Для достижения целей, описываемых в этом пособии, «хорошее» программное обеспечение должно предоставлять следующие возможности при условии приемлемой цены:
Рынок статистических пакетов предлагает большое количество программ, снабженных разными инструментами и имеющих большие различия в цене. Крупноформатные (электронные) таблицыЭлектронные таблицы, традиционно простые в использовании, в последние годы претерпели большие улучшения и, в результате, стали достаточно изощренными инструментами для анализа. Например, Microsoft Excel и Corel Quattro Pro - это два популярных пакета программ вида электронных таблиц, совместимых со всеми операционными системами Microsoft Windows. Электронные таблицы легко доступны и почти всегда включаются в начальный набор программного обеспечения на новом компьютере. В целом электронные таблицы, хотя и имеют приемлемые цены и предлагают передовые методы доступа к данным и управления ими, все же проявляют только средние возможности для статистического анализа данных. Из-за своих ограничений в объеме и вычислительных возможностях электронные таблицы на самом деле годятся для работы только со сгруппированными массивами данных (комментарий переводчика). Статистические пакетыК популярным статистическим программам большей мощности можно отнести SAS, SPSS, и STATA (комментарий переводчика). Эти программы способны обрабатывать гораздо большие массивы данных, чем программы типа электронных таблиц. Все три перечисленных статистических пакета предлагают большой набор инструментов для подготовки и анализа данных по различным ценам. Розничная ценаВыше названные статистические пакеты различаются по их розничной цене. В результате, выбор между пакетами может быть обусловлен бюджетом исследователя. В смысле розничной цены SAS - одна из самых дорогих статистических программ на рынке. В дополнение к оплате при закупке пакета, SAS требует ежегодных обновлений корпоративной лицензии. В противоположность, STATA достаточно приемлема по цене, в случае приобретения вместе с другими стандартными пакетами, стоит всего 50 долларов за копию. SPSS лежит по цене примерно посередине между двумя вышеупомянутыми, хотя и это может быть слишком дорогим для некоторых исследователей (комментарий переводчика). ВозможностиСтатистические пакеты оборудованы для подготовки и поддержания массивов данных гораздо лучше, чем электронные таблицы. Статистические пакеты, в особенности SAS, могут вмещать очень большие массивы данных (в пределах гигабайта), хотя реальный объем хранимых данных может зависеть от памяти компьютера, на который установлена программа. С другой стороны, электронная таблица имеет гораздо меньшие возможности содержания данных (примерно 300 колонок на 65000 строк). Обработка данныхРешеткообразная структура электронных таблиц упрощает просмотр данных и использование функций или уравнений для создания новых переменных. Однако электронные таблицы ограничены в расчетах, которые они могут проделать. Вдобавок к этому, они не допускают простого объединения с другими массивами данных или другими видами файлов с данными. Статистические пакеты требуют только несколько строк кода для создания новых переменных, и они могут объединять различные массивы данных, так же как и сортировать и обобщать данные. Подобные манипуляции производятся быстро и эффективно, даже при больших массивах данных. Статистические инструментыВ последние годы электронные таблицы получили шанс представить несколько мудреных операций. Большинство электронных таблиц в наши дни оснащены для подсчета статистических сводок данных и производят базовые ординарные вычисления методом наименьших квадратов и логит-преобразования. В результате, исследования, работающие с небольшими массивами данных и требующие только основных регрессионных моделей, могут быть легко сделаны с помощью Microsoft Excel, Corel Quattro Pro или подобных программ типа электронных таблиц для исследовательского анализа. Однако, статистические пакеты гораздо более мощны, чем традиционные электронные таблицы, так как содержат продвинутые инструменты для моделирования и различные статистические тесты, которые предусматривают эконометрическую оценку. ПрезентацияВ смысле презентации, электронные таблицы лучше оснащены для создания продуманных таблиц, рисунков и графиков. Вы можете быстро и эффективно построить график или диаграмму для презентации. Вдобавок к этому, эти графики можно сохранять отдельно и импортировать в другие программы, работающие с текстами или презентациями. Хотя статистические пакеты имеют средства для построения графиков по данным наблюдений, эта функция выполняется только на самом начальном уровне. SAS предлагает графический пакет, который может быть приобретен по отдельной стоимости. Однако этот дополнительный пакет очень сложен и требует достаточно больших объемов программирования.
|