обзоры литературы для медицинских научных проектов
работа по всей России и СНГ, всегда в срок
info@lit-review.ru
+7 (495) 646-49-75
Заказ обратного звонка
Специальные предложения по обзорам литературы и статистической обработке
(для статей, кандидатских, докторских, магистерских и PhD диссертаций) для медицинских специалистов из СНГ и ближнего зарубежья!

Типы данных, варианты измерения данных и кодировки

Критически важной темой для понимания статистического раздела при проведении любых фундаментальных и прикладных исследований является понимание того, какие именно данные собирались и фиксировались в процессе работ. Таких типов «данных» в действительности не так много, поэтому прежде чем переходить к описанию данных и тем более их анализу мы предлагаем сперва разобраться с их видами кодировки и ввода.

Существует два основных типа данных, т.н. кодичественные (quantative) и качественные (qualitive) данные. Ключевым отличием между ними является возможность производить арифметические действия с участием таких данных. Если это возможно, то такие данные считаются количественными, если нет, то — качественными.

Количественные или интервальные данные

признаки, количественная мера которых четко определена; наиболее удобный для статистического анализа тип данных.

Количественные признаки могут быть

  • непрерывными (continuous), принимающими любое значение на непрерывной шкале, например, масса тела, температура, биохимические показатели крови; чтобы представить себе такие данные легче запомнить, что непрерывные данные можно измерить с помощью воображаемой линейки, величина деления которой зависит от разрешающей способности Вашего измерительного прибора. Соответственно, массу тела Вы можете измерять в тоннах, килограммах, граммах, микрограммах и так далее с бесконечным количеством знаков после запятой. Такие данные не прерываются (их шкала по сути бесконечна), поэтому Вы имеете возможность измерять их бесконечно точно.
  • дискретными (discrete), принимающие лишь определенные значения из диапазона измерения, обычно целые, например, число рецидивов, число детей в семье, число заболеваний у одного больного, число выкуриваемых сигарет.

Итак, как Вы видите из примеров: 100 кг — 99.67 кг = 0,33 кг и такие выражения имеют четкий математических смысл. Если подобные арифметические манипуляции имеют смысл, то данные называются количественными.

Качественные данные

С качественными данными оказывается невозможными арифметические действия.

  • номинальные (categorical/nominal) – не поддающиеся непосредственному измерению, например, характеристики пациента: диагноз, пол, профессия, семейное положение.
  • дихотомическими (dichotomous) данными называются данные, которые могут быть отнесены только к двум противоположным категориям «да» – «нет», принимающие одно из двух значений (выжил – умер; курит – не курит)
  • порядковые или ранжируемые (ordinal) – эти признаки можно расположить в естественном порядке (ранжировать), но при этом отсутствует количественная мера расстояния между величинами. Примером  являются оценка тяжести состояния пациента, стадия болезни, самооценка состояния здоровья. При этом допускается, что тяжелое течение заболевания «хуже», чем среднетяжелое, а очень тяжелое – «еще хуже», однако нельзя сказать во сколько или на сколько хуже. Можно сказать, что порядковые данные занимают промежуточное положение между количественными и качественными типами. Их можно упорядочить как количественные данные, но над ними нельзя производить арифметические действия, как над качественными данными.

Тип данных диктует необходимость применение определенных инструментов описания данных (описательная статистика), и варинты анаиза этих данных (как выбирать статистический критерий).


Если Вам понравилась статья и оказалась полезной, Вы можете поделиться ею с коллегами и друзьями в социальных сетях:

Электронный журнал Литобзора

Статьи по биостатистике, клинической эпидемиологии,
организации и проведению исследований.

Будьте в курсе -- подписывайтесь!


2016 © (с) НМА Литобзор -- информационное агентство доказательной медицины №1: обзор литературы, райтерские услуги, статистическая обработка данных для исследовательских и маркетинговых проектов в области медицины и фармацевтики