Биометрия (Биологическая статистика) Жукова Анна Анатольевна, к.б.н., доцент кафедры общей экологии и методики преподавания биологии Лекции - 24 ч; Лаб. занятия - 28 ч Источники, рекомендуемые для подготовки к зачету: Конспект лекций и лабораторных занятий Гланц С. Медико-биологическая статистика. – М., 1999. Лакин Г. Ф. Биометрия, 4-е изд. – М., 1990. В. П. Боровиков «STATISTICA для студентов и инженеров». – М., 2001. http://www.statsoft.ru/home/textbook/default.htm www.biometrica.tomsk.ru www.exponenta.ru ЛЕКЦИЯ 1 ЗНАЧЕНИЕ СТАТИСТИЧЕСКИХ МЕТОДОВ В НАУЧНЫХ ИССЛЕДОВАНИЯХ. ТИПЫ ДАННЫХ 1.1. Что такое «статистика»? Как была сделана эта фотография? Как сделать красивую фотографию? Стадии получения и обработки данных Сбор данных; Обработка (анализ); Представление результатов заинтересованным людям. Результаты анализа 22 докторских и 203 кандидатских диссертаций, успешно (!) защищенных в России в последние годы 100 80 60 40 20 0 Корректное Некорректное применение применение методов методов статистики статистики Использование статистических методов в статьях журнала «The American Naturalist», 1890-1990 гг. Цель данного курса Ознакомить с основными современными методами статистики, которые могут использоваться в биологических измерениях Что дает элементарная статистическая грамотность? Возможность познания количественных закономерностей в биологических явлениях и процессах; Основы обработки экспериментальных данных и правила корректного представления их коллегам; Избавление от боязни математически оформленных статей и критический анализ представленных в них данных; Принципы построения математических моделей биологических явлений и процессов. «Статистика»? Статистика занимается изучением данных, описывающих естественную изменчивость. 1.2. Краткая история развития статистики Какие данные нужны были государствам в древности? Сведения о площадях земельных угодий, величине налогов, численности скота и т.п. Современная статистика зародилась в XVII веке по следующим причинам: Государствам по-прежнему необходимо было знать, сколько жителей проживает в стране, сколько из них женщин и мужчин, сколько они платят налогов и т.д. Английские ученые, сделавшие вклад в развитие математической статистики: Уильям Петти (William Petty) Джон Грант (John Graunt). Современная статистика зародилась в XVII веке: В связи с необходимостью предсказания исходов азартных игр стала интенсивно развиваться теория вероятностей. Ученые, внесшие большой вклад в развитие теории вероятностей: Пьер-Симон де Лаплас Карл Фридрих Гаусс XIX век: Френсис Гальтон – «отец» биометрии. Впервые попытался применить методы математической статистики для объяснения биологических явлений. XIX-й век: Карл Пирсон – продолжатель идей Гальтона. Внес большой вклад в развитие методов описательной статистики и корреляционного анализа. XX век: Рональд Фишер – выдающийся статистик 20-го века. Основатель такой важнейшей области, как дисперсионный анализ. 1.3. Типы данных Что такое данные? Данные – это совокупность измерений (наблюдений), выполненных на объектах одной категории по одинаковой схеме. Элементы в совокупности данных называются: «единичное наблюдение», или «отдельное наблюдение», или «варианта» (≠ «вариант»!) Единичные наблюдения Обозначаются хi, где i – порядковый номер в совокупности; «Объем» - количество наблюдений, составляющих совокупность. Обозначается «n» Важные понятия: Переменная (=признак) – то фактическое свойство, которое измеряется в ходе отдельных наблюдений. Важные понятия: «Вариация» – различие между отдельными наблюдениями (от лат. variatio – изменение, колебание); «Вариабельность» - степень различий между наблюдениями. Виды ошибок СИСТЕМАТИЧЕСКИЕ СЛУЧАЙНЫЕ Не поддаются влиянию человека Поддаются коррекции Типы переменных: Количественные (дискретные и непрерывные); Порядковые (=ранговые); Качественные; Производные переменные (индексы, пропорции, проценты, удельные скорости) Примеры производных переменных: Относительные скорости (интенсивности) – отражают динамику того или иного процесса в отношении к единице времени (скорость роста популяции, смертность, продукция фермента и т.п.). 1.4. Генеральная совокупность и выборка Выборка Выборка (sample) совокупность из нескольких значений определенного признака. Генеральная совокупность Генеральная совокупность (population) - все множество объектов определенной категории, существующих в мире. Объем генеральной совокупности обозначается «N» Параметры Параметры – это числовые показатели, характеризующие свойства генеральной совокупности. Наиболее важные параметры: Показатели, описывающие наиболее «характерное» в генеральной совокупности, ее «центральную тенденцию» (средние величины); Показатели, отражающие степень неоднородности членов совокупности (дисперсия, стандартное отклонение и др.). «Тонкости обозначений» Генеральная совокупность Выборка x 2 2 s β b Выборочные показатели должны быть: Несмещенными; Эффективными; Состоятельными Несмещенный выборочный показатель: x1 x2 x3 x4 x5 x6 n n Генеральная совокупность N, n n n n … xn x n n Эффективный выборочный показатель: n Генеральная совокупность N, x Состоятельный выборочный показатель: Генеральная совокупность N, x1 x2 x3 x4 x5 x6 x 1.5. Правила получения данных Подходы к получению данных: Сплошное обследование всей генеральной совокупности; Выборочное обследование. Правила получения данных: Для того, чтобы по выборке можно было судить о свойствах генеральной совокупности необходимо организовать случайный отбор, или рандомизацию («random» – случайный) объектов из генеральной совокупности. Способы рандомизации: Простой случайный, или полностью рандомизированный отбор (randomized sampling). Можно выполнить при помощи таблиц случайных чисел. Простой случайный отбор Способы рандомизации: Стратифицированный отбор (stratified sampling). Предполагает разбиение исследуемой совокупности объектов или пространства на схожие подгруппы или участки (страты). Стратифицированный отбор ГЛИНА ПЕСОК ИЛ Способы рандомизации: Неслучайный (=систематический, плановый) отбор (nonrandom sampling). Объекты для исследований выбираются по определенной, заранее оговоренной схеме. Неслучайный отбор «Репрезентативность»? Репрезентативность – свойство выборки правильно отражать свойства генеральной совокупности. Смещенные выборки??? Смещенные выборки (biased samples) формируются при нарушении случайного отбора вариант из генеральной совокупности. Эксперимент Рональда Фишера: На стол выложили 1200 камней; 12 человек каждый по 3 раза отбирали по 20 «типичных» камней Результат эксперимента Рональда Фишера: Средний вес отобранных камней оказался на 25% выше истинного (66 г против 54 г); ВЫВОД: Человек - очень плохой инструмент для формирования случайных выборок