Литература по математическим методам в педагогике литература




Скачать 38.01 Kb.
НазваниеЛитература по математическим методам в педагогике литература
страница3/10
Дата03.02.2016
Размер38.01 Kb.
ТипЛитература
1   2   3   4   5   6   7   8   9   10

Показатель асимметрии (А) вычисляется по формуле:

(22)

Если А = 0, то распределение симметричное; при А>0 в распределении чаще встречаются более низкие значения параметра (левая асимметрия); при А<0 в распределении больше высоких значений (смещение вправо).

Показатель эксцесса (Е) находится по формуле:

(23)

Если Е>0, то имеем преимущественно значения, близкие к ; при Е<0 распределение двухвершинное (одновременно преобладают и более низкие, и более высокие значения по сравнению с ).


СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ


Нулевая гипотеза – это гипотеза об отсутствии различий в исследуемых объектах или явлениях (обычно она обозначается Н0 и называется нулевой, т.к. X1- X2 =0, где X1- X2 – сопоставляемые значения признаков).

Альтернативная (экспериментальная) гипотеза – это гипотеза о значимости различий (Н1), это то, что мы хотим доказать.

Гипотезы бывают «направленными», если в нулевой гипотезе Х1 не превышает Х2, а в Н1: Х1 превышает Х2; и ненаправленные, если в Н0 Х1 не отличается от Х2, а в Н1 – Х1 отличается от Х2.

Проверка гипотез осуществляется с помощью критериев статистической оценки различий.


СТАТИСТИЧЕСКИЕ КРИТЕРИИ


Статистический критерий (СК) – это решающее правило, обеспечивающее надежное поведение, то есть принятие истиной и отклонение ложной гипотезы с высокой вероятностью.

Статистические критерии обозначают также метод расчета определенного числа и само это число.

Когда мы говорим, что достоверность различий определялась по критерию χ2 , то имеем в виду, что использовали метод χ2 для расчета определенного числа.

Зная количество наблюдений (измерений) в исследуемой выборке – n и (или) число степеней свободы – υ, по специальным таблицам находится критическое значение критерия - (СК)кр и сопоставляется с эмпирическим значением – (СК)эмп В большинстве случаев Н0 отвергается (Н1 - принимается), если (СК)эмп > (СК)кр, например, χ2эмп2кр.

К параметрическим относятся те критерии, в формулу расчета которых входят параметры распределения, т.е. , σ, t – критерий Стьюдента, Фишера и др.

К непараметрическим относятся те критерии, которые основаны на оперировании частотами или рангами, но не используются параметры распределения (,σ, …), например, критерии Розенбаума, критерий Т Вилкоксона и др.

Возможности и ограничения указанных критериев приведены в таблице 7.


Таблица 7

Возможности и ограничения указанных критериев

Возможности

критериев

Ограничения, условия

Рекомендуемые

критерии

П а р а м е т р и ч е с к и е к р и т е р и и

Позволяют прямо оценить различия в

средних

Только в двух выборках с распределением

Гаусса

t-критерий

Стьюдента

Позволяет прямо оценить различия в

дисперсиях

Сопоставляются 2

нормальных

распределения

Критерий

Фишера F

Позволяют выявить тенденции измерения признака при изменении условий

(два и более факторов)

Распределения нормальные. Измерения по интервальной шкале (для всех указанных вариантов)

Дисперсионный одно- и двухфакторный

анализ

Н е п а р а м е т р и ч е с к и е к р и т е р и и

Позволяют оценить лишь средние

тенденции

Чаще ли в выборке А встречаются более высокие значения, а в выборке Б - низкие

Критерии Розенбаума (Q), Манна-Уитни (U), φ*

Позволяют оценить лишь различия в диапазонах вариативности признака

Сопоставляются 2 выборки в процентных

долях

Угловое преобразование Фишера - φ*

Позволяют выявить тенденции изменения признака при изменении условий эксперимента

Распределение признака любое (во всех вариантах измерения могут быть в любой шкале)

Критерии тенденций: Джонкира (S),

Пейджа (L)


Из приведенной таблицы видно, что параметрические критерии могут оказаться более «мощными», чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. Непараметрические критерии лишены всех этих ограничений, менее трудоемки, но с их помощью невозможно оценить взаимодействие двух или более факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.


УРОВНИ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ


Уровень значимости – это вероятность того, что мы сочли различия существенны, а они на самом деле случайны. Например, когда мы указываем, что различия достоверны на 5% - ом уровне значимости (α = 0,05), то вероятность того, что они все-таки недостоверны, составляет 0,05.

Уровень значимости – это вероятность отклонения нулевой гипотезы, в то время как она верна. Если вероятность ошибки α, то вероятность правильного решения: 1- α (ее называют доверительной вероятностью γ, т.е. γ =1- α или α + γ=1).

Правило отклонения Н0 и принятия Н1:

    • если (СК)эмп ≥ (СК)кр при α=0,05, то Н0 отклоняется, но мы еще не можем определенно принять Н1;

    • если же (СК)эмп ≥ (СК)кр при α=0,01, то Н0 отклоняется и принимается Н1.

Исключения: для критериев знаков (G), Вилкоксона (Т) и Манна-Уитни (U) устанавливаются обратные соотношения, т.е. (СК)эмп ≤ (СК)кр

При направленной гипотезе используется односторонний критерий, при ненаправленной – двусторонний; во втором случае уровню α= 0,05 соответствует условие α=0,10.

Ошибкой 1-го рода называют ошибку, когда отклоняется Н0, а она верна; 2-го рода – когда приняли Н0, но она неверна.

Мощность критерия – способность выявлять различия, если они есть. Она определяется опытным путем. Более мощным критерием считается и тот критерий, который выявляет различия при меньшем значении α, т.е. СК (α=0,01) более мощный, чем СК (α=0,05).


2. ОБОСНОВАНИЕ ЗАДАЧ И ВЫБОР КРИТЕРИЕВ


Очень часто перед исследователем в психологии и педагогике стоит задача выявления различий между двумя, тремя и более выборками испытуемых. Это может быть, например, задача определения психологических особенностей хронически больных детей по сравнению со здоровыми или различий между работниками государственных предприятий и частных фирм. В последние годы все чаще встает задача выявления психологического портрета специалиста новых профессий: «успешного руководителя», «успешного директора», «успешного политика» и др. Такого рода исследования подразумевают участие двух и более выборок, либо обследуется одна достаточно представительная выборка, а затем внутри нее выделяются группы и их данные по исследованным переменным сопоставляются между собой. В самом простом случае критерием для разделения выборки на «успешных» и «неуспешных» будет средняя величина по показателю успешности. Такое деление считается «грубым». Для более точного результата «успешными» считают только тех, чьи значения превышают среднюю величину не менее чем на ¼ стандартного отклонения, а «неуспешными» - только тех, чьи значения не менее чем на ¼ стандартного отклонения ниже средней величины. Таким образом, при нестрогом разделении испытуемых на группы мы теряем в точности, а при строгом – в количестве испытуемых.

Критерии, которые рассматриваются в данной главе, предполагают, что мы сопоставляем так называемые независимые выборки, то есть две или более выборки, состоящие из разных испытуемых. Решение о выборе того или иного критерия принимается на основе того, сколько выборок сопоставляется и каков их объем.

Например, в Задаче №1 требуется выявить различия в уровне исследуемого признака.

Варианты различий: успевающие и неуспевающие;

профессионалы и «неопытные»;

обученные и необученные

(до заданного уровня) и т.п.

Если выборок 2, то применяют критерий Розенбаума (Q), или Манна-Уитни (U), или φ* (угловое преобразование Фишера).

Если число выборок С≥3 – критерий Джонкира (S) или Крускала-Уоллиса (Н).

Рассмотрим особенности применения указанных критериев.

Критерий Розенбаума

Критерий Розенбаума (Q) используется для оценки различий между двумя выборками (n1 и n2) по уровню признака, измеренного в порядковой шкале. Полученные данные в каждой выборке упорядочиваются по нарастанию (или убыванию) значений (в виде вариационного ряда). В каждой из выборок число объектов (или значений) должно быть не менее 11, причем, n1≈n2. Если n1 ≠ n2, то: |n1 - n2| < 10, если (n1; n2)<50; |n1 - n2| <20, если n1 и n2 [51;100]; n1/n2 <1,5-2,0, если n1 и n2 (в каждой выборке!) > 100.

Ниже приведен алгоритм подсчета критерия Q:

  1. Проверить, выполняются ли ограничения: n1, n2 ≥11, n1 ≈ n2

  2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 – ту, где значения предположительно ниже.

  3. Определить самое высокое (максимальное) значение в выборке 2.

  4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1.

  5. Определить самое низкое (минимальное) значение в выборке 1.

  6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S2.

  7. Подсчитать эмпирическое значение Q по формуле: Q=S1+S2.

  8. По табл. 1 Приложения 1 определить критические значения Q для данных n1 и n2. Если Qэмп равно Q0,05 или превышает его, Н0 отвергается.

  9. При n1, n2 >26 сопоставить полученное эмпирическое значение с Qкр=8 (ρ≤0,05) и Qкр=10 (ρ≤0,01). Если Qэмп превышает или по крайней мере равняется Qкр=8, Н0 отвергается.

Пример подсчета Q. Пусть в экспериментальной группе (ЭГ) численностью n1=14 учащиеся по результатам тестирования набрали от 21 до 36 баллов, а в контрольной (КГ), где n2 = 12 – от 15 до 32. Число учащихся, набравших в ЭГ больше 32б. (это max в КГ), равно S1 = 5 чел. Число учащихся, набравших в КГ меньше 20 б. (это min в ЭГ), равно S2 = 6. Затем вычисляем Qэмп = S1 + S2 = 5+6 = 11 и по таблице Qкр для n1=14 (1-й столбец) и n2 =12 (верхняя строка), находим, что Qкр =7 при α=0,05 и 9 при α=0,01.

Так как Qэмп > Qкр и при α=0,01, то и для ненаправленной гипотезы Н0 отклоняется.

Анализ таблицы для Qкр показывает, что при n1 ≥ 26 и n2 ≥21 для α=0,05 Qкр =7, а при тех же n1 и n2 для α=0,01 Qкр=9.

При n1,n2 ≥26 принимается Qкр (α=0,05)=8, а при α=0,01 Qкр =10.

Критерий Манна-Уитни

Критерий Манна – Уитни (U) позволяет выявлять различия между малыми выборками (n1, n2 ≥3). Верхнее ограничение: n1, n2 ≤60, однако уже при n1, n2 >20 ранжирование становится трудоемким. Учитывая, что таблицы для Uкр очень громоздки и обычно в КГ и ЭГ число испытуемых >20, этот критерий в тестологии не применяется.

Критерий Крускала-Уоллиса

Критерий Крускала-Уоллиса (H) предназначен для оценки различий одновременно между «С» выборками (С≥3) по уровню признака; он позволяет установить изменение уровня без указания направления (>или<). Так как Нкр в таблицах приводятся только для трех выборок объемом ≤5, то в тестологии он не применяется. При n>5 и c>3 используется критерий X2.

Критерий Джонкира

Критерий Джонкира (S) используется для выявления тенденций изменения признака при переходе (сопоставлении результатов) от выборки к выборке (С) при сопоставлении, когда их ≥3.

Так как верхний порог для объема выборок (n≤10), то, хотя 3≤с≤6, критерий S в тестологии применяется редко.

Критерий S основан на способе расчета, близком к принципу критерия Q.

Следующий пример - Задача №2: Оценка достоверности сдвига в значениях исследуемого признака. Какие критерии рекомендуется использовать для оценки достоверности сдвигов?

Под «сдвигами» понимаются достоверные изменения в измеряемых показателях. Сдвиг – это разность между вторым и первым измерениями. Встречаются следующие виды сдвигов:

    • временные, когда сопоставляются показатели, полученные у одних и тех же испытуемых по одним и тем же методикам, но в разное время (например, проведение повторных контрольных мероприятий);

    • ситуационные, когда сопоставляются показатели, полученные одним и тем же методом, но в разных условиях измерения (ситуациях);

    • умозрительный сдвиг, когда сопоставляются показатели в обычных и воображаемых условиях;

    • структурные, когда сопоставляются разные показатели (вербальные и числовые; ранги и баллы и т.д.) одних и тех же испытуемых.

Во всех этих случаях мы имеем дело о сдвигах под влиянием контролируемых или не контролируемых воздействий. С целью установления сдвигов используют экспериментальные группы (в которых используется экспериментальный, т.е. проверяемый фактор) и контрольные (ЭГ и КГ). Они должны быть «уравновешены» по всем значимым для исследования признакам (полу, возрасту, обученности и т.д.), т.е. стратифицированы и репрезентативны. Следует иметь в виду, что добиться (ЭГ)0 ≈(КГ)0 , т.е. idem перед экспериментом практически не возможно (здесь: idem - одинаковый).

В ходе эксперимента мы почти никогда не можем быть уверены, что выявленные различия (сдвиги) объясняются только действием исследуемых факторов, а не различиями между двумя выборками.

Когда, например, у одной группы студентов измеряются «начальный уровень обученности», а «остаточные знания» - у другой, то, строго говоря, сравнивать эти результаты нельзя, хотя часто это делается…Такое сравнение возможно на достаточно больших выборках (при использовании одних и тех же технологий диагностики) в рамках так называемой «эргодической гипотезы», согласно которой среднее по времени, определяемое по формуле:

(1)

где Пi – значение измеряемого параметра (П) в i - й момент времени у отдельного индивидуума, К – число временных интервалов измерения П в течение Т, Т – период эксперимента, приравнивается (заменяется) средним по совокупности у (N) испытуемых этого же параметра –

(2)

Иными словами, смысл эргодической гипотезы в том, что . Такая ситуация встречается тогда, когда, например, уровень обученности конкретному предмету в течении времени Т (это может быть несколько лет, например, при изучении математики или физики) в одной выборке (стратифицированной по какому-то признаку, например, начальному уровню обученности предмету) не усредняется в пределах этого интервала Т (обычно это не возможно из-за отсутствия данных наблюдений), а заменяется средним значением уровня обученности по нескольким выборкам обучаемых, которые изучали этот предмет в течение того же интервала Т. Кстати, в физике и астрофизике часто плодотворно используют эту гипотезу при исследовании «статистических ансамблей» (газ, звезды, галактики). В педагогических исследованиях часто заменяют (и наоборот), не оговаривая, однако, условий и ограничений для такого приема.

Какие критерии рекомендуется использовать для оценки достоверности сдвигов?

Если эксперимент организован только в одной выборке (ЭГ или КГ), то при сопоставлении двух замеров применяется критерии знаков (G) и Вилкоксона (Т). Если число замеров ≥3, то – критерий тенденций Пейджа (L) или (при большом объеме выборки) – Хr2 Фридмана.

При наличии двух групп (ЭГ и КГ) – кроме указанных критериев применяются рассмотренные ранее критерии Розенбаума (Q), Манна – Уитни (U) и Фишера (φ* - угловое преобразование).

Кратко охарактеризуем особенности их применения.
1   2   3   4   5   6   7   8   9   10

Похожие:

Литература по математическим методам в педагогике литература iconКрупнейшие Электронные библиотеки
Альдебаран крупнейшая электронная библиотека on-line. Здесь собрана художественная, учебная и техническая литература и книги различных...
Литература по математическим методам в педагогике литература icon1. Античная литература Апулей
Скандинавская литература 9 авторов, 52 текста; 10. Польская литература 6 авторов, 20 текстов
Литература по математическим методам в педагогике литература iconLidia Zasaviţchi Janna Nikolaev
Всесоюзное совещание по физическим и математическим методам в координационной химии (Кишинев)
Литература по математическим методам в педагогике литература iconРабочая программа 5 класс Литература пояснительная записка
«Литература. 1-11 кл.»/ Под ред. Г. И. Беленького, Ю. И. Лысого, М: «Мнемозина», 2009 год; умк состоит прежде всего из учебника «Литература....
Литература по математическим методам в педагогике литература iconЛитература основная литература общая
Электронный вариант. Саратов, 2005. Патентное законодательство. Юридические акты и комментарий. М.: "Юрид литература", 1994. Справочник...
Литература по математическим методам в педагогике литература iconЛитература второй половины 19 века Литература конца 19 и начала 20 века Литература первой половины 20 века Литература второй половины 20 века Тест имеет следующую структуру: Раздел «Теория литературы»
Тест состоит из 30 заданий, к каждому из которых даны варианты ответов. Задания расположены по принципу возрастания трудности. При...
Литература по математическим методам в педагогике литература iconУчебно-методический комплекс по дисциплине дпп. Ф. 14. Детская литература (уд-04. 13-004) Для специальности 050301 Русский язык и литература
Учебно-методический комплекс дисциплины «Детская литература» раскрывает содержание и методику работы по одной из основных дисциплин...
Литература по математическим методам в педагогике литература iconКазанский государственный университет Научная библиотека им. Н. И. Лобачевского
Литература. Литературоведение. Народное поэтическое творчество. Художественная литература. 20
Литература по математическим методам в педагогике литература iconЛитература: тематический план
Тематическае планы лекционных курсов, практических занятий и экзаменационные вопросы, рекомендуемая литература
Литература по математическим методам в педагогике литература iconСтатья относится к достаточно самостоятельной области математическим методам анализа социологических данных. Основной интерес в ней к математическим вопросам, социологические постановки служат для постановки математических задач.
Орлов А. И. Теория измерений и методы анализа данных // Современная социология — современной России: Сборник статей памяти первого...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib2.znate.ru 2012
обратиться к администрации
Библиотека
Главная страница