Т-тестът е статистически тест, който се използва, за да се определи дали има значителна разлика между средните стойности на две групи или извадки (Kim, 2015: 540). Той се основава на t-разпределението, което е подобно на нормалното разпределение, но има малко по-тежки опашки.
Теоретичната основа на t-теста се корени в концепцията за разпределенията на извадките и теоремата за централната граница (Livingston 2004: 59-60). Централната гранична теорема гласи, че когато се правят независими случайни извадки от популация с крайна средна стойност и стандартно отклонение, разпределението на извадковите средни стойности се приближава към нормалното разпределение с увеличаване на размера на извадката, независимо от формата на разпределението на популацията. Това е така, дори ако самата популация не следва нормално разпределение.
T-тестът използва t-разпределението за сравняване на средните стойности на две групи, като оценява стандартната грешка на разликата между средните стойности на извадката. Формулата за t-статистиката е:
където x1 и x2 са средните стойности на извадката на двете групи, а SE е стандартната грешка на разликата между средните стойности. Стандартната грешка отчита вариативността в рамките на всяка група и размерите на извадките. t-статистиката измерва разликата между средните стойности на извадките в единици стандартна грешка.
t-разпределението се използва, тъй като в практиката често не знаем стандартното отклонение на популацията и трябва да го оценим по данните от извадката. t-разпределението отчита допълнителната несигурност при оценката на стандартното отклонение, като включва степените на свобода, които се основават на размерите на извадките на двете групи.
Степените на свобода определят формата на t-разпределението и влияят върху критичните стойности, използвани за определяне на статистическата значимост. За t-тестове за независими извадки степените на свобода се изчисляват като сумата от размерите на извадките минус две.
Като сравним изчислената t-стойност с критичните стойности от t-разпределението, можем да определим дали наблюдаваната разлика в средните стойности е статистически значима. Ако изчислената t-стойност превишава критичната стойност при избрано ниво на значимост (например 0,05), отхвърляме нулевата хипотеза и заключаваме, че има значима разлика между средните стойности на двете групи (Liu & Wang, 2021: 266).
Като цяло t-тестът осигурява статистическа рамка за сравняване на средните стойности и оценка на значимостта на разликите между две групи, като се вземат предвид размерите на извадките и присъщата на данните променливост.
Пример 1: Сравняване на средните височини на две групи
Да предположим, че се интересувате от сравняване на средните височини на две групи: Събирате измервания на височината на извадка от лица от всяка група. Група А се състои от 30 участници, а група Б - от 35 участници.
За да анализирате данните с помощта на t-тест, трябва да изчислите средния ръст на всяка група (среден ръст на група А и среден ръст на група Б) и да изчислите стандартното отклонение за всяка група. След това ще извършите двуизмерен t-тест, за да определите дали има значителна разлика в средните височини между двете групи. Ако p-стойността е под предварително определеното ниво на значимост (например 0,05), можете да заключите, че има значителна разлика в средните височини, което показва, че двете групи се различават по среден ръст.
Пример 2: Оценка на ефикасността на ново лечение
Да речем, че оценявате ефективността на ново лечение на конкретно заболяване. На случаен принцип разпределяте 50 пациенти в две групи: Група А получава новото лечение, а група Б - плацебо. След определен период на лечение измервате съответната променлива за резултата, например интензивността на болката.
За да анализирате данните с помощта на t-тест, трябва да изчислите средната интензивност на болката за всяка група (средна интензивност на болката за група А и средна интензивност на болката за група В). След това ще извършите t-тест за независими извадки, за да определите дали има значителна разлика в средната интензивност на болката между двете групи. Ако р-стойността е под предварително определеното ниво на значимост (напр. 0,05), можете да заключите, че има значима разлика в интензивността на болката, което предполага, че новото лечение има ефект върху намаляването на болката в сравнение с плацебото.
И в двата примера t-тестът позволява да се сравнят средните стойности на две групи и да се определи дали между тях има значителна разлика. Обикновено се използва, когато имате две независими групи и искате да прецените дали има доказателства в подкрепа на значима разлика между техните средни стойности.