Podstawy teorii testów. Przedstawienie podstaw teorii testów w kulturze fizycznej

Podstawy teorii testów.  Przedstawienie podstaw teorii testów w kulturze fizycznej
Podstawy teorii testów. Przedstawienie podstaw teorii testów w kulturze fizycznej

Co to jest testowanie

Zgodnie z IEEE Std 829-1983 Testowanie to proces analizy oprogramowania, którego celem jest zidentyfikowanie różnic między jego faktycznie istniejącymi a wymaganymi właściwościami (wada) oraz ocena właściwości oprogramowania.

Zgodnie z GOST R ISO IEC 12207-99 w cyklu życia oprogramowania identyfikowane są m.in. pomocnicze procesy weryfikacji, certyfikacji, wspólnej analizy i audytu. Proces weryfikacji to proces ustalania, czy oprogramowanie działa w pełnej zgodności z wymaganiami lub warunkami zaimplementowanymi we wcześniejszej pracy. Proces ten może obejmować analizę, weryfikację i testowanie (testowanie). Proces atestacji to proces określania kompletności zgodności założonych wymagań, tworzonego systemu lub oprogramowania z ich przeznaczeniem funkcjonalnym. Proces wspólnej analizy to proces oceny stanów i, jeśli to konieczne, wyników pracy (produktów) nad projektem. Proces audytu to proces ustalania zgodności z wymaganiami, planami i warunkami umowy. Procesy te składają się na to, co powszechnie nazywa się testowaniem.

Testowanie opiera się na procedurach testowych z określonymi danymi wejściowymi, warunkami początkowymi i oczekiwanymi wynikami zaprojektowanymi w określonym celu, takim jak testowanie pojedynczego programu lub weryfikacja zgodności z określonym wymaganiem. Procedury testowe mogą testować różne aspekty działania programu, od prawidłowego działania pojedynczej funkcji po odpowiednie spełnienie wymagań biznesowych.

Podczas realizacji projektu należy rozważyć, zgodnie z jakimi normami i wymaganiami produkt będzie testowany. Jakie narzędzia (jeśli w ogóle) zostaną użyte do znalezienia i udokumentowania wykrytych wad. Jeśli pamiętasz o testowaniu od samego początku projektu, testowanie tworzonego produktu nie przyniesie żadnych przykrych niespodzianek. Oznacza to, że jakość produktu będzie prawdopodobnie dość wysoka.

Cykl życia produktu i testowanie

Coraz częściej w naszych czasach stosuje się iteracyjne procesy wytwarzania oprogramowania, w szczególności technologii RUP - racjonalny ujednolicony proces(rys. 1). Korzystając z tego podejścia, testowanie przestaje być procesem „niestandardowym”, który rozpoczyna się po napisaniu przez programistów całego niezbędnego kodu. Praca nad testami rozpoczyna się już na początkowym etapie identyfikacji wymagań dla przyszłego produktu i jest ściśle zintegrowana z bieżącymi zadaniami. A to stawia przed testerami nowe wymagania. Ich rola nie ogranicza się do jak najpełniejszego i jak najwcześniejszego identyfikowania błędów. Powinni oni być zaangażowani w ogólny proces identyfikowania i radzenia sobie z najistotniejszymi zagrożeniami projektowymi. Aby to zrobić, dla każdej iteracji określany jest cel testu i metody jego osiągnięcia. A na końcu każdej iteracji ustalane jest, w jakim stopniu udało się osiągnąć ten cel, czy potrzebne są dodatkowe testy, czy należy zmienić zasady i narzędzia przeprowadzania testów. Z kolei każda wykryta wada musi przejść przez swój własny cykl życia.

Ryż. 1. Cykl życia produktu zgodnie z RUP

Testowanie odbywa się zwykle w cyklach, z których każdy ma określoną listę celów i zadań. Cykl testowy może pokrywać się z iteracją lub odpowiadać określonej jego części. Zazwyczaj cykl testowania jest przeprowadzany dla konkretnej kompilacji systemu.

Cykl życia oprogramowania składa się z serii stosunkowo krótkich iteracji (rys. 2). Iteracja to pełny cykl rozwojowy prowadzący do wydania produktu końcowego lub jego zredukowanej wersji, która rozwija się od iteracji do iteracji, aby ostatecznie stać się kompletnym systemem.

Każda iteracja obejmuje co do zasady zadania planowania pracy, analizy, projektowania, wdrażania, testowania i oceny uzyskanych wyników. Jednak relacje między tymi zadaniami mogą się znacznie różnić. Zgodnie ze stosunkiem różnych zadań w iteracji są one pogrupowane w fazy. Pierwsza faza – Incepcja – skupia się na zadaniach analitycznych. Iteracje drugiej fazy - Development - skupiają się na projektowaniu i testowaniu kluczowych rozwiązań projektowych. Trzecia faza - Build - ma największy udział w zadaniach programistycznych i testowych. A w ostatniej fazie - Transfer - zadania testowania i przekazania systemu Klientowi są rozwiązywane w największym stopniu.

Ryż. 2. Iteracje cyklu życia oprogramowania

Każda faza ma swoje własne cele w cyklu życia produktu i jest uważana za zakończoną, gdy cele te zostaną osiągnięte. Wszystkie iteracje, z wyjątkiem, być może, iteracji fazy Incepcji, kończą się stworzeniem działającej wersji opracowywanego systemu.

Kategorie testowe

Testy znacznie różnią się zadaniami rozwiązywanymi za ich pomocą oraz stosowaną techniką.

Kategorie testowe Opis kategorii Rodzaje testów
Bieżące testy Zestaw testów przeprowadzonych w celu określenia kondycji dodanych nowych funkcji systemu.
  • Test naprężeń;
  • testowanie cyklu biznesowego;
  • test naprężeń.
Testy regresji Celem testów regresji jest sprawdzenie, czy dodatki do systemu nie zmniejszyły jego możliwości, tj. testowanie odbywa się zgodnie z wymaganiami, które zostały już spełnione przed dodaniem nowych funkcji.
  • Test naprężeń;
  • testowanie cyklu biznesowego;
  • test naprężeń.

Testowanie podkategorii

Testowanie podkategorii Opis rodzaju badania Testowanie podtypów
Test naprężeń Służy do testowania wszystkich funkcji aplikacji bez wyjątku. W tym przypadku kolejność funkcji testowania nie ma znaczenia.
  • testy funkcjonalności;
  • testowanie interfejsu;
  • testowanie baz danych
Testowanie cyklu biznesowego Służy do testowania funkcji aplikacji w kolejności ich wywoływania przez użytkownika. Na przykład imitacja wszystkich działań księgowego przez 1 kwartał.
  • testowanie jednostkowe (testowanie jednostkowe);
  • testy funkcjonalności;
  • testowanie interfejsu;
  • testowanie baz danych.
Test naprężeń

Używany do testowania

Wydajność aplikacji. Celem tego testowania jest określenie ram dla stabilnego działania aplikacji. Podczas tego testu wywoływane są wszystkie dostępne funkcje.

  • testowanie jednostkowe (testowanie jednostkowe);
  • testy funkcjonalności;
  • testowanie interfejsu;
  • testowanie baz danych.

Rodzaje testów

Testów jednostkowych (testy jednostkowe) - ten typ polega na testowaniu poszczególnych modułów aplikacji. Aby uzyskać maksymalny wynik, testy przeprowadzane są równolegle z rozwojem modułów.

Testy funkcjonalności - Celem tego testowania jest upewnienie się, że element testu działa prawidłowo. Sprawdzana jest poprawność nawigacji po obiekcie, wprowadzanie, przetwarzanie i wyprowadzanie danych.

Testowanie baz danych - sprawdzanie działania bazy danych podczas normalnej pracy aplikacji, w momentach przeciążenia oraz w trybie wielu użytkowników.

Testów jednostkowych

W przypadku programowania obiektowego zwykłą organizacją testów jednostkowych jest testowanie metod każdej klasy, następnie klasy każdego pakietu i tak dalej. Stopniowo przechodzimy do testowania całego projektu, a poprzednie testy to testy regresji.

Dokumentacja wyjściowa tych testów obejmuje procedury testowe, dane wejściowe, kod wykonujący test oraz dane wyjściowe. Poniżej znajduje się widok dokumentacji wyjściowej.

Testy funkcjonalności

Testowanie funkcjonalne obiektu testowego jest planowane i przeprowadzane w oparciu o wymagania testowe określone na etapie definiowania wymagań. Wymaganiami są reguły biznesowe, diagramy przypadków użycia, funkcje biznesowe oraz, jeśli są dostępne, diagramy aktywności. Celem testów funkcjonalnych jest sprawdzenie, czy opracowane komponenty graficzne spełniają określone wymagania.

Ten rodzaj testowania nie może być w pełni zautomatyzowany. W związku z tym dzieli się na:

  • Testowanie automatyczne (do wykorzystania w przypadku, gdy dane wyjściowe mogą być zweryfikowane).

Cel: testowanie wprowadzania, przetwarzania i wyprowadzania danych;

  • Testowanie ręczne (w innych przypadkach).

Cel: Testowana jest poprawność spełnienia wymagań użytkownika.

Konieczne jest wykonanie (odtworzenie) każdego z przypadków użycia, używając zarówno wartości prawidłowych, jak i celowo błędnych, aby potwierdzić prawidłowe działanie, według następujących kryteriów:

  • produkt odpowiednio reaguje na wszystkie dane wejściowe (oczekiwane wyniki są wyświetlane w odpowiedzi na poprawnie wprowadzone dane);
  • produkt odpowiednio reaguje na błędnie wprowadzone dane (pojawiają się odpowiednie komunikaty o błędach).

Testowanie baz danych

Celem tego testu jest upewnienie się, że metody dostępu do bazy danych są niezawodne, poprawnie wykonywane, bez naruszania integralności danych.

Należy konsekwentnie używać jak największej liczby wywołań bazy danych. Stosowane jest podejście, w którym test jest skomponowany w taki sposób, aby „obciążyć” bazę sekwencją zarówno wartości prawidłowych, jak i celowo błędnych. Określana jest reakcja bazy danych na wprowadzanie danych oraz szacowane są przedziały czasowe ich przetwarzania.

Matematyczne podstawy teorii projektowania testów

Rodzaje obiektów testowych

Wyróżnia się dwie istotnie różne formy zadań: zamknięte (gdy podmiot ma możliwość wyboru odpowiedzi) i otwarte (obiekt sam musi uzyskać odpowiedź). Z kolei zadania otwarte można podzielić na dwie grupy:

    zadania z krótką odpowiedzią regulowaną, których sformułowanie powinno generować tylko jedną zaplanowaną przez dewelopera odpowiedź;

    zadania z dowolnie skonstruowaną odpowiedzią, które nie mają żadnych ograniczeń co do treści i formy prezentacji odpowiedzi.

Istnieje pięć głównych typów zadań. Wszystkie inne typy są odmianami lub kombinacjami tych pięciu typów.

    Zadanie z wyborem. Tekst zadania składa się z pytania. Do wyboru dostępnych jest kilka opcji odpowiedzi, z których jedna lub więcej jest poprawnych.

    Zadanie dla dodatku. W treści zadania brakuje pewnego fragmentu tekstu, co jest sygnalizowane podkreśleniem (lub kilkoma podkreślnikami tej samej długości, jeśli brakuje kilku słów). W dowolnej części tekstu może być luka, ale zaleca się, aby zrobić to na końcu. W odpowiedzi podmiot musi wpisać brakujące słowa.

    Zadanie ustalenia prawidłowej kolejności.

    Pasujące zadanie. Brzmienie zadania zawiera dwie listy. Po lewej stronie z reguły podane są elementy zbioru zawierającego stwierdzenie problemu, po prawej elementy do wybrania. Elementy lewego zestawu są ponumerowane, prawe oznaczono literami. Pożądane jest, aby drugi zestaw zawierał więcej elementów niż pierwszy zestaw. W takim przypadku każdy element pierwszego zestawu odpowiada jednemu lub większej liczbie elementów drugiego zestawu.

    Zadanie ze szczegółową odpowiedzią.

Etapy rozwoju testów

    Formułowanie celu i przedmiotu badań.

Kogo, co i dlaczego należy przetestować

    Opracowanie treści testu.

Badanie wymagań standardu edukacyjnego, treści podręczników.

Opracowanie specyfikacji testu:

    Wyróżnianie sekcji (tematów) i ich procentu w teście

    Wybór typów pracy

    Określenie poziomów opanowania wiedzy i umiejętności:

    1 poziom

    Znajomość definicji podstawowych pojęć dyscypliny, a także podstawowych stwierdzeń o metodach dyscypliny

    2 poziom

    Znajomość podstawowych wzorów i algorytmów; umiejętność ich zastosowania przy rozwiązywaniu standardowych problemów

    Poziom 3

    Zastosowanie zdobytej wiedzy do rozwiązywania nietypowych problemów

  1. Wyznaczenie przybliżonej liczby zadań w teście i rozkład tej liczby według rodzajów zadań.

    Opracowanie zadań.

Ponieważ pierwsza wersja testu powinna ujawnić mankamenty zadań (w tym zaproponowane dystraktory), to w każdym zadaniu proponowano jak największą liczbę dystraktorów, aby przy ich uśmiercaniu była ich wystarczająca liczba.

    Ekspertyza surowego ciasta.

Celem badania jest wykrycie i poprawienie błędnych i niezrozumiałych sformułowań. W efekcie część zadań może zostać usunięta z testu (dlatego zalecane są zadania).

    Aprobata.

    Obliczanie charakterystyk zadań i testów.

Na podstawie wyników testów obliczane są następujące charakterystyki statystyczne zadań i testów.

Zakres poszczególnych punktów mierzy odległość, w jakiej zmieniają się wszystkie wartości wskaźników w rozkładzie (poszczególne punkty).

Z rzadki selektywny(przeciętny) za sumę poszczególnych punktów NS 1 , NS 2 , …, NS K Grupa K obiekty testowe są obliczane według wzoru

.

Liczyć zmienność na podstawie obliczenia odchyleń wartości poszczególnych wskaźników od średniej arytmetycznej w rozkładzie:

.

Niska wariancja wskazuje na niską jakość testu, ponieważ słaba zmienność wyników wskazuje na słabe zróżnicowanie badanych ze względu na poziom wyszkolenia. Zbyt duża wariancja jest typowa dla przypadku, gdy wszyscy studenci różnią się liczbą wykonanych zadań, co również wymaga powtórki testu.

Obliczenie charakterystyki testu kończy się oceną rzetelności testu. Aby obliczyć współczynnik bezpieczeństwa, możesz użyć wzoru Współczynnik Kudera-Richardsona(tylko w przypadku, gdy wszystkie wagi zadań są równe jeden):

.

W celu jakościowej oceny rzetelności testu przez wartość współczynnika należy posłużyć się poniższą tabelą:

Wartość współczynnika bezpieczeństwa

Ocena niezawodności

niedostateczny

zadowalający

świetny

Ocena trudności j-tego zadania obliczone według wzoru

.

Zwróć uwagę, że im łatwiejsze zadanie, tym większy odsetek poprawnych odpowiedzi na nie ( P J), więc bardziej naturalne byłoby interpretowanie tego udziału jako łatwości zadania. W teście, który jest dobrze wyważony pod względem trudności, powinno być kilka trudnych zadań, kilka łatwych, ale większość zadań powinna mieć trudności od 0,3 do 0,7; jednocześnie pożądane jest, aby zadania były ułożone w kolejności ich trudności.

Ważność pozycji testowej zależy od stopnia zgodności zadania z celem zróżnicowania przedmiotów. W tym celu wyznacza się współczynniki korelacji oceny zadania z wynikiem całego testu. Odbywa się to za pomocą współczynnika korelacji według wzoru

,

gdzie x i wynik testu i badany, Y i wynik i przedmiot testu dla zadania. Należy zauważyć, że w przypadku dychotomicznej oceny zadania obliczenie współczynnika jest nieco uproszczone. Gdyby r< 0, то задание следует удалить из теста, т. к. в нем побеждают слабые ученики, а сильные выбирают неверный ответ либо пропускают задание при выполнении теста. Положительные значения, но близкие к нулю (незначимые), указывают на низкую прогностическую способность задания теста; такие задания требуют доработки содержания.

Pokazuje zdolność do rozróżniania najlepszych i najgorszych obiektów testowych współczynnik zróżnicowania(lub wskaźnik dyskryminacji) zadania. Najprostszym sposobem obliczenia takiego wskaźnika jest metoda grupy kontrastów i jest następująca. Z całej grupy badanych wyróżnia się pewna część najlepszych według wyników testu badanych (nazwiemy je silną podgrupą) i taka sama liczba najgorszych (słaba podgrupa). Następnie dla każdej z tych podgrup obliczany jest odsetek poprawnych odpowiedzi w podgrupie. Oznaczmy przez P 1 J udział poprawnych odpowiedzi na J-te zadanie w silnej podgrupie i po P 0 J- udział poprawnych odpowiedzi w podgrupie słabej. Następnie indeks dyskryminacyjny i-te zadanie określa wzór:

(r nie) J = p 1 JP 0 J .

Dla zadania, z którym poradziły sobie wszystkie silne podmioty, a żaden słaby, wskaźnik dyskryminacyjny r dis będzie równe 1; w tym przypadku zadanie ma maksymalny efekt różnicujący. Dla zadania, z którym poradziły sobie wszystkie słabe podmioty, a żaden z silnych nie poradził sobie, wskaźnik dyskryminacji wyniesie –1. W pozostałych przypadkach indeks przyjmie wartości od –1 do 1. Zadania o zerowych i ujemnych wartościach indeksu dyskryminacji słabo różnicują uczniów, dlatego należy je usunąć z testu. Jeśli wskaźnik jest dodatni, ale mniejszy niż 0,2, to takie zadanie wymaga dokładnej analizy treści.

Zgodnie z tymi cechami część zadań może zostać usunięta z testu, część podlega korekcie. Następnie kroki 5, 6 należy powtórzyć.

Wzory do obliczania prawdopodobieństwa zgadywania

Podczas kompilowania testu musisz określić, ile odpowiedzi należy udzielić na każde pytanie, aby prawdopodobieństwo pomyślnego zdania testu przez zwykłe zgadywanie poprawnych odpowiedzi było mniejsze niż 0,05 (tj. mniej niż 5%). Test zostanie uznany za udany, jeśli zdający odpowie poprawnie przynajmniej na: Q% pytań. Jeśli test obejmuje n pytania, wówczas do obliczenia prawdopodobieństwa „zgadywania pomyślnie” stosuje się następujący wzór:

,

gdzie m- liczba odpowiedzi udzielonych na każde pytanie.

W przypadku, gdy liczba proponowanych odpowiedzi na pytania w różnych zadaniach jest różna, formuła ma bardziej złożoną postać:

,

gdzie - prawdopodobieństwo odgadnięcia odpowiedzi na J pytania, które oblicza się w następujący sposób. Niech wszystkie pytania w teście zostaną podzielone na: r grup, tak aby pytania o tym samym prawdopodobieństwie zgadywania zostały połączone w jedną grupę. Oznaczamy P i , 0< P i <1 - вероятность угадывания и k i - liczba pytań w i- ta grupa (
), oraz

.

Następnie dla J z
do N:

,

gdzie T r = J  (T 1 + T 2 +…+ T r-1 i jeśli T r > k r, wtedy rozważymy
= 0 .

Przykłady.

N = 10, Q = 2/3: m = 2, P<0,2; m=3, P<0,02; m=4, P<0,004

Literatura

    Chelyshkova M. B. Teoria i praktyka projektowania testów pedagogicznych: Podręcznik. - M .: Logos, 2002 .-- 432 s.

    Malygin A. A., Svettsov V. I., Shchanitsina S. V. Praktyczne zalecenia dotyczące przygotowania materiałów kontrolno-pomiarowych: Metoda. instrukcja / Iwan. stan chem.-technol. nie-t. - Iwanowo, 2005 .-- 30 pkt.

    Jak skomponować test // Slayer K. Fantazje matematyczne. - M .: Mir, 1993 .-- s. 116-118.


Kluczowe pytania: Test jako narzędzie pomiarowe. Podstawowe teorie testowania. Funkcje, możliwości i ograniczenia testowania. Zastosowanie testów w ocenie personelu. Zalety i wady stosowania testów. Formy i rodzaje pozycji testowych. Technologia budowy zadań. Ocena jakości testu. Wiarygodność i aktualność. Oprogramowanie do tworzenia testów. 2




Test jako narzędzie pomiarowe Podstawowe pojęcia w testologii: pomiar, test, treść i forma zadań, wiarygodność i trafność wyników pomiarów. Ponadto testologia wykorzystuje takie koncepcje nauk statystycznych, jak próba i populacja ogólna, średnie, zmienność, korelacja, regresja itp. 4




Zadanie testowe to efektywna dydaktycznie i technologicznie jednostka materiału kontrolnego, część testu spełniająca wymagania czystości treści (lub jednowymiarowości), poprawności merytorycznej i logicznej, poprawności formy, akceptowalności geometryczny obraz zadania. 6




Tradycyjny test to ustandaryzowana metoda diagnozowania poziomu i struktury gotowości. W takim teście wszyscy badani odpowiadają na te same zadania, w tym samym czasie, na tych samych warunkach i na tych samych zasadach oceniania odpowiedzi. Aby osiągnąć cel testowania, można stworzyć niezliczone testy, a wszystkie z nich mogą odpowiadać osiągnięciu danego zadania. osiem


Professiogram (od Lat. Professio specjalność + Gramma record) to system znaków opisujących dany zawód, a także wykaz norm i wymagań stawianych pracownikowi w tym zawodzie lub specjalności. W szczególności profesjogram może zawierać listę cech psychologicznych, które muszą spełniać przedstawiciele określonych grup zawodowych. dziewięć


Główne teorie testowania Pierwsze prace naukowe dotyczące teorii testów pojawiły się na początku XX wieku na styku psychologii, socjologii, pedagogiki i innych tzw. nauk behawioralnych. Psycholodzy zagraniczni nazywają tę naukę Psychometriką, a nauczyciele – pomiarem edukacyjnym. Niezmącona ideologią i polityką interpretacja nazwy „testologia” jest prosta i przejrzysta: nauka testowania. dziesięć


Pierwszy etap - prehistoria - od starożytności do końca XIX wieku, kiedy rozpowszechniły się przednaukowe formy kontroli wiedzy i umiejętności; drugi okres, klasyczny, trwał od początku lat 20. do końca lat 60., w trakcie którego powstała klasyczna teoria testów; okres trzeci – technologiczny – który rozpoczął się w latach 70-tych – to czas opracowywania metod adaptacyjnego testowania i nauczania, metodyki efektywnego opracowywania testów i pozycji testowych do oceny parametrycznej przedmiotów poprzez mierzalną jakość utajoną. jedenaście


Funkcje, możliwości i ograniczenia testowania Testy stosowane w selekcji mają na celu uzyskanie portretu psychologicznego kandydata, ocenę jego możliwości oraz wiedzy i umiejętności zawodowych. Testy pozwalają porównać kandydatów między sobą lub ze standardami, czyli idealnego kandydata. Testy służą do mierzenia cech potrzebnych danej osobie do efektywnego wykonywania pracy. Niektóre testy są zaprojektowane w taki sposób, że pracodawca sam administruje testami i oblicza wyniki. Inne wymagają usług doświadczonych konsultantów, aby zapewnić ich prawidłowe zastosowanie. 12


Ograniczenia w stosowaniu testów wiążą się - z ich kosztownym administrowaniem; - z możliwością oceny zdolności człowieka; - testy są bardziej skuteczne w przewidywaniu powodzenia w pracy zawierającej krótkoterminowe zadania zawodowe i nie są zbyt wygodne w przypadkach, gdy zadania do rozwiązania w pracy trwają kilka dni lub tygodni. 13








2. Stosowana terminologia powinna być dobierana w oparciu o konkretną grupę docelową. Niezbędne jest również wykluczenie zbędnych artykułów lub artykułów zawierających dwa lub więcej pytań, ponieważ czasami dezorientują one respondenta i utrudniają interpretację. 17


3. Aby spełnić wszystkie te wymagania, należy przejrzeć cały bank pytań artykuł po artykule i przeanalizować, jakiemu celowi służy każdy z nich. Na przykład, jeśli projekt ma na celu zmierzenie zdolności analitycznych stażystów księgowych, warto zastanowić się, co w tym przypadku oznacza „zdolność analityczna”. osiemnaście




5. Po wybraniu pytań i formatów punktacji należy je przekonwertować na format przyjazny dla użytkownika, z jasno napisanymi instrukcjami i przykładowymi pytaniami; aby kandydaci do testów w pełni rozumieli, czego się od nich wymaga. 20


6. Bardzo często na tym etapie rozwoju test zawiera więcej pytań niż to konieczne. Według niektórych szacunków, trzy razy więcej, niż pozostanie w końcowym systemie testowym lub pomiarowym. Pierwszym środkiem byłoby wtedy przetestowanie projektu testu na stosunkowo dużej próbie istniejących pracowników, aby upewnić się, że wszystkie pytania są zrozumiałe. 21


7. Testy określające wiedzę zwykle zaczynają się od prostych pytań, stopniowo stając się trudniejsze pod koniec. Gdy testy są zaprojektowane do mierzenia postaw i cech osobowości, pomocne może być zmienianie artykułów o negatywnych i pozytywnych sformułowaniach, aby uniknąć nieprzemyślanych odpowiedzi. 22


8. Ostatnim krokiem jest zastosowanie testu na szerokiej reprezentatywnej próbie w celu ustalenia standardów wydajności, rzetelności i trafności, zanim zostanie on wykorzystany jako narzędzie selekcji. Ponadto należy określić rzetelność testu, aby upewnić się, że nie dyskryminuje on żadnej podgrupy populacji (np. różnic etnicznych). 23


Ocena jakości testów Aby metody selekcji były skuteczne, muszą być rzetelne, trafne i rzetelne. Rzetelność metody doboru charakteryzuje się brakiem podatności na systematyczne błędy pomiaru, czyli jej spójnością w różnych warunkach. 24


W praktyce rzetelność oceniania uzyskuje się porównując wyniki dwóch lub więcej podobnych testów przeprowadzonych w różne dni. Innym sposobem na zwiększenie pewności jest porównanie wyników kilku alternatywnych metod selekcji (np. test i rozmowa kwalifikacyjna). Jeśli wyniki są podobne lub takie same, można je uznać za prawidłowe. 25


Rzetelność oznacza, że ​​przeprowadzone pomiary dadzą taki sam wynik jak poprzednie, czyli na wyniki oceny nie mają wpływu czynniki zewnętrzne. Trafność oznacza, że ​​ta metoda dokładnie mierzy to, do czego jest przeznaczona. Maksymalna możliwa dokładność informacji uzyskanych specjalnie opracowanymi metodami w badaniach naukowych jest ograniczona czynnikami technicznymi i nie przekracza 0,8. 26


W praktyce doboru kadr zauważa się, że rzetelność różnych metod oceny lokuje się w przedziałach: 0,1 – 0,2 – wywiad tradycyjny; 0,2 - 0,3 - zalecenia; 0,3 - 0,5 - testy zawodowe; 0,5 - 0,6 - wywiad ustrukturyzowany, wywiad kompetencyjny; 0,5 - 0,7 - testy poznawcze i osobowościowe; 0,6 - 0,7 - podejście oparte na kompetencjach (assessment center). 27


Rozsądność odnosi się do stopnia, w jakim dany wynik, metoda lub kryterium „przewiduje” przyszłe wyniki badanej osoby. Ważność metod odnosi się do wniosków wyciągniętych z konkretnej procedury, a nie do samej procedury. Oznacza to, że sama metoda selekcji może być wiarygodna, ale może nie odpowiadać konkretnemu zadaniu: pomiar nie jest wymagany w tym przypadku. 28


Oprogramowanie do opracowywania testów W praktyce krajowej prezentowane są różne złożone programy z modułem „Psychodiagnostyka”, na przykład program „1C: Zarządzanie wynagrodzeniami i personelem 8.0” z modułem „Psychodiagnostyka”, opracowany we współpracy z grupą nauczyciele Katedry Psychologii Osobowości i Psychologii Ogólnej Wydziału Psychologii Uniwersytetu Moskiewskiego M.V. Lomonosov pod kierunkiem dr psycho. Nauki, prof. A. N. Gusiewa. Symulator szkoleniowy do rozwoju systemów oceny personelu i adaptacji metod badawczych Wydziału Psychologii TSU, również opracowany na podstawie „1C: Enterprise 8.2” przez Personnel Soft. 29


Literatura: Dobór i rekrutacja personelu: technologie testowania i oceny / Dominic Cooper, Ivan T. Robertson, Gordon Tinline. - M., wydawnictwo „Wierszyna, - 156 s. Psychologiczne wsparcie aktywności zawodowej: teoria i praktyka / Wyd. prof. G. S. Nikiforova. - SPb.: Rech, - 816 s. trzydzieści

ROZDZIAŁ 3. STATYSTYCZNE PRZETWARZANIE WYNIKÓW BADAŃ

Statystyczne przetwarzanie wyników testów pozwala z jednej strony na obiektywne określenie wyników testów, z drugiej na ocenę jakości samego testu, zadań testowych, w szczególności ocenę jego rzetelności. W klasycznej teorii testów wiele uwagi poświęca się problemowi niezawodności. Ta teoria nie straciła na aktualności w chwili obecnej. Pomimo pojawienia się bardziej nowoczesnych teorii, teoria klasyczna nadal się trzyma.

3.1. PODSTAWOWE POSTANOWIENIA KLASYCZNEJ TEORII BADAŃ

3.2. MATRYCA WYNIKÓW TESTU

3.3. GRAFICZNA REPREZENTACJA PUNKTÓW TESTOWYCH

3.4. ŚRODKI TRENDU CENTRALNEGO

3.5. NORMALNA DYSTRYBUCJA

3.6. DYSPERSJA WYNIKÓW TESTÓW

3.7. MACIERZ KORELACJI

3.8. WIARYGODNOŚĆ TESTU

3.9. WAŻNOŚĆ BADANIA

LITERATURA

PODSTAWOWE POSTANOWIENIA KLASYCZNEJ TEORII BADAŃ

Twórcą Klasycznej teorii testów psychicznych jest słynny brytyjski psycholog, autor analizy czynnikowej, Charles Edward Spearman (1863-1945) 1. Urodził się 10 września 1863 roku i przez jedną czwartą życia służył w armii brytyjskiej. Z tego powodu doktoryzował się dopiero w wieku 41 lat. Spearman prowadził pracę doktorską w Lipskim Laboratorium Psychologii Eksperymentalnej pod kierunkiem Wilhelma Wundta. W tym okresie Charles Spearman był pod silnym wpływem prac Francisa Galtona nad badaniem inteligencji człowieka. Uczniami Charlesa Spearmana byli R. Cattell i D. Wechsler. Wśród jego zwolenników są A. Anastasi, J.P. Guilford, P. Vernon, C. Burt, A. Jensen.

Wielki wkład w rozwój klasycznej teorii testów wniósł Lewis Guttman (Louis Guttman, 1916-1987) 3.

Kompleksowo i kompletnie klasyczna teoria testów została po raz pierwszy przedstawiona w fundamentalnej pracy Harolda Gulliksena (Gulliksen H., 1950) 4. Od tego czasu teoria nieco się zmieniła, w szczególności poprawiono aparat matematyczny. Klasyczna teoria testów we współczesnym ujęciu jest podana w książce Crocker L., Aligna J. (1986) 5. Wśród badaczy krajowych pierwszy opis tej teorii podał V. Avanesov (1989) 6. W pracy M.B. Chelyshkova. (2002) 7 dostarcza informacji na temat statystycznego uzasadnienia jakości testu.

Klasyczna teoria testów opiera się na następujących pięciu głównych punktach.

1. Uzyskany empirycznie wynik pomiaru (X) jest sumą prawdziwego wyniku pomiaru (T) i błędu pomiaru (E) 8:

X = T + E (3.1.1)

Wartości T i E są zwykle nieznane.

2. Prawdziwy wynik pomiaru można wyrazić jako matematyczne oczekiwanie E (X):

3. Korelacja składowych prawdziwych i błędnych dla zbioru podmiotów jest równa zeru, czyli ρ TE = 0.

4. Wadliwe elementy dowolnych dwóch testów nie są skorelowane:

5. Wadliwe elementy jednego testu nie korelują z prawdziwymi elementami żadnego innego testu:

Ponadto podstawą klasycznej teorii testów są dwie definicje - testy równoległe i testy równoważne.

Testy RÓWNOLEGŁE muszą spełniać wymagania (1-5), prawdziwe składniki jednego testu (T 1) muszą być równe prawdziwym składnikom drugiego testu (T 2) w każdej próbie osób odpowiadających na oba testy. Zakłada się, że T 1 = T 2 i dodatkowo równe wariancje s 1 2 = s 2 2.

Testy równoważne muszą spełniać wszystkie wymagania testów równoległych, z wyjątkiem jednej rzeczy: rzeczywiste składniki jednego testu nie muszą być równe rzeczywistym elementom innego testu równoległego, ale muszą różnić się o tę samą stałą z.

Warunek równoważności dwóch testów jest napisany w następujący sposób:

gdzie c 12 jest stałą różnic między wynikami pierwszego i drugiego testu.

Na podstawie powyższych zapisów konstruuje się teorię rzetelności testów 9,10.

to znaczy wariancja uzyskanych wyników testu jest równa sumie wariancji składników prawdziwych i fałszywych.

Przepiszmy to wyrażenie w następujący sposób:

(3.1.3)

Prawa strona tej równości reprezentuje wiarygodność testu ( r). Zatem wiarygodność testu można zapisać jako:

Na podstawie tego wzoru zaproponowano następnie różne wyrażenia, aby znaleźć współczynnik rzetelności testu. Jego najważniejszą cechą jest wiarygodność testu. Jeśli wiarygodność jest nieznana, wyniki testu nie mogą być interpretowane. Wiarygodność testu charakteryzuje jego dokładność jako przyrządu pomiarowego. Wysoka niezawodność oznacza wysoką powtarzalność wyników badań w tych samych warunkach.

W klasycznej teorii testów najważniejszym problemem jest ustalenie prawdziwego wyniku testu badanego (T). Wynik testu empirycznego (X) zależy od wielu warunków – poziomu trudności zadań, poziomu przygotowania badanych, liczby zadań, warunków testowania itp. W grupie silnych, dobrze wytrenowanych osób wyniki testu będą generalnie lepsze. niż w grupie osób słabo wyszkolonych. W związku z tym kwestia wielkości miary trudności zadań w ogólnej populacji badanych pozostaje otwarta. Problem polega na tym, że prawdziwe dane empiryczne są uzyskiwane na wcale nie losowych próbach badanych. Z reguły są to grupy studyjne, czyli zespół studentów, którzy dość silnie oddziałują na siebie w procesie uczenia się i uczą się w warunkach, które często się nie powtarzają dla innych grup.

Odnaleźć s E z równania (3.1.4)

Tutaj zależność dokładności pomiaru od odchylenia standardowego jest pokazana w postaci jawnej s X i na wiarygodność testu r.

RAPORT

student 137 gr. Iwanowa I.

o badaniu skuteczności metod szkoleniowych
z wykorzystaniem metod statystyki matematycznej

Sekcje raportu zostały sporządzone zgodnie z szablonami podanymi w niniejszym podręczniku na końcu każdego etapu gry. Sprawozdania z odczytów przechowywane są w Zakładzie Biomechaniki do czasu konsultacji przed egzaminem. Uczniowie, którzy nie zgłosili się do wykonanej pracy i nie przekazali nauczycielowi zeszytu ze sprawozdaniem, nie mogą przystąpić do egzaminu z metrologii sportowej.


Etap I gry biznesowej
Kontrola i pomiary w sporcie

Cel:

1. Zapoznać się z teoretycznymi podstawami kontroli i pomiaru w sporcie i wychowaniu fizycznym.

2. Zdobycie umiejętności pomiaru wskaźników cech szybkościowych u sportowców.

1. Kontrola w sferze fizycznej
edukacja i sport

Wychowanie fizyczne i trening sportowy nie jest procesem spontanicznym, ale kontrolowanym. W każdym momencie człowiek znajduje się w określonym stanie fizycznym, który jest determinowany głównie przez zdrowie (zgodność z normami aktywności życiowej, stopień odporności organizmu na niekorzystne nagłe wpływy), sylwetkę i stan funkcji fizycznych.

Wskazane jest kontrolowanie stanu fizycznego osoby poprzez zmianę go we właściwym kierunku. Kontrola ta prowadzona jest za pomocą wychowania fizycznego i sportu, do których w szczególności zalicza się ćwiczenia fizyczne.

Wydaje się tylko, że nauczyciel (lub trener) kontroluje kondycję fizyczną, wpływając na zachowanie sportowca, czyli m.in. oferując określone ćwiczenia fizyczne, a także kontrolując poprawność ich wykonania i jednocześnie uzyskiwane rezultaty. W rzeczywistości to nie trener kontroluje zachowanie sportowca, ale sam sportowiec. W trakcie treningu sportowego oddziałuje się na system samorządny (ciało człowieka). Indywidualne różnice w kondycji sportowców nie dają pewności, że ten sam wpływ wywoła taką samą reakcję. Dlatego istotna jest kwestia informacji zwrotnej: informacji o stanie sportowca, która przychodzi do trenera podczas kontroli procesu treningowego.

Kontrola w wychowaniu fizycznym i sporcie opiera się na pomiarze wskaźników, wyborze najważniejszych i ich matematycznej obróbce.

Zarządzanie procesem edukacyjno-szkoleniowym obejmuje trzy etapy:

1) zbieranie informacji;

2) jego analizę;

3) podejmowanie decyzji (planowanie).

Zbieranie informacji odbywa się zwykle podczas kompleksowej kontroli, której przedmiotem są:

1) działalność konkurencyjna;

2) obciążenia treningowe;

3) stan sportowca.



Rozróżnij (V.A.Zaporozhanov) trzy rodzaje stanów sportowca, w zależności od czasu trwania interwału wymaganego do przejścia z jednego stanu do drugiego.

1. Kamień milowy(stan stały. Utrzymuje się stosunkowo długi - tygodnie lub miesiące. Złożona charakterystyka stanu etapowego sportowca, odzwierciedlająca jego zdolność do wykazywania osiągnięć sportowych, nazywana jest gotowością, a stanem optymalnej (najlepszej dla danego cyklu treningowego) gotowości jest strój sportowy... Oczywistym jest, że w ciągu jednego lub kilku dni nie da się osiągnąć stanu formy sportowej ani go stracić.

2. Aktualny stan: schorzenie. Zmiany pod wpływem jednego lub kilka klas... Często konsekwencje uczestnictwa w zawodach lub pracy szkoleniowej wykonywanej na jednej z lekcji są opóźnione o kilka dni. W tym przypadku sportowiec zwykle odnotowuje zjawiska zarówno o charakterze niekorzystnym (np. ból mięśni), jak i pozytywnym (np. stan zwiększonej wydolności). Takie zmiany nazywają się opóźniony efekt treningu.

Aktualny stan sportowca determinuje charakter kolejnych sesji treningowych oraz ilość w nich obciążeń. Szczególny przypadek stanu obecnego, charakteryzujący się gotowością do wykonania ćwiczenia wyczynowego w najbliższych dniach z wynikiem bliskim maksimum, nazywa się aktualna gotowość.

3. Operacyjny stan: schorzenie. Zmiany pod wpływem pojedyncza egzekucja wysiłek fizyczny i ma charakter tymczasowy (np. zmęczenie spowodowane przebiegiem jednego dystansu; chwilowy wzrost wydajności po rozgrzewce). Stan operacyjny zawodnika zmienia się podczas sesji treningowej i powinien być uwzględniony przy planowaniu przerw na odpoczynek między podejściami, powtarzanych wyścigach, przy podejmowaniu decyzji, czy dodatkowa rozgrzewka jest odpowiednia itp. Szczególny przypadek stanu operacyjnego, charakteryzującego się natychmiastową gotowością do wykonania ćwiczenia wyczynowego z wynikiem zbliżonym do maksymalnego, nazywa się gotowość operacyjna.

Zgodnie z powyższą klasyfikacją istnieją istnieją trzy główne rodzaje monitorowania stanu sportowca:

1) kontrola sceniczna... Jego celem jest ocena stanu scenicznego (gotowości) sportowca;

2) aktualna kontrola... Jego głównym zadaniem jest określenie dziennych (aktualnych) wahań stanu sportowca;

3) kontrola operacyjna... Jego celem jest ekspresowa ocena stanu sportowca w danym momencie.

Pomiar lub test przeprowadzany w celu określenia stanu lub zdolności sportowca nazywa się ciasto... Procedura pomiarowa lub testowa nazywana jest testowaniem.

Każdy test obejmuje pomiar. Ale nie każdy pomiar jest testem. Można stosować tylko te testy, które spełniają następujące wymagania metrologiczne wymagania:

2) normalizacja;

3) obecność systemu ocen;

4) wiarygodność i zawartość informacyjną (współczynnik jakości) testów;

5) rodzaj kontroli (etapowa, bieżąca lub eksploatacyjna).

Test oparty na zadaniach motorycznych nazywa się testem motorycznym. Istnieją trzy grupy testów ruchowych:

1. Ćwiczenia kontrolne, których wykonanie zawodnik otrzymuje zadanie pokazania maksymalnego wyniku. Wynik testu to osiągnięcie motoryczne. Na przykład czas, w którym sportowiec pokona dystans 100 m.

2. Standardowe testy funkcjonalne, podczas których zadanie, które jest jednakowe dla wszystkich, jest dawkowane albo ilością wykonanej pracy, albo ilością przesunięć fizjologicznych. Wynikiem badania są parametry fizjologiczne lub biochemiczne podczas standardowej pracy lub osiągnięcia motoryczne przy standardowej wartości przesunięć fizjologicznych. Na przykład procent wzrostu tętna po 20 przysiadach lub prędkość, z jaką sportowiec biega ze stałym tętnem wynoszącym 160 uderzeń na minutę.

3. Maksymalne testy funkcjonalne, podczas których zawodnik musi pokazać maksymalny wynik. Wynikiem testu są parametry fizjologiczne lub biochemiczne przy maksymalnej wydajności. Na przykład maksymalne zużycie tlenu lub maksymalny dług tlenowy.

Testowanie wysokiej jakości wymaga znajomości teorii pomiarów.