Βασικές διατάξεις δοκιμών. Οι κύριες διατάξεις της κλασσικής θεωρίας των δοκιμών

24.09.2019

Διαβάστε επίσης

Κούκλες θεάτρου για παιδιά από 1 χρόνο

Τα εκπληκτικά αρχεία του ανθρώπινου σώματος είναι το μεγαλύτερο στόμα στον κόσμο

Τα βασικά της ανατομίας για την εικόνα μιας πλαστικής ανατομίας βασικού ανθρώπου

Επιταχυνόμενη καύση: Επαγγελματική ασθένεια του σύγχρονου δασκάλου

Πλήρης ιστορία της ομάδας MBEND

Τι δοκιμάζει

Σύμφωνα με το IEEE STD 829-1983 Δοκιμασία - Πρόκειται για μια διαδικασία ανάλυσης του λογισμικού που αποσκοπεί στον προσδιορισμό των διαφορών μεταξύ των πραγματικών υφιστάμενων και απαιτούμενων ακινήτων (ελάττωμα) και για την αξιολόγηση των ιδιοτήτων του λογισμικού.

Σύμφωνα με το GOST R ISO IEC 12207-99 στον κύκλο ζωής του λογισμικού, μεταξύ άλλων βοηθητικών διαδικασιών επαλήθευσης, πιστοποίησης, κοινής ανάλυσης και ελέγχου. Η διαδικασία επαλήθευσης είναι η διαδικασία καθορισμού των προϊόντων λογισμικού που λειτουργούν σε πλήρη συμμόρφωση με τις απαιτήσεις ή τις συνθήκες που εφαρμόζονται σε προηγούμενα έργα. Αυτή η διαδικασία μπορεί να περιλαμβάνει ανάλυση, επαλήθευση και δοκιμή (δοκιμή). Η διαδικασία πιστοποίησης είναι η διαδικασία καθορισμού της πληρότητας της συμμόρφωσης των καθιερωμένων απαιτήσεων που δημιουργούνται από το προϊόν ή το προϊόν λογισμικού ώστε να είναι λειτουργικό τους στόχο. Η διαδικασία της κοινής ανάλυσης είναι η διαδικασία αξιολόγησης των κρατών και, εάν είναι απαραίτητο, τα αποτελέσματα της εργασίας (προϊόντα) στο έργο. Η διαδικασία ελέγχου είναι η διαδικασία καθορισμού της συμμόρφωσης με τις απαιτήσεις, τα σχέδια και οι όροι της σύμβασης. Στο ποσό αυτών των διαδικασιών και συνθέτουν τι συνήθως ονομάζεται δοκιμή.

Οι δοκιμές βασίζονται σε διαδικασίες δοκιμής με συγκεκριμένα δεδομένα εισόδου, αρχικές συνθήκες και αναμενόμενο αποτέλεσμα που αναπτύσσονται για συγκεκριμένο σκοπό, όπως ο έλεγχος ενός ξεχωριστού προγράμματος ή η επαλήθευση της συμμόρφωσης σε μια ορισμένη απαίτηση. Οι διαδικασίες δοκιμής μπορούν να ελέγξουν τις διάφορες πτυχές της λειτουργίας του προγράμματος - από τη σωστή λειτουργία μιας ξεχωριστής λειτουργίας πριν από την επαρκή εφαρμογή των επιχειρηματικών απαιτήσεων.

Κατά την εκτέλεση ενός έργου, είναι απαραίτητο να ληφθεί υπόψη, σύμφωνα με ποια πρότυπα και οι απαιτήσεις θα δοκιμαστούν από το προϊόν. Ποια εργαλεία θα είναι (αν υπάρχουν) χρησιμοποιούνται για την αναζήτηση και το έγγραφο βρήκε ελαττώματα. Εάν θυμάστε τις δοκιμές από την αρχή του έργου, η δοκιμή του αναπτυγμένου προϊόντος δεν θα προσφέρει δυσάρεστες εκπλήξεις. Έτσι, η ποιότητα του προϊόντος είναι πιθανό να είναι αρκετά υψηλή.

Κύκλος ζωής και δοκιμή

Στην εποχή μας, χρησιμοποιείται από επαναληπτικές διαδικασίες ανάπτυξης λογισμικού, ιδίως τεχνολογίας RUP - ορθολογική ενοποιημένη διαδικασία(Εικ. 1). Όταν χρησιμοποιείτε αυτήν την προσέγγιση, η δοκιμή παύει να είναι η διαδικασία "στη διαδικασία ραμμάτων", η οποία τρέχει αφού οι προγραμματιστές έγραψαν όλο τον απαραίτητο κώδικα. Η εργασία σε δοκιμές αρχίζει με το πολύ αρχικό στάδιο του προσδιορισμού των απαιτήσεων για το μελλοντικό προϊόν και να ενσωματωθεί στενά με τις τρέχουσες εργασίες. Και κάνει νέες απαιτήσεις για τους δοκιμαστές. Ο ρόλος τους δεν μειώνεται μόνο στο προσδιορισμό των σφαλμάτων όσο το δυνατόν πληρέστερα και το συντομότερο δυνατόν. Θα πρέπει να συμμετέχουν στη συνολική διαδικασία αναγνώρισης και εξάλειψης των σημαντικότερων κινδύνων του έργου. Για το σκοπό αυτό, ο σκοπός των δοκιμών και των μεθόδων για την επίτευξή της καθορίζεται για κάθε επανάληψη. Και στο τέλος κάθε επανάληψης καθορίζεται πόσο επιτυγχάνεται αυτός ο στόχος εάν απαιτούνται πρόσθετες δοκιμές και αν δεν είναι απαραίτητο να αλλάξουν τις αρχές και τα εργαλεία δοκιμής. Με τη σειρά του, το κάθε ανιχνευόμενο ελάττωμα πρέπει να περάσει μέσω του δικού του κύκλου ζωής.

Σύκο. 1. Κύκλος ζωής του προϊόντος στο RUP

Η δοκιμή πραγματοποιείται συνήθως από τους κύκλους, καθένα από τα οποία έχει μια συγκεκριμένη λίστα εργασιών και σκοπών. Ο κύκλος δοκιμής μπορεί να συμπίπτει με την επανάληψη ή να αντιστοιχεί στο συγκεκριμένο τμήμα του. Τυπικά, ο κύκλος δοκιμής διεξάγεται για ένα συγκεκριμένο συγκρότημα συστήματος.

Ο κύκλος ζωής του προϊόντος λογισμικού αποτελείται από μια σειρά σχετικά σύντομων επαναλήψεων (Εικ. 2). Η επανάληψη είναι ένας πλήρης κύκλος ανάπτυξης που οδηγεί στην απελευθέρωση του τελικού προϊόντος ή ορισμένης από τη συντομευμένη έκδοση, η οποία επεκτείνεται από την επανάληψη έως την επανάληψη, έτσι ώστε, στο τέλος, να γίνει ένα τελικό σύστημα.

Κάθε επανάληψη περιλαμβάνει, κατά κανόνα, καθήκοντα σχεδιασμού εργασίας, ανάλυσης, σχεδιασμού, υλοποίησης, δοκιμών και αξιολόγησης των επιτευχθέντων αποτελεσμάτων. Ωστόσο, οι αναλογίες αυτών των καθηκόντων μπορούν να αλλάξουν σημαντικά. Σύμφωνα με τον λόγο διαφόρων καθηκόντων σε επαναλήψεις, ομαδοποιούνται σε φάσεις. Στην πρώτη φάση - η αρχή - η κύρια προσοχή καταβάλλεται στα καθήκοντα της ανάλυσης. Στις επαναλήψεις της δεύτερης φάσης - ανάπτυξη - η εστίαση είναι στο σχεδιασμό και τη δοκιμή βασικών αποφάσεων του έργου. Στην τρίτη φάση - η κατασκευή είναι το πιο μεγάλο μέρος των εργασιών ανάπτυξης και δοκιμών. Και στην τελευταία φάση - διαβίβαση - επιλύονται στα υψηλότερα καθήκοντα δοκιμών και μεταφοράς του συστήματος στον πελάτη.

Σύκο. 2. Αναγνώσεις του κύκλου ζωής του προϊόντος λογισμικού

Κάθε φάση έχει τους δικούς του συγκεκριμένους στόχους στον κύκλο ζωής του προϊόντος και θεωρείται ότι γίνεται όταν επιτευχθούν αυτοί οι στόχοι. Όλες οι επαναλήψεις, εκτός από τα μπορεί να είναι, οι επαναλήψεις της εκκίνησης της φάσης ολοκληρώνονται δημιουργώντας τη λειτουργική έκδοση του συστήματος που αναπτύσσεται.

Κατηγορίες δοκιμών

Οι δοκιμές διαφέρουν σημαντικά σε εργασίες που λυθούν με τη βοήθειά τους και σύμφωνα με την τεχνική που χρησιμοποιείται.

Κατηγορίες δοκιμών	Περιγραφή Κατηγορίες	Τύποι δοκιμών
Τρέχουσα δοκιμή	Ένα σύνολο δοκιμών που εκτελούνται για τον προσδιορισμό της απόδοσης των πρόσθετων νέων χαρακτηριστικών του συστήματος.	Δοκιμές άγχους. Δοκιμές επιχειρηματικών κύκλων. Δοκιμές άγχους.
Δοκιμή παλινδρόμησης	Ο σκοπός των δοκιμών παλινδρόμησης είναι να επαληθεύσει ότι η προσθήκη στο σύστημα δεν έχει μειώσει τις δυνατότητές του, δηλ. Η δοκιμή πραγματοποιείται σύμφωνα με τις απαιτήσεις που έχουν ήδη ολοκληρωθεί πριν προσθέσουν νέα χαρακτηριστικά.	Δοκιμές άγχους. Δοκιμές επιχειρηματικών κύκλων. Δοκιμές άγχους.

Δοκιμή υποκατηγορίας

Δοκιμή υποκατηγορίας	Περιγραφή του τύπου των δοκιμών	Δοκιμές υποείδων
Δοκιμή άγχους	Χρησιμοποιείται για να δοκιμάσει όλους, χωρίς εξαίρεση τις λειτουργίες εφαρμογής. Στην περίπτωση αυτή, η ακολουθία δοκιμής λειτουργίας δεν έχει σημασία.	Λειτουργικές δοκιμές. Δοκιμή διασύνδεσης. Βάση δεδομένων δοκιμών
Δοκιμές επιχειρηματικών κύκλων	Χρησιμοποιείται για τη δοκιμή των λειτουργιών εφαρμογής στην ακολουθία της κλήσης τους από τον χρήστη. Για παράδειγμα, η απομίμηση όλων των λογιστικών ενεργειών για το 1ο τρίμηνο.	Δοκιμή μονάδας (αρθρωτή δοκιμή). Λειτουργικές δοκιμές. Δοκιμή διασύνδεσης. Βάση δεδομένων δοκιμών.
Δοκιμή άγχους	Που χρησιμοποιείται για τη δοκιμή Απόδοση εφαρμογής. Σκοπός αυτής της δοκιμής είναι να καθορίσει το πλαίσιο της σταθερής λειτουργίας της εφαρμογής. Με αυτή τη δοκιμή, όλες οι διαθέσιμες λειτουργίες καλούνται.	Δοκιμή μονάδας (αρθρωτή δοκιμή). Λειτουργικές δοκιμές. Δοκιμή διασύνδεσης. Βάση δεδομένων δοκιμών.

Δοκιμή υποκατηγορίας

Περιγραφή του τύπου των δοκιμών

Δοκιμές υποείδων

Δοκιμή άγχους

Χρησιμοποιείται για να δοκιμάσει όλους, χωρίς εξαίρεση τις λειτουργίες εφαρμογής. Στην περίπτωση αυτή, η ακολουθία δοκιμής λειτουργίας δεν έχει σημασία.

Λειτουργικές δοκιμές.
Δοκιμή διασύνδεσης.
Βάση δεδομένων δοκιμών

Δοκιμές επιχειρηματικών κύκλων

Χρησιμοποιείται για τη δοκιμή των λειτουργιών εφαρμογής στην ακολουθία της κλήσης τους από τον χρήστη. Για παράδειγμα, η απομίμηση όλων των λογιστικών ενεργειών για το 1ο τρίμηνο.

Δοκιμή μονάδας (αρθρωτή δοκιμή).
Λειτουργικές δοκιμές.
Δοκιμή διασύνδεσης.
Βάση δεδομένων δοκιμών.

Δοκιμή άγχους

Που χρησιμοποιείται για τη δοκιμή

Απόδοση εφαρμογής. Σκοπός αυτής της δοκιμής είναι να καθορίσει το πλαίσιο της σταθερής λειτουργίας της εφαρμογής. Με αυτή τη δοκιμή, όλες οι διαθέσιμες λειτουργίες καλούνται.

Δοκιμή μονάδας (αρθρωτή δοκιμή).
Λειτουργικές δοκιμές.
Δοκιμή διασύνδεσης.
Βάση δεδομένων δοκιμών.

Τύποι δοκιμών

Δοκιμή μονάδας (Αρθρωτός έλεγχος) - Αυτό το είδος συνεπάγεται δοκιμές μεμονωμένων μονάδων εφαρμογής. Για να αποκτήσετε το μέγιστο αποτέλεσμα, η δοκιμή πραγματοποιείται ταυτόχρονα με την ανάπτυξη των ενοτήτων.

Λειτουργική δοκιμή - Σκοπός αυτής της δοκιμής είναι να εξασφαλιστεί η εύρυθμη λειτουργία του αντικειμένου δοκιμής. Δοκιμάζεται σωστά πλοήγηση σε ένα αντικείμενο, καθώς και την είσοδο, την επεξεργασία και την έξοδο των δεδομένων.

Βάση δεδομένων δοκιμών - Ελέγξτε την απόδοση της βάσης δεδομένων με την κανονική λειτουργία της εφαρμογής, στις στιγμές της λειτουργίας υπερφόρτωσης και πολλών παικτών.

Δοκιμή μονάδας

Για το OOP, η συνήθης οργάνωση των αρθρωτών δοκιμών είναι η δοκιμή των μεθόδων κάθε κλάσης, τότε η κλάση κάθε συσκευασίας I.T.D. Σταδιακά, στρίβουμε τη δοκιμή ολόκληρου του έργου και οι προηγούμενες δοκιμές είναι ο τύπος παλινδρόμησης.

Στους δασμούς παραγωγής, τα δεδομένα δοκιμών περιλαμβάνουν διαδικασίες δοκιμών, δεδομένα εισόδου, δοκιμή εκτέλεσης κώδικα, έξοδος. Το παρακάτω είναι ένα είδος τεκμηρίωσης εξόδου.

Λειτουργική δοκιμή

Λειτουργική δοκιμή του αντικειμένου δοκιμής προγραμματίζεται και διεξάγεται με βάση τις απαιτήσεις δοκιμών που καθορίζονται στο στάδιο ορισμού. Οι απαιτήσεις είναι οι επιχειρηματικοί κανόνες, οι διαγράμματα χρήσης, οι επιχειρηματικές λειτουργίες, καθώς και εάν υπάρχουν διαγράμματα δραστηριότητας. Σκοπός των λειτουργικών εξετάσεων είναι να ελέγξει τη συμμόρφωση των αναπτυγμένων γραφικών στοιχείων που καθορίστηκαν απαιτήσεις.

Αυτός ο τύπος δοκιμών δεν μπορεί να αυτοματοποιηθεί πλήρως. Κατά συνέπεια, χωρίζεται σε:

Αυτοματοποιημένη δοκιμή (θα χρησιμοποιηθεί στην περίπτωση που μπορείτε να ελέγξετε τις πληροφορίες εξόδου).

Σκοπός: Εισαγωγή δοκιμών, επεξεργασία και έξοδος δεδομένων.

Χειροκίνητη δοκιμή (σε άλλες περιπτώσεις).

Σκοπός: Δοκιμάζει την ορθότητα της εκτέλεσης των απαιτήσεων των χρηστών.

Είναι απαραίτητο να εκτελεστεί (παιχνίδι) κάθε μία από τις θέσεις χρήσης, χρησιμοποιώντας τόσο πιστές τιμές όσο και προφανώς λανθασμένες, για να επιβεβαιώσετε τη σωστή λειτουργία, σύμφωνα με τα ακόλουθα κριτήρια:

Το προϊόν ανταποκρίνεται επαρκώς σε όλα τα καταχωρημένα δεδομένα (τα αναμενόμενα αποτελέσματα εμφανίζονται ως απόκριση στα σωστά εισαγόμενα δεδομένα).
Το προϊόν ανταποκρίνεται επαρκώς σε εσφαλμένα εισαγόμενα δεδομένα (εμφανίζονται κατάλληλα μηνύματα σφάλματος).

Βάση δεδομένων δοκιμών

Ο σκοπός αυτής της δοκιμής είναι να διασφαλιστεί ότι οι μέθοδοι πρόσβασης βάσεων δεδομένων είναι αξιόπιστες, στην κατάλληλη εκτέλεση τους, χωρίς να διαταράσσουν την ακεραιότητα των δεδομένων.

Πρέπει να χρησιμοποιήσετε με συνέπεια τον μέγιστο δυνατό αριθμό προσφυγών στη βάση δεδομένων. Χρησιμοποιείται μια προσέγγιση, στην οποία η δοκιμή καταρτίζεται με τέτοιο τρόπο ώστε να "φορτώσει" τη βάση με μια ακολουθία, τόσο πιστές τιμές όσο και προφανώς λανθασμένες. Η απόκριση βάσης δεδομένων στην καταχώριση δεδομένων προσδιορίζεται, εκτιμώνται τα χρονικά διαστήματα της επεξεργασίας τους.

Κεφάλαιο 3. Αποτελέσματα δοκιμών στατιστικής επεξεργασίας

Η στατιστική επεξεργασία των αποτελεσμάτων των δοκιμών επιτρέπει, αφενός, να ορίζει αντικειμενικά τα αποτελέσματα των θεμάτων, από την άλλη - να αξιολογήσει την ποιότητα του ίδιου της δοκιμής, των εργασιών δοκιμής, ιδίως για την αξιολόγηση της αξιοπιστίας του. Το πρόβλημα της αξιοπιστίας καταβάλλεται μεγάλη προσοχή στην κλασική θεωρία των δοκιμών. Αυτή η θεωρία δεν έχει χάσει τη συνάφεια του και τώρα. Παρά την εμφάνιση, πιο σύγχρονες θεωρίες, η κλασσική θεωρία συνεχίζει να διατηρεί τη θέση του.

3.1. Οι κύριες διατάξεις της κλασσικής θεωρίας των δοκιμών

3.2. Αποτελέσματα δοκιμών μήτρας

3.3. Γραφική παρουσίαση των σημείων δοκιμών

3.4. Κεντρική τάση μέτρα

3.5. ΚΑΝΟΝΙΚΗ ΚΑΤΑΝΟΜΗ

3.6. Δοκιμή σημείων δοκιμής διασποράς

3.7. Συσχετισμό μήτρα

3.8. Αξιοπιστία δοκιμής

3.9. Επεξεργασία ισχύος

ΒΙΒΛΙΟΓΡΑΦΙΑ

Οι κύριες διατάξεις της κλασσικής θεωρίας των δοκιμών

Ο δημιουργός της κλασικής θεωρίας των δοκιμών (κλασσική θεωρία των διανοητικών δοκιμών) είναι ένας γνωστός βρετανός ψυχολόγος, ο συγγραφέας της ανάλυσης παράγοντα, ο Edward Spearman (1863-1945) 1. Γεννήθηκε στις 10 Σεπτεμβρίου 1863 και το ένα τέταρτο της ζωής του σερβίρεται στον βρετανικό στρατό. Για το λόγο αυτό, έλαβε τον βαθμό του γιατρού φιλοσοφίας μόνο σε ηλικία 41 2. Η μελέτη διατριβής του Partspirman πραγματοποιήθηκε στο εργαστήριο της Λειψίας της πειραματικής ψυχολογίας υπό την καθοδήγηση του Wilhelm Wundt (Wilhelm Wundt). Την περίοδο αυτή, ο Francis Galton (Francis Galton) ήταν μια ισχυρή επιρροή στο Ch.Pirman (Francis Galton) για τη δοκιμή της ανθρώπινων νοημοσύνης. Οι μαθητές Partspirman ήταν R.Cattell και D.Wechsler. Ανάμεσα στους οπαδούς του, Α.ΑΝΑΣΤΑΣΙ, J. P. Guilford, P.Vernon, C.Burt, A.Jensen μπορεί να κληθεί.

Μια μεγάλη συμβολή στην ανάπτυξη της κλασικής θεωρίας των δοκιμών που έκαναν Louis Guttman, 1916-1987) 3.

Εν ολίγοις και γεμάτες κλασική θεωρία των δοκιμών για πρώτη φορά εκτίθεται στο θεμελιώδες έργο του Harold Gullixen (Gulliksen H., 1950) 4. Από τότε, η θεωρία έχει τροποποιηθεί κάπως, ειδικότερα η μαθηματική συσκευή βελτιώθηκε. Η θεωρία κλασικής δοκιμής στη σύγχρονη παρουσίαση δίνεται στο βιβλίο Crocker L., Aligna J. (1986) 5. Από τους εγχώριους ερευνητές, για πρώτη φορά, η περιγραφή αυτής της θεωρίας δόθηκε v.Vanesis (1989) 6. Στο έργο του Chelyowkova M.B. (2002) 7 παρέχει πληροφορίες σχετικά με τη στατιστική τεκμηρίωση της ποιότητας της δοκιμής.

Η θεωρία κλασικής δοκιμής βασίζεται στις ακόλουθες πέντε βασικές θέσεις.

1. Το αποτέλεσμα της εμπειρικά ληφθέντων μέτρησης (x) είναι το άθροισμα των πραγματικών αποτελεσμάτων μέτρησης (Τ) και τα σφάλματα μέτρησης (Ε) 8:

X \u003d t + e (3.1.1)

Οι τιμές T και E είναι συνήθως άγνωστες.

2. Το πραγματικό αποτέλεσμα μέτρησης μπορεί να εκφραστεί ως μαθηματική προσδοκία e (x):

3. Η συσχέτιση των αληθινών και εσφαλμένων συστατικών σύμφωνα με ένα σύνολο υποκειμένων είναι μηδέν, δηλαδή ρ 'te \u003d 0.

4. Τα εσφαλμένα συστατικά δύο δοκιμών δεν συσχετίζονται:

5. Τα εσφαλμένα συστατικά μιας δοκιμής δεν συσχετίζονται με τα αληθινά συστατικά οποιασδήποτε άλλης δοκιμής:

Επιπλέον, η βάση της κλασικής θεωρίας των δοκιμών είναι δύο ορισμοί - παράλληλες και ισοδύναμες δοκιμές.

Οι παράλληλες δοκιμές πρέπει να συμμορφώνονται με τις απαιτήσεις (1-5), τα πραγματικά συστατικά μιας δοκιμής (ΤΙ) πρέπει να είναι ίσα με τα πραγματικά συστατικά μιας άλλης δοκιμής (Τ2) σε κάθε δείγμα των δοκιμών που ανταποκρίνονται στις δύο δοκιμές. Θεωρείται ότι το ΤΙ 1 \u003d Τ2 και, επιπλέον, είναι ίσα με τη διασπορά S 1 2 \u003d S22.

Οι ισοδύναμες δοκιμές πρέπει να συμμορφώνονται με ολόκληρη την απαίτηση παράλληλων δοκιμών, με εξαίρεση ένα: Τα αληθινά συστατικά μιας δοκιμής δεν πρέπει να είναι ίσα με τα πραγματικά συστατικά μιας άλλης παράλληλης δοκιμής, αλλά θα πρέπει να διαφέρουν στην ίδια σταθερά. από.

Η κατάσταση ισοδυναμίας δύο δοκιμών καταγράφεται στην ακόλουθη μορφή:

Όπου C12 είναι η σταθερά των διαφορών στα αποτελέσματα της πρώτης και της δεύτερης δοκιμής.

Με βάση τις παραπάνω διατάξεις, η θεωρία της αξιοπιστίας των δοκιμών είναι 9.10.

Δηλαδή, η διασπορά των ληφθέντων σημείων δοκιμών ισούται με το άθροισμα των διασπορών των αληθινών και εσφαλμένων συστατικών.

Επαναλάβω αυτή την έκφραση ως εξής:

(3.1.3)

Η δεξιά πλευρά αυτής της ισότητας είναι η αξιοπιστία της δοκιμής ( r.). Έτσι, η αξιοπιστία της δοκιμής μπορεί να γραφτεί με τη μορφή:

Με βάση αυτόν τον τύπο, υπήρξαν επακόλουθες εκφράσεις για την εξεύρεση του παράγοντα αξιοπιστίας των δοκιμών. Η αξιοπιστία της δοκιμής είναι το κρίσιμο χαρακτηριστικό του. Εάν η αξιοπιστία είναι άγνωστη, τα αποτελέσματα των δοκιμών δεν μπορούν να ερμηνευθούν. Η αξιοπιστία της δοκιμής χαρακτηρίζει την ακρίβειά του ως όργανο μέτρησης. Η υψηλή αξιοπιστία σημαίνει υψηλή επαναληψιμότητα των αποτελεσμάτων των δοκιμών στις ίδιες συνθήκες.

Στην κλασική θεωρία των δοκιμών, το πιο σημαντικό πρόβλημα είναι να προσδιοριστεί το πραγματικό σημείο δοκιμής του θέματος (t). Το εμπειρικό σημείο δοκιμής (x) εξαρτάται από πολλούς όρους - το επίπεδο δυσκολίας των καθηκόντων, το επίπεδο ετοιμότητας των θεμάτων, ο αριθμός των καθηκόντων, οι συνθήκες διεξαγωγής δοκιμών κ.λπ. Στην ομάδα ισχυρών, καλά εκπαιδευμένων θεμάτων, τα αποτελέσματα των δοκιμών θα είναι συνήθως καλύτερα. από ό, τι στην ομάδα ασθενώς προετοιμασμένα θέματα. Από την άποψη αυτή, το ζήτημα του μεγέθους της δυσκολίας των καθηκόντων στον γενικό πληθυσμό των θεμάτων παραμένει ανοικτό. Το πρόβλημα έγκειται στο γεγονός ότι τα πραγματικά εμπειρικά δεδομένα λαμβάνονται σε όλα τα τυχαία δείγματα των θεμάτων. Κατά κανόνα, αυτές είναι εκπαιδευτικές ομάδες, οι οποίοι είναι πολλοί φοιτητές αρκετά σημαντικά μεταξύ τους στη διαδικασία διδασκαλίας και φοιτητών σε συνθήκες που συχνά δεν επαναλαμβάνονται για άλλες ομάδες.

Εύρημα s Ε. Από την εξίσωση (3.1.4)

Εδώ εμφανίζεται ρητά την εξάρτηση της ακρίβειας μέτρησης από την τυπική τιμή απόκλισης. s x. και από την αξιοπιστία της δοκιμής r..

Οι τομείς εφαρμογής, οι στόχοι και τα καθήκοντα των δοκιμών ποικίλλουν, οπότε οι δοκιμές εκτιμώνται και εξηγούνται με διαφορετικούς τρόπους. Μερικές φορές οι ίδιοι οι δοκιμαστές είναι δύσκολο να εξηγηθούν τι δοκιμάζουν "όπως είναι". Υπάρχει μια σύγχυση.

Για να ξεδιπλώσετε αυτή τη σύγχυση, ο Alexey Barancers (πρακτική, προπονητής και σύμβουλος σε δοκιμές λογισμικού. Μια αποχώρηση από το Ινστιτούτο του προγραμματισμού του συστήματος της Ρωσικής Ακαδημίας Επιστημών) προβλέπει την εκπαίδευσή του για τη δοκιμή του εισαγωγικού βίντεο σχετικά με τις κύριες δοκιμές δοκιμών.

Μου φαίνεται ότι σε αυτή την έκθεση, ο λέκτορας θα μπορούσε να εξηγήσει επαρκώς και να εξηγήσει επαρκώς "τι δοκιμάζει" από την άποψη του επιστήμονα και του προγραμματιστή. Είναι περίεργο ότι αυτό το κείμενο δεν έχει ακόμη εμφανιστεί στην Habré.

Βάζω εδώ μια συμπιεσμένη επανάληψη αυτής της έκθεσης. Στο τέλος του κειμένου υπάρχουν συνδέσμοι στην πλήρη έκδοση, καθώς και το προαναφερθέν βίντεο.

Οι κύριες θέσεις των δοκιμών

Αγαπητοί συνάδελφοι,

Πρώτον, ας προσπαθήσουμε να καταλάβουμε τι δοκιμές δεν είναι.

Δοκιμές μη ανάπτυξης,

Ακόμη και αν οι δοκιμαστές είναι σε θέση να προγραμματίσουν, συμπεριλαμβανομένων των δοκιμών (έλεγχος αυτοματισμού \u003d προγραμματισμός), μπορεί να αναπτύξει ορισμένα βοηθητικά προγράμματα (για τον εαυτό τους).

Ωστόσο, η δοκιμή δεν είναι δραστηριότητες ανάπτυξης λογισμικού.

Η δοκιμή δεν είναι ανάλυση,

Και να μην συλλέξει και να αναλύσει τις απαιτήσεις.

Παρόλο που, στη διαδικασία δοκιμής, μερικές φορές πρέπει να αποσαφηνίσετε τις απαιτήσεις και μερικές φορές πρέπει να τα αναλύσετε. Αλλά αυτή η δραστηριότητα δεν είναι η κύρια, μάλλον, είναι απαραίτητο να κάνουμε ακριβώς αν είναι απαραίτητο.

Δοκιμές μη διαχείρισης,

Παρά το γεγονός ότι σε πολλές οργανώσεις υπάρχει ένας τέτοιος ρόλος ως "διευθυντής δοκιμών". Φυσικά, οι δοκιμαστές πρέπει να διαχειριστούν. Αλλά από μόνη της δοκιμή δεν ελέγχεται.

Η δοκιμή δεν είναι τεχνική συμμετοχή,

Ωστόσο, οι δοκιμαστές πρέπει να τεκμηριώσουν τις δοκιμές τους και τη δουλειά τους.

Οι δοκιμές δεν μπορούν να θεωρηθούν καμία από αυτές τις δραστηριότητες απλώς και μόνο επειδή στη διαδικασία ανάπτυξης (ή την ανάλυση των απαιτήσεων ή την εγγραφή τεκμηρίωσης για τις δοκιμές του) οι δοκιμαστές κάνουν όλα αυτά τα έργα για τον εαυτό σου, όχι για κάποιον άλλο.

Δραστηριότητες που σημαίνει μόνο όταν είναι σε ζήτηση, δηλαδή οι κάτοχοι δοκιμής πρέπει να παράγουν κάτι "για εξαγωγή". Τι κάνουν "για εξαγωγή";

Ελαττώματα, περιγραφές ελαττώματος ή αναφορές δοκιμών; Εν μέρει είναι αλήθεια.

Αλλά αυτή δεν είναι η όλη αλήθεια.

Κύρια δοκιμαστές δραστηριότητας

Είναι ότι παρέχουν στους συμμετέχοντες στο έργο να αναπτύξουν αρνητικά λογισμικά σχετικά με την ποιότητα του προϊόντος λογισμικού.

"Αρνητική ανατροφοδότηση" δεν φέρει κάποια αρνητική απόχρωση και δεν σημαίνει ότι οι κάτοχοι δοκιμών κάνουν κάτι κακό, ή ότι κάνουν κάτι κακό. Είναι απλώς ένας τεχνικός όρος που σημαίνει ένα αρκετά απλό πράγμα.

Αλλά αυτό το πράγμα είναι πολύ σημαντικό, και ίσως το μόνο πιο σημαντικό συστατικό των δραστηριοτήτων των δοκιμαστών.

Υπάρχει μια επιστήμη - "θεωρία συστήματος". Ορίζει μια τέτοια έννοια ως "ανατροφοδότηση".

Το "Feedback" είναι μερικά δεδομένα που απελευθερώνονται πίσω στην είσοδο ή κάποιο μέρος των δεδομένων, οι οποίες από την έξοδο επιστρέφουν στην είσοδο. Αυτή η ανάδραση μπορεί να είναι θετική και αρνητική.

Και η μία και οι άλλες ποικιλίες ανατροφοδότησης είναι εξίσου σημαντικές.

Στην ανάπτυξη συστημάτων λογισμικού με θετική ανατροφοδότηση, φυσικά, είναι μερικές πληροφορίες που λαμβάνουμε από τους τελικούς χρήστες. Αυτά είναι αιτήματα για κάποια νέα λειτουργικότητα, αυτή η αύξηση των πωλήσεων (εάν παράγουμε ένα ποιοτικό προϊόν).

Η αρνητική ανατροφοδότηση μπορεί επίσης να προέλθει από τους τελικούς χρήστες με τη μορφή ορισμένων αρνητικών κριτικών. Είτε μπορεί να προέλθει από τους δοκιμαστές.

Η προηγούμενη αρνητική ανατροφοδότηση παρέχεται, η λιγότερη ενέργεια είναι απαραίτητη για την τροποποίηση αυτού του σήματος. Αυτός είναι ο λόγος για τον οποίο πρέπει να αρχίσετε να ξεκινάτε το συντομότερο δυνατόν, τα νωρίτερα στάδια του έργου και να δώσετε αυτή την ανατροφοδότηση και στο στάδιο του σχεδιασμού, αλλά και νωρίτερα, ίσως νωρίτερα, στο στάδιο της συλλογής και ανάλυσης των απαιτήσεων.

Με την ευκαιρία, εξ ου και η κατανόηση ότι οι δοκιμαστές δεν είναι υπεύθυνοι για την ποιότητα. Βοηθούν όσους είναι υπεύθυνοι γι 'αυτόν.

Συνώνυμα του όρου "Δοκιμές"

Από την άποψη του γεγονότος ότι η δοκιμή είναι η παροχή αρνητικής ανατροφοδότησης, η παγκοσμίου φήμης συντομογραφία QA (Αγγλικά. Διασφάλιση ποιότητας - διασφάλιση ποιότητας) για τον όρο "δοκιμές" δεν είναι ακριβώς σίγουρα σίγουρα.

Είναι αδύνατο να εξεταστεί η διασφάλιση της ποιότητας απλή διάταξη αρνητικών ανατροφοδότησης, διότι η διάταξη είναι ορισμένα θετικά μέτρα. Εννοείται ότι στην περίπτωση αυτή παρέχουμε ποιότητα, εγκαίρως λαμβάνουμε ορισμένα μέτρα ώστε να αυξηθεί η ποιότητα ανάπτυξης λογισμικού.

Ωστόσο, ο "έλεγχος ποιότητας" - ο έλεγχος ποιότητας, μπορεί να θεωρηθεί με ευρεία έννοια συνώνυμο του όρου "δοκιμές", επειδή ο ποιοτικός έλεγχος είναι αυτό και υπάρχει μια διάταξη ανατροφοδότησης σε μια ευρεία ποικιλία των ποικιλιών της, σε διάφορα στάδια του Πρόγραμμα.

Μερικές φορές η δοκιμή εννοείται ως κάποια ξεχωριστή μορφή ελέγχου ποιότητας.

Η σύγχυση προέρχεται από την ιστορία των δοκιμών. Σε διαφορετικούς χρόνους, ο όρος "δοκιμές" προορίζονταν σε διάφορες ενέργειες που μπορούν να χωριστούν σε 2 μεγάλες τάξεις: εξωτερικές και εσωτερικές.

Εξωτερικοί ορισμοί

Ορισμοί που σε διαφορετικές εποχές δόθηκαν Myers, Beyser, Kaner, περιγράφουν τις δοκιμές μόνο από την άποψη της εξωτερικής της σημασίας. Δηλαδή, από την άποψή τους, η δοκιμή είναι μια δραστηριότητα που προορίζεται για κάτι και δεν αποτελείται από κάτι. Και οι τρεις αυτοί οι ορισμοί μπορούν να γενικευθούν ως αρνητικά σχόλια.

Εσωτερικοί ορισμοί

Αυτοί είναι οι ορισμοί που δίνονται στο πρότυπο της ορολογίας που χρησιμοποιούνται στη μηχανική λογισμικού, για παράδειγμα, στο de facto πρότυπο που ονομάζεται SWEBOK.

Αυτοί οι ορισμοί εξηγούνται εποικοδομητικά, οι οποίοι δοκιμάζουν δραστηριότητες, αλλά δεν δίνουν καμία ιδέα ότι είναι απαραίτητο να δοκιμαστεί για τα οποία θα χρησιμοποιηθούν όλα τα αποτελέσματα της επαλήθευσης της συμμόρφωσης μεταξύ της πραγματικής συμπεριφοράς του προγράμματος και της αναμενόμενης συμπεριφοράς.

Δοκιμή είναι

Ελέγξτε τη συμμόρφωση των απαιτήσεων του προγράμματος
που πραγματοποιήθηκαν παρατηρώντας το έργο του
Σε ειδικές, τεχνητά δημιουργημένες καταστάσεις που επιλέχθηκαν με κάποιο τρόπο.

Από εδώ και στη συνέχεια θα το εξετάσουμε έναν ορισμό λειτουργίας της "δοκιμής".

Συνολικό σύστημα δοκιμών περίπου ως εξής:

Ο ελεγκτής εισόδου λαμβάνει ένα πρόγραμμα ή / και απαιτήσεις.
Κάνει κάτι μαζί τους, παρακολουθεί το έργο του προγράμματος σε ορισμένες, εξελιγμένες καταστάσεις που δημιουργήθηκαν από αυτόν.
Κατά την παραγωγή, λαμβάνει πληροφορίες σχετικά με τις αλληλογραφίες και τις ασυνέπειες.
Στη συνέχεια, αυτές οι πληροφορίες χρησιμοποιούνται για τη βελτίωση του ήδη υπάρχοντος προγράμματος. Είτε για να αλλάξει τις απαιτήσεις για ένα άλλο πρόγραμμα που αναπτύσσεται.

Τι είναι μια δοκιμή

Αυτή είναι μια ειδική, τεχνητά δημιουργημένη κατάσταση που επιλέγεται με κάποιο τρόπο,
και μια περιγραφή των παρατηρήσεων του προγράμματος πρέπει να κάνουμε
Για να επαληθεύσετε τη συμμόρφωσή του με κάποια απαίτηση.

Δεν είναι απαραίτητο να υποθέσουμε ότι η κατάσταση είναι κάτι πιο ταυτόχρονα. Η δοκιμή μπορεί να είναι επαρκώς μακρά, για παράδειγμα, όταν δοκιμάζετε την απόδοση, αυτή η τεχνητά δημιουργημένη κατάσταση μπορεί να συνεχιστεί για ένα επαρκώς μεγάλο χρονικό διάστημα στο σύστημα. Και οι παρατηρήσεις που πρέπει να κάνουν με αυτό είναι ένα σύνολο διαφόρων γραφημάτων ή μετρήσεων που μετρούμε στη διαδικασία εκτέλεσης αυτής της δοκιμής.

Ο προγραμματιστής δοκιμών ασχολείται με το γεγονός ότι από μια τεράστια δυνητικά άπειρη δοκιμή δοκιμών επιλέγουν κάποιο περιορισμένο σετ.

Λοιπόν, έτσι μπορούμε να συμπεράνουμε ότι ο ελεγκτής κάνει δύο πράγματα στη διαδικασία δοκιμής.

1. Πρώτον, διαχειρίζεται την εκτέλεση του προγράμματος και δημιουργεί αυτές τις πιο τεχνητές καταστάσεις στις οποίες πρόκειται να ελέγξουμε τη συμπεριφορά του προγράμματος.

2.I, δεύτερον, παρακολουθεί τη συμπεριφορά του προγράμματος και συγκρίνει αυτό που βλέπει με αυτό που αναμένεται.

Εάν ο ελεγκτής αυτοματοποιεί τις δοκιμές, δεν παρακολουθεί ίδιες τη συμπεριφορά του προγράμματος - αναθέτει αυτή την εργασία σε ένα ειδικό εργαλείο ή ένα ειδικό πρόγραμμα που έγραψε ο ίδιος. Είναι αυτή που παρατηρεί, συγκρίνει την παρατηρούμενη συμπεριφορά με την αναμενόμενη και ο ελεγκτής δίνει μόνο κάποιο τελικό αποτέλεσμα - αν η παρατηρούμενη συμπεριφορά συμπίπτει με την αναμενόμενη ή δεν συμπίπτει.

Οποιοδήποτε πρόγραμμα είναι ένας μηχανισμός επεξεργασίας πληροφοριών. Η καταχώρηση μπαίνει στην είσοδο σε κάποια μορφή, τις πληροφορίες εξόδου σε κάποια άλλη μορφή. Ταυτόχρονα, οι εισροές και οι εξόδους του προγράμματος μπορούν να είναι πολλά, μπορούν να είναι διαφορετικά, δηλαδή ένα πρόγραμμα μπορεί να έχει πολλές διαφορετικές διεπαφές και αυτές οι διεπαφές μπορεί να έχουν διαφορετικούς τύπους:

Διεπαφή χρήστη (UI)
Διεπαφή λογισμικού (API)
Πρωτόκολλο δικτύου
Σύστημα αρχείων
Κατάσταση του περιβάλλοντος
Εκδηλώσεις

Οι πιο συχνές διεπαφές είναι

έθιμο
γραφικός,
κείμενο
προβολής,
και ομιλία.

Χρησιμοποιώντας όλες αυτές τις διεπαφές, Tester:

Κάπως δημιουργεί τεχνητές καταστάσεις,
Και ελέγχει σε αυτές τις καταστάσεις ως πρόγραμμα συμπεριφέρεται.

Αυτό δοκιμάζει.

Άλλες ταξινομήσεις τύπων δοκιμών

Πιο συχνά χρησιμοποιείται για να χωρίσει τρία επίπεδα, αυτό

Αρθρωτή δοκιμή
Δοκιμές ολοκλήρωσης
Δοκιμή συστήματος.

Υπό τις δομοστοιχειωτές δοκιμές, η δοκιμή συνήθως κατανοείται από ένα μάλλον χαμηλό επίπεδο, δηλαδή, δοκιμές επιμέρους λειτουργιών, μεθόδων, λειτουργιών.

Κάτω από τις δοκιμές συστήματος εννοείται δοκιμές στο επίπεδο διεπαφής χρήστη.

Μερικές φορές χρησιμοποιούνται μερικοί άλλοι όροι, όπως "δοκιμές συνιστωσών", αλλά προτιμώ να διαθέτω αυτούς τους τρεις, λόγω του γεγονότος ότι ο τεχνολογικός διαχωρισμός των αρθρωτών και συστημικών δοκιμών δεν έχει νόημα. Σε διαφορετικά επίπεδα, τα ίδια εργαλεία, μπορούν να χρησιμοποιηθούν οι ίδιες τεχνικές. Διαχωρισμό υπό όρους.

Η πρακτική δείχνει ότι τα εργαλεία που τοποθετούνται από τον κατασκευαστή όπως τα αρθρωτά εργαλεία δοκιμής μπορούν να εφαρμοστούν με ίση επιτυχία και σε επίπεδο δοκιμής ολόκληρης της αίτησης στο σύνολό της.

Και τα εργαλεία που δοκιμάζουν ολόκληρη την εφαρμογή στο σύνολό της στο επίπεδο διεπαφής χρήστη μερικές φορές θέλουν να φαίνονται, για παράδειγμα, στη βάση δεδομένων ή να προκαλέσουν κάποια ξεχωριστή αποθηκευμένη διαδικασία εκεί.

Δηλαδή, η διαίρεση σε συστηματικές και αρθρωτές δοκιμές είναι γενικά καθαρά υπό όρους, αν μιλάμε από τεχνική άποψη.

Χρησιμοποιούνται τα ίδια εργαλεία και αυτό είναι φυσιολογικό, χρησιμοποιούνται οι ίδιες τεχνικές, σε κάθε επίπεδο μπορείτε να μιλήσετε για τη δοκιμή διαφόρων τύπων.

Συνδυασμός:

Δηλαδή, μπορείτε να μιλήσετε για αρθρωτές δοκιμές λειτουργικότητας.

Μπορείτε να μιλήσετε για συστημικές δοκιμές λειτουργικότητας.

Μπορείτε να μιλήσετε για αρθρωτές δοκιμές, για παράδειγμα, αποτελεσματικότητα.

Μπορείτε να μιλήσετε για συστηματικές δοκιμές απόδοσης.

Ή θεωρούμε την αποτελεσματικότητα κάποιου ξεχωριστού αλγορίθμου ή θεωρούμε την αποτελεσματικότητα ολόκληρου του συστήματος στο σύνολό του. Δηλαδή, ο τεχνολογικός διαχωρισμός για τις αρθρωτές και συστηματικές δοκιμές δεν έχει νόημα. Επειδή σε διαφορετικά επίπεδα, τα ίδια εργαλεία, μπορούν να χρησιμοποιηθούν οι ίδιες τεχνικές.

Τέλος, με τις δοκιμές ενσωμάτωσης, ελέγξουμε αν, ως μέρος ενός συστήματος, οι μονάδες αλληλεπιδρούν σωστά μεταξύ τους. Δηλαδή, εκτελούμε πραγματικά τις ίδιες δοκιμές όπως στη δοκιμή του συστήματος, δίνουμε μόνο περαιτέρω προσοχή στο πώς αλληλεπιδρούν οι μονάδες μεταξύ τους. Εκτελέστε ορισμένους πρόσθετους ελέγχους. Αυτή είναι η μόνη διαφορά.

Ας προσπαθήσουμε ξανά να προσπαθήσουμε να κατανοήσουμε τη διαφορά μεταξύ συστημικών και αρθρωτών δοκιμών. Δεδομένου ότι ο διαχωρισμός αυτός βρίσκεται αρκετά συχνά, αυτή η διαφορά πρέπει να είναι.

Και αυτή η διαφορά εκδηλώνεται όταν δεν εκτελούμε τεχνολογική ταξινόμηση, αλλά μια ταξινόμηση Με στόχους Δοκιμές.

Η ταξινόμηση για τους σκοπούς είναι βολικό να εκτελεστεί χρησιμοποιώντας το "μαγικό τετράγωνο", το οποίο αρχικά εφευρέθηκε από τον Brian Marik και στη συνέχεια βελτιώθηκε η Erie Tannen.

Σε αυτή τη μαγική πλατεία, όλοι οι τύποι δοκιμών βρίσκονται σε τέσσερα τεταρτημόρια, ανάλογα με την προσοχή που η προσοχή επικεντρώνεται περισσότερο σε αυτές τις δοκιμές.

Κάθετα - Όσο μεγαλύτερος είναι ο τύπος των δοκιμών, η περισσότερη προσοχή δίνεται σε ορισμένες εξωτερικές εκδηλώσεις της συμπεριφοράς του προγράμματος, τόσο χαμηλότερο είναι, τόσο περισσότερο δίνουμε προσοχή στην εσωτερική τεχνολογική του συσκευή του προγράμματος.

Οριζόντια - οι αριστερές δοκιμές μας βρίσκονται, τόσο περισσότερη προσοχή τους πληρώνουμε στον προγραμματισμό, όσο πιο σωστό είναι, όσο περισσότερη προσοχή πληρώνουμε για χειροκίνητες δοκιμές και έρευνα του προγράμματος από ένα άτομο.

Συγκεκριμένα, σε αυτήν την πλατεία μπορείτε εύκολα να εισάγετε τέτοιους όρους ως δοκιμές αποδοχής, δοκιμή αποδοχής, δομοστοιχειωτά δοκιμή ακριβώς σε αυτή την κατανόηση στην οποία χρησιμοποιείται συχνότερα στη βιβλιογραφία. Αυτή είναι η δοκιμή χαμηλού επιπέδου με μεγάλη, με ένα συντριπτικό μερίδιο του προγραμματισμού. Δηλαδή, αυτές είναι όλες οι δοκιμές προγραμματισμένες, εκτελούνται πλήρως αυτόματα και η προσοχή καταβάλλεται κυρίως στην εσωτερική συσκευή του προγράμματος, είναι τα τεχνολογικά χαρακτηριστικά του.

Στην επάνω δεξιά γωνία, θα έχουμε δοκιμές χεριών που στοχεύουν στην εξωτερική συμπεριφορά του προγράμματος, ειδικότερα, δοκιμάζοντας την ευκολία χρήσης και στην κάτω δεξιά γωνία, πιθανότατα έχουμε επιθεωρηθεί από διαφορετικές μη λειτουργικές ιδιότητες: απόδοση, ασφάλεια, και ούτω καθεξής.

Έτσι, με βάση την ταξινόμηση με στόχους, αποδεικνύεται ότι είναι οι αρθρωτές δοκιμές στο ανώτατο τεταρτημόριο και όλα τα άλλα τεταρτημόρια είναι η δοκιμή συστήματος.

Ευχαριστώ για την προσοχή.

Βασικά στοιχεία της θεωρίας των δοκιμών

Βασικές έννοιες της θεωρίας των δοκιμών

Η μέτρηση ή η δοκιμή που πραγματοποιήθηκε για τον προσδιορισμό της κατάστασης ή των ικανοτήτων ενός αθλητή ονομάζεται Ζύμη .

Δεν μπορούν να χρησιμοποιηθούν όλες οι μετρήσεις ως δοκιμές, αλλά μόνο εκείνα που πληρούν τις ειδικές απαιτήσεις. Αυτά περιλαμβάνουν:

1. Η τυποποίηση (διαδικασία και οι συνθήκες δοκιμής θα πρέπει να είναι οι ίδιες σε όλες τις περιπτώσεις δοκιμής εφαρμογής).
2. Αξιοπιστία.
3. Ενημερωτικό.
4. Η παρουσία του συστήματος αξιολόγησης.

Οι δοκιμές που πληρούν τις απαιτήσεις της αξιοπιστίας και ενημερωτικού χαρακτήρα ονομάζονται sobota ή Αυθεντικός (Ελληνικά. Αυθεντικό - αξιόπιστο τρόπο).

Η διαδικασία δοκιμής καλείται Δοκιμασία ; Την αριθμητική τιμή που λαμβάνεται ως αποτέλεσμα - Αποτελέσματα δοκιμών (ή το αποτέλεσμα της δοκιμής). Για παράδειγμα, η λειτουργία 100 m είναι μια δοκιμή, η διαδικασία διεξαγωγής της περίστασης και της δοκιμής χρονισμού, ο χρόνος του αγώνα είναι το αποτέλεσμα της δοκιμής.

Οι δοκιμές που βασίζονται σε εργασίες με κινητήρα καλούνται Μοτέρ ή Μοτέρ . Τα αποτελέσματα αυτών μπορούν να είναι είτε τα κινητικά επιτεύγματα (ο χρόνος διέλευσης της απόστασης, ο αριθμός των επαναλήψεων που διέρχονται από την απόσταση κ.λπ.) ή φυσιολογικών και βιοχημικών δεικτών.

Μερικές φορές χρησιμοποιείται ένα, αλλά αρκετές δοκιμές που έχουν ένα μόνο στόχο τερματισμού (για παράδειγμα, αξιολόγηση της κατάστασης ενός αθλητή κατά την ανταγωνιστική περίοδο κατάρτισης). Μια τέτοια ομάδα δοκιμών καλείται Συγκρότημα ή Δοκιμαστική μπαταρία .

Η ίδια δοκιμή που εφαρμόζεται στην ίδια μελέτη πρέπει να χορηγείται με τις ίδιες συνθήκες τα συμπτωματικά αποτελέσματα (εκτός αν αλλάξουν τους μελετημένους). Ωστόσο, με την πιο αυστηρή τυποποίηση και τον ακριβή εξοπλισμό, τα αποτελέσματα των δοκιμών είναι πάντοτε κάπως ποικίλλουν. Για παράδειγμα, η προκύπτουσα δυναμομετρία που μόλις έδειξε το αποτέλεσμα των 215 kg στη δοκιμασία δυναμομετρίας, με επανειλημμένη εκτέλεση δείχνει μόνο 190 kg.

2. Αξιοπιστία των δοκιμών και τρόπων προσδιορισμού

Αξιοπιστία Η δοκιμή ονομάζεται βαθμός σύμπτωσης των αποτελεσμάτων κατά την επανεμφάνιση των ίδιων ανθρώπων (ή άλλα αντικείμενα) υπό τις ίδιες συνθήκες.

Η παραλλαγή των αποτελεσμάτων κατά την επανεξέταση ονομάζεται εσωτερικό άτομο, ή εσωτερική ομάδα ή ενδοκοινοτική.

Τέσσερις κύριοι λόγοι προκαλούν αυτή την παραλλαγή:

1. Αλλαγή της κατάστασης των μελετηθεί (κόπωση, εργασία, μάθηση, αλλαγή κινήτρων, συγκέντρωση προσοχής κ.λπ.).
2. Μη ελεγχόμενες αλλαγές στις εξωτερικές συνθήκες και τον εξοπλισμό (θερμοκρασία, άνεμος, υγρασία, τάση στο ηλεκτρικό δίκτυο, την παρουσία μη εξουσιοδοτημένων ατόμων κ.λπ.), δηλ. Όλα που συνδυάζουν τον όρο "σφάλμα τυχαίας μέτρησης".
3. Αλλαγή της κατάστασης ενός ατόμου που διεξάγει ή αξιολογεί τη δοκιμή (και, φυσικά, αντικαθιστά έναν πειραματιστή ή δικαστή σε άλλους).
4. Η ατέλεια της ζύμης (υπάρχουν τέτοιες δοκιμές που είναι εν γνώσειι ενοχλητικά. Για παράδειγμα, αν οι δοκιμές εκτελούν ελεύθερες ρίχνει σε ένα καλάθι μπάσκετ, τότε ακόμη και ένας παίκτης μπάσκετ που έχει ένα υψηλό ποσοστό των επιτυχιών μπορεί να λυπηθεί κατά λάθος κατά λάθος στην πρώτη ρίψη).

Η κύρια διαφορά στη θεωρία της αξιοπιστίας των δοκιμών στη θεωρία των σφαλμάτων μέτρησης είναι ότι στη θεωρία σφάλματος, η μετρούμενη τιμή θεωρείται αμετάβλητη και στη θεωρία των δοκιμών αξιοπιστίας θεωρείται ότι αλλάζει από τη μέτρηση στη μέτρηση. Για παράδειγμα, εάν πρέπει να μετρήσετε το αποτέλεσμα μιας προσπάθειας που έγινε σε μήκος μήκους από ένα διάδρομο, δεν μπορεί να αλλάξει σημαντικά και με την πάροδο του χρόνου. Φυσικά, λόγω τυχαίων αιτημάτων (για παράδειγμα, άνιση ένταση της ρουλέτας), είναι αδύνατο να μετρηθεί αυτό το αποτέλεσμα με μια ιδανική ακρίβεια (να πω μέχρι 0,0001 mm). Ωστόσο, χρησιμοποιώντας ένα ακριβέστερο όργανο μέτρησης (για παράδειγμα, μετρητή λέιζερ), μπορείτε να αυξήσετε την ακρίβειά τους στο απαιτούμενο επίπεδο. Ταυτόχρονα, εάν ο στόχος είναι να προσδιορίσει την ετοιμότητα του βραχυκυκλωτήρα σε ορισμένα στάδια του ετήσιου κύκλου κατάρτισης, η πιο ακριβής μέτρηση των αποτελεσμάτων που εμφανίζονται από αυτά ελάχιστα θα βοηθήσουν: τελικά, θα αλλάξουν από την προσπάθεια να δοκιμάσουν.

Για την αντιμετώπιση της ιδέας των μεθόδων που χρησιμοποιούνται για να κρίνουν την αξιοπιστία των δοκιμών, εξετάστε ένα απλοποιημένο παράδειγμα. Ας υποθέσουμε ότι πρέπει να συγκρίνετε τα αποτελέσματα των άλματα σε μήκος από ένα μέρος σε δύο αθλητές σε δύο ολοκληρωμένες προσπάθειες. Ας υποθέσουμε ότι τα αποτελέσματα καθενός από τους αθλητές ποικίλλουν εντός ± 10 cm από τη μέση τιμή και είναι ίσα, αντίστοιχα, 230 ± 10 cm (δηλαδή 220 και 240 cm) και 280 ± 10 cm (δηλαδή 270 και 290 cm). Στην περίπτωση αυτή, το συμπέρασμα, φυσικά, θα είναι εντελώς αδιαμφισβήτητο: ο δεύτερος αθλητής υπερβαίνει την πρώτη (οι διαφορές μεταξύ του μέσου όρου σε 50 cm είναι σαφώς υψηλότερες από τις τυχαίες ταλαντώσεις ± 10 cm). Εάν, με την ίδια παραλλαγή ενδιάμεσης (± 10 cm), η διαφορά μεταξύ των μέσων τιμών της μελέτης (διακλαδισμένη διακύμανση) θα είναι μικρή, τότε θα είναι πολύ πιο δύσκολο να γίνει η έξοδος. Ας υποθέσουμε ότι οι μέσες τιμές θα είναι περίπου ίσες με 220 cm (σε μία απόπειρα - 210, στο άλλο - 230 cm) και 222 cm (212 και 232 cm). Ταυτόχρονα, η πρώτη μελετήθηκε στην πρώτη προσπάθεια άλματα στα 230 cm και το δεύτερο είναι μόνο στα 212 cm. Και φαίνεται ότι το πρώτο είναι ουσιαστικά ισχυρότερο από το δεύτερο. Από αυτό το παράδειγμα, μπορεί να φανεί ότι η κύρια αξία δεν είναι η μόνη της μεταβλητότητα εντός της αγοράς, αλλά ο λόγος της με διαφορές αλληλεπίδρασης. Η ίδια ενδοκυτική μεταβλητότητα δίνει διαφορετική αξιοπιστία με ίσες διαφορές μεταξύ κλάσεων (στη συγκεκριμένη περίπτωση μεταξύ των μελετηθεί, σχήμα 14).

Σύκο. 14. Ο λόγος της διακυμάνσεως μεταξύ και ενδο-κλάσης με υψηλή (ανώτατη) και χαμηλή (χαμηλότερη) αξιοπιστία:

Σύντομα κατακόρυφη εγκεφαλικά επεισόδια - δεδομένα μεμονωμένων προσπαθειών.

Τα μέσα αποτελέσματα των τριών που μελετήθηκαν.

Η θεωρία της αξιοπιστίας των δοκιμών προχωράει από το γεγονός ότι το αποτέλεσμα οποιασδήποτε μέτρησης που διεξάγεται στο πρόσωπο είναι το άθροισμα δύο τιμών:

όπου: - το αποκαλούμενο πραγματικό αποτέλεσμα που θέλουν να διορθώσουν.

Ένα σφάλμα που προκαλείται από ανεξέλεγκτες αλλαγές στην κατάσταση των δοκιμαστικών και τυχαίων σφαλμάτων μέτρησης.

Σύμφωνα με το πραγματικό αποτέλεσμα, η μέση τιμή του Χ με απείρως μεγάλο αριθμό παρατηρήσεων στις ίδιες συνθήκες είναι (για αυτό, στο Χ θέτουν ένα σημάδι).

Εάν τα σφάλματα είναι τυχαία (το ποσό τους είναι μηδέν και σε ίση απόπειρες που δεν εξαρτώνται ο ένας από τον άλλο), τότε από μαθηματικά στατιστικά στοιχεία που ακολουθούν:

εκείνοι. Που είναι εγγεγραμμένα στο πείραμα της διασποράς των αποτελεσμάτων ισούται με την ποσότητα διασπορών των πραγματικών αποτελεσμάτων και των σφαλμάτων.

Συντελεστής αξιοπιστίας Ο λόγος της πραγματικής διασποράς στη διασπορά είναι εγγεγραμμένος στο πείραμα:

Εκτός από τον συντελεστή αξιοπιστίας, εξακολουθεί να χρησιμοποιείται Δείκτης αξιοπιστίας:

η οποία θεωρείται ως ένας θεωρητικός συντελεστής συσχέτισης των ονομαστικών τιμών δοκιμών με αληθινή.

Η έννοια του πραγματικού αποτελέσματος της δοκιμής είναι η αφαίρεση (σε εμπειρία είναι αδύνατο). Επομένως, πρέπει να χρησιμοποιήσετε έμμεσες μεθόδους. Οι περισσότεροι προτιμώμενοι για την αξιολόγηση της ανάλυσης διασποράς αξιοπιστίας, ακολουθούμενη από τον υπολογισμό των συντελεστών συσχέτισης ενδέκοπου. Ανάλυση διασποράς σας επιτρέπει να αποσυντεθούν η διακύμανση της δοκιμής στα συστατικά λόγω της επιρροής των μεμονωμένων παραγόντων. Για παράδειγμα, αν καταχωρήσετε τα αποτελέσματα στα αποτελέσματα μελετημένα σε οποιαδήποτε δοκιμή, επαναλαμβάνοντας αυτή τη δοκιμή σε διαφορετικές ημέρες και κάθε μέρα για να κάνετε αρκετές προσπάθειες, περιοδικά αλλάζοντας τους πειραματιστές, τότε θα υπάρξουν μεταβολές:

α) από το θέμα στο θέμα ·

β) από μέρα σε μέρα.

γ) από τον πειραματιστή στον πειραματιστή.

δ) από την προσπάθεια να δοκιμάσετε.

Η ανάλυση διασποράς καθιστά δυνατή την κατανομή και αξιολόγηση αυτών των παραλλαγών.

Έτσι, είναι απαραίτητο να εκτιμηθεί η πρακτικά αξιοπιστία της δοκιμής, πρώτον, να εκτελέσει μια ανάλυση διασποράς, δεύτερον, υπολογίζει τον συντελεστή συσχέτισης της ενδιάμεσης συσχέτισης (αναλογία αξιοπιστίας).

Με δύο προσπάθειες, η τιμή του συντελεστή συσχέτισης ενδοκοινοτικής συσχέτισης είναι πρακτικά συμπίπτει με τις τιμές του συνήθους συντελεστή συσχέτισης μεταξύ των αποτελεσμάτων της πρώτης και της δεύτερης απόπειρας. Επομένως, σε τέτοιες καταστάσεις, ένας συμβατικός συντελεστής συσχέτισης μπορεί να χρησιμοποιηθεί για την αξιολόγηση της αξιοπιστίας (εκτιμά την αξιοπιστία μιας, όχι δύο προσπαθειών).

Μιλώντας για την αξιοπιστία των δοκιμών, είναι απαραίτητο να διακρίνει τη σταθερότητά τους (αναπαραγωγιμότητα), συνέπεια, ισοδυναμία.

Υπό Σταθερότητα Οι δοκιμές κατανοούν την αναπαραγωγιμότητα των αποτελεσμάτων όταν επαναλαμβάνεται μετά από ένα συγκεκριμένο χρονικό διάστημα υπό τις ίδιες συνθήκες. Οι επαναλαμβανόμενες δοκιμές συνήθως καλούνται Επανεξετάστε.

Συνοχή Η δοκιμή χαρακτηρίζεται από την ανεξαρτησία των αποτελεσμάτων των δοκιμών από προσωπικές ιδιότητες ενός προσώπου που διενεργεί ή δοκιμασία αξιολόγησης.

Κατά την επιλογή μιας δοκιμής από έναν ορισμένο αριθμό δοκιμών ίδιου τύπου (για παράδειγμα, ένα σπριντ που διεξάγεται κατά 30, 60 και 100 μ.) Με παράλληλες μορφές, εκτιμάται ο βαθμός σύμπτωσης των αποτελεσμάτων. Υπολογίζεται μεταξύ της κλήσης συντελεστή συσχέτισης αποτελεσμάτων Αναλογία ισοδυναμίας.

Εάν όλες οι δοκιμές που περιλαμβάνονται σε οποιονδήποτε τύπο δοκιμών είναι εξαιρετικά ισοδύναμα, καλείται Ομοιογενής. Το σύνολο αυτό το σύνολο μετρά ένα από τα ακίνητα της ανθρώπινης κινητικότητας (για παράδειγμα, ένα συγκρότημα που αποτελείται από άλμα από το μέρος σε μήκος, επάνω και τριπλή. Το επίπεδο ανάπτυξης των υψηλής ταχύτητας ιδιότητες της ασφάλειας εκτιμάται). Εάν δεν υπάρχουν ισοδύναμες δοκιμές στο συγκρότημα, δηλαδή οι δοκιμές που περιλαμβάνονται σε αυτό μετρώνται διαφορετικές ιδιότητες, τότε καλείται ετερογενής (Για παράδειγμα, ένα συγκρότημα που αποτελείται από να γίνει δυναμομετρία, να πηδήσει acalac, τρέχει ανά 100 m).

Η αξιοπιστία των δοκιμών μπορεί να αυξηθεί σε κάποιο βαθμό από:

α) πιο αυστηρή τυποποίηση των δοκιμών ·

β) Αυξήστε τον αριθμό των προσπαθειών.

γ) να αυξήσει τον αριθμό των εκτιμητών (δικαστές, πειράματα) και στη βελτίωση της συνοχής των απόψεων τους ·

δ) να αυξήσει τον αριθμό των ισοδύναμων δοκιμών ·

ε) το καλύτερο κίνητρο των μελετηθεί.

Παράδειγμα 10.1.

Προσδιορίστε την αξιοπιστία των αποτελεσμάτων ενός τριπλού άλματος από τον τόπο στην αξιολόγηση των δυνατοτήτων ταχύτητας και ισχύος των αθλητών Sprint, εάν αυτά τα δείγματα έχουν ως εξής:

Απόφαση:

1. Εφαρμόστε τα αποτελέσματα των δοκιμών στον πίνακα εργασίας:

2. Αντικατάσταση των αποτελεσμάτων που λαμβάνονται στον τύπο υπολογισμού του συντελεστή κατάταξης της συσχέτισης:

3. Ορίζουμε τον αριθμό των βαθμών ελευθερίας από τον τύπο:

Παραγωγή: Επομένως, η προκύπτουσα αξία διακανονισμού είναι επομένως με εμπιστοσύνη στο 99% Μπορούμε να πούμε ότι η δοκιμή τριπλού άλματος είναι αξιόπιστη.

Το πρώτο συστατικό, η θεωρία των δοκιμών, περιέχει μια περιγραφή των στατιστικών διαγνωστικών μοντέλων επεξεργασίας δεδομένων. Εδώ είναι τα μοντέλα ανάλυσης απαντήσεων σε εργασίες δοκιμής και το μοντέλο υπολογισμού των συνολικών αποτελεσμάτων των δοκιμών. Ο Mellenberg (1980, 1990) το ονόμασε "ψυχομετρία". Θεωρία κλασικής δοκιμής, σύγχρονη θεωρία δοκιμών (ή μοντέλο ανάλυση απαντήσεων σε εργασίες δοκιμής - IRT) και μοντέλο

Τα δείγματα εργασιών αποτελούν τους τρεις πιο σημαντικούς τύπους μοντέλων θεωρίας δοκιμών. Το θέμα της ψυχοδιαγνωστικής είναι τα πρώτα δύο μοντέλα.

Θεωρία κλασικής δοκιμής. Με βάση αυτή τη θεωρία, έχουν αναπτυχθεί οι περισσότερες πνευματικές και προσωπικές δοκιμές. Η κεντρική έννοια αυτής της θεωρίας είναι η έννοια της "αξιοπιστίας". Υπό αξιοπιστία είναι κατανοητό ως η συνοχή των αποτελεσμάτων κατά την επανεκτίμηση. Σε εγχειρίδια αναφοράς, αυτή η έννοια είναι συνήθως πολύ σύντομη, και στη συνέχεια δίνεται μια λεπτομερής περιγραφή της συσκευής των μαθηματικών στατιστικών. Σε αυτό το εισαγωγικό, κεφάλαιο θα παρουσιάσουμε μια συμπιεσμένη περιγραφή της κύριας αξίας της σημειωμένης ιδέας. Στην κλασική θεωρία των δοκιμών, η αξιόπιστη είναι η επανάληψη των αποτελεσμάτων αρκετών διαδικασιών μέτρησης (κυρίως μετρήσεις με δοκιμές). Η έννοια της αξιοπιστίας περιλαμβάνει τον υπολογισμό του σφάλματος μέτρησης. Τα αποτελέσματα που ελήφθησαν κατά τη διάρκεια της διαδικασίας δοκιμών μπορούν να εκπροσωπούνται ως το άθροισμα του πραγματικού αποτελέσματος και σφάλματος μέτρησης:

Xi \u003d ti.+ Ej.

Οπου Xi- Αξιολόγηση των επιτευχθέντων αποτελεσμάτων, η TI είναι ένα πραγματικό αποτέλεσμα, και Ej.- Σφάλμα μέτρησης.

Η αξιολόγηση των επιτευχθέντων αποτελεσμάτων είναι, κατά κανόνα, ο αριθμός των σωστών απαντήσεων στα καθήκοντα της δοκιμής. Το πραγματικό αποτέλεσμα μπορεί να θεωρηθεί ως μια πραγματική αξιολόγηση στην πλατωνική έννοια (Gulliksen, 1950). Η έννοια των αναμενόμενων αποτελεσμάτων είναι ευρέως διαδεδομένη, δηλ. Αντιπροσωπείες σημείων που μπορούν να ληφθούν ως αποτέλεσμα μεγάλου αριθμού επαναλήψεων διαδικασιών μέτρησης (Κύριος & Novich, 1968). Αλλά η εφαρμογή της ίδιας διαδικασίας αξιολόγησης με ένα άτομο δεν είναι δυνατή. Ως εκ τούτου, πρέπει να αναζητήσετε άλλες λύσεις στο πρόβλημα (Witlman, 1988).

Στο πλαίσιο αυτής της έννοιας, ορισμένες υποθέσεις γίνονται σε σχέση με τα αληθινά αποτελέσματα και τα σφάλματα μέτρησης. Οι τελευταίοι γίνονται αποδεκτές ως ανεξάρτητο παράγοντα, το οποίο, φυσικά, είναι μια βάσιμη υπόθεση, δεδομένου ότι οι τυχαίες διακυμάνσεις των αποτελεσμάτων δεν δίνουν εποχές: r \u003d 0.

Θεωρείται ότι η συσχέτιση μεταξύ πραγματικών βαθμολογιών και σφαλμάτων μέτρησης δεν υπάρχει: r ee \u003d 0.

Το συνολικό σφάλμα είναι 0, επειδή Ως πραγματική εκτίμηση, λαμβάνεται η αριθμητική έννοια:

Αυτές οι υποθέσεις μας οδηγούν ως αποτέλεσμα ενός ορισμένου ορισμού της αξιοπιστίας ως λόγο του αληθινού αποτελέσματος σε κοινή διασπορά ή έκφραση: 1 μείον τη σχέση, στην οποία ο αριθμός σφάλματος μέτρησης και ο παρονομαστής - η συνολική διασπορά:

, Ή

Από αυτόν τον τύπο ορισμός της αξιοπιστίας, λαμβάνουμε αυτό το σφάλμα διασποράς S 2 (e)Είναι ίση με τη συνολική διασπορά μεταξύ των περιπτώσεων (1 - R xx). Έτσι, το τυπικό σφάλμα μέτρησης καθορίζεται από τον τύπο:

Μετά τη θεωρητική τεκμηρίωση της αξιοπιστίας και των παραγώγων της, είναι απαραίτητο να καθοριστεί ο δείκτης αξιοπιστίας μιας δοκιμής. Υπάρχουν πρακτικές διαδικασίες για την αξιολόγηση της αξιοπιστίας των δοκιμών, όπως η χρήση εναλλάξιμων εντύπων (παράλληλες δοκιμές), η διάσπαση των εργασιών σε δύο μέρη, η επανεξέταση και η μέτρηση της εσωτερικής συνέπειας. Κάθε κατάλογος περιέχει τους δείκτες σταθερότητας των αποτελεσμάτων των δοκιμών:

r xx '\u003d r (x 1, x 2)

Οπου r xx ' - συντελεστής σταθερότητας, και x 1 και x 2 - τα αποτελέσματα των δύο διαστάσεων.

Η έννοια της αξιοπιστίας των εναλλάξιμων μορφών εισήχθη και αναπτύχθηκε από τον Gullixen (1950). Αυτή η διαδικασία είναι απολύτως επίπονη, διότι σχετίζεται με την ανάγκη δημιουργίας μιας παράλληλης σειράς καθηκόντων.

r xx '\u003d r (x 1, x 2)

Οπου r xx ' - συντελεστής ισοδυναμίας, και x 1 και x 2 - δύο παράλληλες δοκιμές.

Η ακόλουθη διαδικασία είναι η διάσπαση της κύριας δοκιμής σε δύο μέρη Α και Β είναι πιο απλή στη χρήση. Οι δείκτες που λαμβάνονται και στα δύο μέρη της δοκιμής συσχετίζονται. Με τη βοήθεια του τύπου Spearman-Brown, η αξιοπιστία της δοκιμής στο σύνολό του εκτιμάται:

Όπου και b - δύο παράλληλα μέρη της δοκιμής.

Η ακόλουθη μέθοδος είναι ο ορισμός της εσωτερικής συνέπειας των εργασιών δοκιμής. Αυτή η μέθοδος βασίζεται στον ορισμό των εποχών των επιμέρους καθηκόντων. SG - διασπορά αυθαίρετη επιλεγμένη εργασία και SGH - covarialce δύο αυθαίρετα επιλεγμένων καθηκόντων. Ο πιο συχνά χρησιμοποιούμενος συντελεστής για τον καθορισμό της εσωτερικής συνέπειας είναι ο "συντελεστής άλφα" του Kronbach. Χρησιμοποιείται επίσης ο τύπος KR20 και Λ-2(Lambda-2).

Στην κλασική έννοια της αξιοπιστίας, προσδιορίζονται σφάλματα μέτρησης τόσο στη διαδικασία δοκιμής όσο και στη διαδικασία των παρατηρήσεων. Πηγές αυτών των σφαλμάτων είναι διαφορετικές: Αυτές μπορεί επίσης να είναι προσωπικά χαρακτηριστικά και χαρακτηριστικά των συνθηκών δοκιμών και τα ίδια τα εργασίες δοκιμής. Υπάρχουν συγκεκριμένες μέθοδοι υπολογισμού των σφαλμάτων. Γνωρίζουμε ότι οι παρατηρήσεις μας μπορεί να είναι εσφαλμένες, τα μεθοδικά μας όργανα είναι ατελείς με τον ίδιο τρόπο όπως οι ίδιοι οι άνθρωποι είναι ατελείς. (Πώς να μην θυμηθείτε τον Σαίξπηρ: "Είστε αναξιόπιστοι, των οποίων το όνομα είναι ένα άτομο"). Το γεγονός ότι στο κλασικό μέτρο των δοκιμών σφαλμάτων μέτρησης είναι εξηγημένο και εξηγείται είναι ένα σημαντικό θετικό σημείο.

Η κλασική θεωρία δοκιμών έχει πολλά βασικά χαρακτηριστικά που μπορούν να θεωρηθούν ως μειονεκτήματα. Ορισμένα από αυτά τα χαρακτηριστικά σημειώνονται στα βιβλία αναφοράς, αλλά η σημασία τους (από την καθημερινή άποψη) υπογραμμίζεται σπάνια, καθώς και το γεγονός ότι πρέπει να θεωρηθούν ελλείψεις από τη θεωρητική ή μεθοδολογική άποψη.

Πρώτα. Η θεωρία κλασικής δοκιμής και η έννοια της αξιοπιστίας επικεντρώνονται στον υπολογισμό των συνολικών δεικτών δοκιμών, τα οποία είναι αποτέλεσμα της προσθήκης εκτιμήσεων που λαμβάνονται σε ξεχωριστές εργασίες. Έτσι, όταν εργάζεστε

Δεύτερος. Ο συντελεστής αξιοπιστίας συνεπάγεται αξιολόγηση της διακύμανσης των μετρούμενων δεικτών. Επομένως, ο παράγοντας αξιοπιστίας θα είναι χαμηλότερος εάν (με την ισότητα άλλων δεικτών) το δείγμα είναι πιο ομοιογενές. Δεν υπάρχει κανένας συντελεστής εσωτερικής συνοχής των εργασιών δοκιμής, αυτός ο συντελεστής είναι πάντα "συμφραζόμενος". Το Crocker και το Aldjina (1986), για παράδειγμα, προσφέρουν μια ειδική φόρμουλα "διόρθωση για ομοιογενές δείγμα" που προορίζεται για τα υψηλότερα και χαμηλότερα αποτελέσματα που λαμβάνονται με δοκιμές. Για τη διάγνωση, είναι σημαντικό να γνωρίζουμε τα χαρακτηριστικά των παραλλαγών στο σύνολο δειγμάτων, διαφορετικά δεν θα είναι σε θέση να χρησιμοποιεί τους συντελεστές της εσωτερικής συνέπειας που καθορίζονται στο εγχειρίδιο για αυτή τη δοκιμή.

Τρίτος. Το φαινόμενο των πληροφοριών σχετικά με τον μέσο αριθμητικό δείκτη αποτελεί λογική συνέπεια της κλασικής έννοιας της αξιοπιστίας. Εάν η αποτίμηση στη δοκιμή κυμαίνεται (δηλαδή, δεν είναι αρκετά αξιόπιστη), είναι πολύ πιθανό ότι κατά την επανάληψη της διαδικασίας, τα άτομα που έχουν χαμηλές δείκτες θα λάβουν υψηλότερα σημεία και αντίστροφα, τα άτομα με υψηλούς δείκτες είναι χαμηλά. Αυτό το τεχνούργημα των διαδικασιών μέτρησης δεν μπορεί να γίνει λάθος για μια πραγματική αλλαγή ή μια εκδήλωση αναπτυξιακών διαδικασιών. Αλλά ταυτόχρονα το οριοθέτησε δεν είναι εύκολο, επειδή Ποτέ δεν μπορείτε να εξαλείψετε τη δυνατότητα αλλαγής κατά την ανάπτυξη. Για πλήρη εμπιστοσύνη είναι απαραίτητο "Σύγκριση με την ομάδα ελέγχου.

Το τέταρτο χαρακτηριστικό των δοκιμών που αναπτύχθηκαν σύμφωνα με τις αρχές της κλασσικής θεωρίας είναι η παρουσία ρυθμιστικών δεδομένων. Η γνώση των κανόνων δοκιμής επιτρέπει στον ερευνητή να ερμηνεύσει επαρκώς τα αποτελέσματα της δοκιμής. Εκτός του κανόνα, οι εκτιμήσεις δοκιμών στερούνται νόημα. Η ανάπτυξη των κανόνων δοκιμής είναι μια αρκετά ακριβή επιχείρηση, αφού ο ψυχολόγος πρέπει να λαμβάνει αποτελέσματα δοκιμών σε αντιπροσωπευτικό δείγμα.

2 J. Ter Laak

Αν μιλάμε για τις ελλείψεις της κλασικής έννοιας της αξιοπιστίας, τότε η δήλωση του Siy TSMA είναι κατάλληλη εδώ (1992, r. 123-125). Σημειώνει ότι η πρώτη και σημαντικότερη υπόθεση της κλασσικής θεωρίας των δοκιμών είναι ότι τα αποτελέσματα των δοκιμών υπόκεινται στην αρχή του διαστήματος. Ωστόσο, δεν υπάρχει έρευνα που να επιβεβαιώνει αυτή την υπόθεση δεν είναι. Στην πραγματικότητα, είναι "μέτρηση σε αυθαίρετα καθορισμένο κανόνα". Αυτή η λειτουργία θέτει την κλασική θεωρία των δοκιμών σε λιγότερο ευνοϊκή θέση σε σύγκριση με τις κλίμακες μέτρησης και, φυσικά, σε σύγκριση με τη σύγχρονη θεωρία των δοκιμών. Πολλές μέθοδοι ανάλυσης δεδομένων (ανάλυση διασποράς. Ανάλυση παλινδρόμησης, ανάλυση συσχέτισης και παράγοντα) βασίζονται στην ύπαρξη της κλίμακας διαστήματος. Ωστόσο, δεν έχει σταθερή αιτιολόγηση. Εξετάστε την κλίμακα των πραγματικών αποτελεσμάτων ως κλίμακα τιμών ψυχολογικών χαρακτηριστικών (για παράδειγμα, αριθμητικές ικανότητες, νοημοσύνη, νευρωτισμός) μπορεί να είναι πιθανώς προφανώς.

Η δεύτερη παρατήρηση αφορά τα αποτελέσματα των δοκιμών της δοκιμής - αυτοί δεν είναι απόλυτοι δείκτες ενός ή άλλου ψυχολογικού χαρακτήρα των δοκιμασμένων, πρέπει να θεωρούνται μόνο ως τα αποτελέσματα της εφαρμογής μιας δοκιμής. Δύο δοκιμές μπορούν να υποβάλουν αίτηση για τη μελέτη των ίδιων ψυχολογικών χαρακτηριστικών (για παράδειγμα, νοημοσύνη, προφορικές ικανότητες, εξωστρέφεια), αλλά αυτό δεν σημαίνει ότι αυτές οι δύο δοκιμές είναι ισοδύναμες και διαθέτουν τις ίδιες δυνατότητες. Σύγκριση των δεικτών δύο ατόμων που έχουν δοκιμαστεί από διαφορετικές δοκιμές, εσφαλμένα. Το ίδιο ισχύει και για την πλήρωση δύο διαφορετικών δοκιμών με ένα θέμα. Η τρίτη σημείωση αναφέρεται στην υπόθεση ότι το τυποποιημένο σφάλμα μέτρησης είναι το ίδιο σε σχέση με οποιοδήποτε επίπεδο των μετρούμενων ατομικών ικανοτήτων. Ωστόσο, δεν υπάρχει εμπειρική επαλήθευση αυτής της παραδοχής. Έτσι, για παράδειγμα, δεν υπάρχει καμία εγγύηση που δοκιμάστηκε με καλές μαθηματικές ικανότητες όταν η εργασία με μια σχετικά απλή αριθμητική δοκιμή θα λάβει υψηλά σημεία. Σε αυτή την περίπτωση, ένα άτομο με χαμηλές ή μεσαίες ικανότητες θα εκτιμηθεί ιδιαίτερα.

Στο πλαίσιο της τρέχουσας θεωρίας δοκιμών ή της θεωρίας της ανάλυσης απαντήσεων στις εργασίες δοκιμής, περιγράφεται μια περιγραφή σε ένα μεγάλο

Τον αριθμό των μοντέλων πιθανών απαντήσεων των ερωτηθέντων. Αυτά τα μοντέλα διαφέρουν στις παραδοχές τους, καθώς και τις απαιτήσεις για τα ληφθέντα δεδομένα. Το μοντέλο Rasha θεωρείται συχνά ως συνώνυμο των θεωριών ανάλυσης ανταπόκρισης σε εργασίες δοκιμής (1RT). Στην πραγματικότητα, αυτό είναι μόνο ένα από τα μοντέλα. Ο τύπος που αντιπροσωπεύεται σε αυτό για να περιγράψει τη χαρακτηριστική καμπύλη εργασίας G έχει ως εξής:

Οπου ΣΟΛ.- ένα ξεχωριστό έργο της δοκιμής. ejr- τη λειτουργία των εκθετικών (μη γραμμική εξάρτηση) · δ (Δέλτα) - το επίπεδο της δυσκολίας της ζύμης.

Άλλα καθήκοντα της δοκιμής, για παράδειγμα h,Πάρτε επίσης τις δικές τους χαρακτηριστικές καμπύλες. Όροι όρους Δ\u003e Δ§ (gσημαίνει ότι Η.- πιο δύσκολο έργο. Κατά συνέπεια, για οποιαδήποτε αξία του δείκτη Θ ("Theta" - τις λανθάνουσες ιδιότητες των ικανοτήτων της δοκιμής) πιθανότητα επιτυχημένης αποστολής Η.πιο λιγο. Αυτό το μοντέλο ονομάζεται αυστηρό επειδή είναι προφανές ότι με χαμηλό βαθμό σοβαρότητας, η πιθανότητα αποστολής είναι κοντά στο μηδέν. Σε αυτό το μοντέλο δεν υπάρχει χώρος για εικασία και υποθέσεις. Για εργασίες με επιλογές, δεν χρειάζεται να κάνετε υποθέσεις σχετικά με την πιθανότητα επιτυχίας. Επιπλέον, το μοντέλο αυτό είναι αυστηρό υπό την έννοια ότι όλα τα καθήκοντα της δοκιμής πρέπει να έχουν την ίδια διακριτική ικανότητα (αντανάκλαση με διακρίσεις στην απότομη κλίμακα της καμπύλης. Εδώ είναι δυνατόν να οικοδομήσουμε την κλίμακα του κότου, σύμφωνα με την οποία σε κάθε μία Χαρακτηριστική καμπύλη, η πιθανότητα της εργασίας αλλάζει από έως και 1). Εξαιτίας αυτού, οι συνθήκες δεν είναι όλες οι εργασίες μπορούν να συμπεριληφθούν στις δοκιμές που δημιουργούνται με βάση το μοντέλο Rasha.

Υπάρχουν πολλές επιλογές για αυτό το μοντέλο (για παράδειγμα, Birnbaura, 1968, δείτε τον Κύριο & Novik). Κάνει την ύπαρξη καθηκόντων με διαφορετικά διακρίματα

ικανότητα.

Ο Ολλανδός Explorer Mokken (1971) ανέπτυξε δύο μοντέλα για την ανάλυση των απαντήσεων στα καθήκοντα της δοκιμής, οι απαιτήσεις των οποίων δεν είναι τόσο αυστηρές όσο στο μοντέλο της βιασύνης και επομένως μπορεί να είναι πιο ρεαλιστικές. Ως κύρια προϋπόθεση

Η Viya Mokken προτείνει τη θέση ότι η χαρακτηριστική καμπύλη της εργασίας πρέπει να ακολουθεί μονότονη, χωρίς διαλείμματα. Όλα τα καθήκοντα της δοκιμής ταυτόχρονα αποσκοπούν στη μελέτη των ίδιων ψυχολογικών χαρακτηριστικών, τα οποία πρέπει να μετρηθούν σε.Οποιαδήποτε μορφή αυτής της εξάρτησης επιτρέπεται μέχρι να διακοπεί. Κατά συνέπεια, το σχήμα της χαρακτηριστικής καμπύλης δεν καθορίζεται από οποιαδήποτε συγκεκριμένη λειτουργία. Αυτή η "ελευθερία" σας επιτρέπει να χρησιμοποιείτε πιο δοκιμαστικές εργασίες και το επίπεδο εκτίμησης δεν είναι υψηλότερο από το συνηθισμένο.

Η μεθοδολογία των μοντέλων απαντήσεων στα καθήκοντα της δοκιμής (IRT) διαφέρει από τη μεθοδολογία των περισσότερων πειραματικών και συσχετισμών μελετών. Το μαθηματικό μοντέλο έχει σχεδιαστεί για να μελετήσει τη συμπεριφορά, τα γνωστικά, συναισθηματικά χαρακτηριστικά, καθώς και αναπτυξιακά φαινόμενα. Αυτά τα υπό εξέταση φαινόμενα περιορίζονται συχνά στις απαντήσεις στα καθήκοντα, τα οποία επέτρεψαν στο Mel-Lenberg (1990) να καλέσουν τη θεωρία της IRT "μίνι θεωρία για τη μίνι συμπεριφορά". Τα αποτελέσματα της μελέτης μπορούν να παρουσιαστούν σε κάποιο βαθμό ως καμπύλες συνέπειας, ειδικά σε περιπτώσεις όπου απουσιάζουν οι θεωρητικές ιδέες για τα μελετημένα χαρακτηριστικά. Μέχρι τώρα, η διάθεσή μας έχει μόνο μονάδες πληροφοριών, ικανότητες και προσωπικές δοκιμές που δημιουργούνται με βάση πολυάριθμα μοντέλα θεωρίας IRT. Οι παραλλαγές του μοντέλου Rasha χρησιμοποιούνται συχνότερα στην ανάπτυξη δοκιμών επίτευξης (Verhelst, 1993) και το μοντέλο του Mockene είναι πιο κατάλληλο για αναπτυξιακά φαινόμενα (βλέπε επίσης CH. 6).

Η απάντηση ελέγχεται από την εργασία της δοκιμής είναι η κύρια μονάδα των μοντέλων IRT. Ο τύπος απόκρισης καθορίζεται από τον βαθμό σοβαρότητας στους ανθρώπους που μελετημένα χαρακτηριστικά. Ένα τέτοιο χαρακτηριστικό μπορεί να είναι, για παράδειγμα, αριθμητικές ή χωρικές ικανότητες. Στις περισσότερες περιπτώσεις, αυτή είναι μία ή άλλη πτυχή της νοημοσύνης, των χαρακτηριστικών των επιτευγμάτων ή των προσωπικών χαρακτηριστικών. Θεωρείται ότι μεταξύ της θέσης αυτού του συγκεκριμένου προσώπου σε ένα συγκεκριμένο εύρος του χαρακτηριστικού και την πιθανότητα επιτυχούς εφαρμογής ενός ή άλλου έργου, υπάρχει μια μη γραμμική εξάρτηση. Η μη γραμμικότητα αυτής της εξάρτησης με μια συγκεκριμένη έννοια είναι διαισθητική. Διάσημες φράσεις "Οποιαδήποτε αρχή είναι δύσκολη" (αργή

Η γραμμική εκκίνηση) και "να γίνει ιερή δεν είναι τόσο απλή" σημαίνει ότι η περαιτέρω βελτίωση μετά την επίτευξη ενός συγκεκριμένου επιπέδου είναι δύσκολη. Η καμπύλη προσεγγίζει αργά, αλλά σχεδόν ποτέ δεν φτάνει το 100% του επιπέδου επιτυχίας.

Ορισμένα μοντέλα μάλλον αντιβαίνουν στην διαισθητική κατανόησή μας. Πάρτε ένα τέτοιο παράδειγμα. Ένα άτομο με αυθαίρετο χαρακτηριστικό δείκτη 1,5 έχει 60 τοις εκατό πιθανότητα επιτυχίας κατά την εκτέλεση μιας εργασίας. Αυτό έρχεται σε αντίθεση με την διαισθητική μας κατανόηση μιας τέτοιας κατάστασης, διότι μπορεί να αντιμετωπίσει επιτυχώς με την εργασία, ή να μην το αντιμετωπίσει καθόλου. Πάρτε αυτό το παράδειγμα: 100 φορές ένα άτομο προσπαθεί να πάρει ύψος 1m 50 cm. Η επιτυχία τον συνοδεύει 60 φορές, δηλ. Έχει πιθανότητα επιτυχίας 60 τοις εκατό.

Για να εκτιμηθεί ο βαθμός σοβαρότητας, τα χαρακτηριστικά πρέπει τουλάχιστον σε δύο καθήκοντα. Το μοντέλο Rasha αναλαμβάνει τον ορισμό της σοβαρότητας των χαρακτηριστικών, ανεξάρτητα από τη δυσκολία του έργου. Επίσης, αντιτίθεται στην διαισθητική μας κατανόηση: Ας υποθέσουμε ότι ένα άτομο έχει πιθανότητα 80 τοις εκατό να μεταβεί πάνω από 1,30 μ. Αν ναι, τότε σύμφωνα με την χαρακτηριστική καμπύλη εργασίας, έχει πιθανότητα 60 τοις εκατό να μεταβεί πάνω από 1,50 m και 40 τοις εκατό την πιθανότητα Το άλμα πάνω είναι 1,70 μ. Συνεπώς, ανεξάρτητα από την αξία μιας ανεξάρτητης μεταβλητής (ύψος), μπορείτε να υπολογίσετε την ικανότητα ενός ατόμου να πηδήσει σε ύψος.

Υπάρχουν περίπου 50 μοντέλα IRT (Goldstein & Wood, 1989). Υπάρχουν πολλές μη γραμμικές λειτουργίες που περιγράφουν (εξηγώντας) την πιθανότητα επιτυχίας στην εκτέλεση μιας εργασίας ή μιας ομάδας καθηκόντων. Οι απαιτήσεις και οι περιορισμοί αυτών των μοντέλων είναι διαφορετικοί και αυτές οι διαφορές μπορούν να ανιχνευθούν κατά τη σύγκριση του μοντέλου της βιασύνης και της κλίμακας της μουνίνας. Οι απαιτήσεις αυτών των μοντέλων περιλαμβάνουν:

1) την ανάγκη να προσδιοριστούν τα μελετημένα χαρακτηριστικά και την αξιολόγηση της θέσης του ατόμου στην περιοχή αυτού του χαρακτηριστικού.

2) αξιολόγηση του καθορισμού των καθηκόντων ·

3) Ελέγξτε συγκεκριμένα μοντέλα. Στην ψυχομετρία, αναπτύχθηκαν πολλές διαδικασίες για την επαλήθευση του μοντέλου.

Σε ορισμένα εγχειρίδια αναφοράς, η θεωρία IRT θεωρείται ως μορφή ανάλυσης των εργασιών δοκιμής (βλέπε, για παράδειγμα,

Croker & Algina, J 986). Εντούτοις, είναι δυνατόν να υπερασπιστεί η άποψη ότι η θεωρία της IRT είναι μια "μίνι θεωρία μίνι συμπεριφοράς". Υποστηρικτές της θεωρίας της IRT παρατηρήστε ότι εάν υπάρχουν ατελείς έννοιες (μοντέλα) του μεσαίου επιπέδου, τότε τι μπορεί να ειπωθεί για πιο σύνθετα κατασκευάσματα στην ψυχολογία;

Κλασική και σύγχρονη θεωρία δοκιμών. Οι άνθρωποι δεν μπορούν να συγκρίνουν πράγματα που φαίνονται σχεδόν τα ίδια. (Ίσως καθημερινό ισοδύναμο ψυχομετρίας και αποτελείται κυρίως στη σύγκριση των ανθρώπων για ουσιαστικά χαρακτηριστικά και επιλογές μεταξύ τους). Κάθε μία από τις παρουσιαστικές θεωρίες - και η θεωρία των σφαλμάτων αξιολόγησης και το μαθηματικό μοντέλο απαντήσεων στα καθήκοντα της δοκιμής - έχει τους δικούς του υποστηρικτές (Goldstein & Wood, 1986).

Τα μοντέλα IRT δεν προκαλούν επιρροές στο γεγονός ότι "αξιολόγηση σύμφωνα με τους κανόνες", σε αντίθεση με την κλασική θεωρία των δοκιμών. Το μοντέλο IRT επικεντρώνεται στην ανάλυση των αξιολογούμενων χαρακτηριστικών. Χαρακτηριστικά του ατόμου και των χαρακτηριστικών των καθηκόντων υπολογίζονται από τις κλίμακες (κανονικό ή διάστημα). Επιπλέον, είναι δυνατόν να συγκριθούν οι επιδόσεις διαφορετικών δοκιμών που αποσκοπούν στην εκμάθηση παρόμοιων χαρακτηριστικών. Τέλος, η αξιοπιστία των άνισων για κάθε αξία στην κλίμακα και οι μέσοι δείκτες είναι συνήθως πιο αξιόπιστοι από τους δείκτες που βρίσκονται στην αρχή και στο τέλος της κλίμακας. Έτσι, τα μοντέλα IRT στις θεωρητικές σχέσεις είναι προληπτικές. Υπάρχουν επίσης διαφορές στην πρακτική χρήση της σύγχρονης θεωρίας των δοκιμών και της κλασσικής θεωρίας (Sijstma, 1992, σ. 127-130). Η σύγχρονη θεωρία των δοκιμών είναι πιο περίπλοκη σε σύγκριση με την κλασική, έτσι ώστε να χρησιμοποιείται λιγότερο από μη ειδικούς. Επιπλέον, η IRT θέτει ειδικές απαιτήσεις για καθήκοντα. Αυτό σημαίνει ότι τα καθήκοντα πρέπει να αποκλειστούν από τη δοκιμή εάν δεν πληρούν τις απαιτήσεις του μοντέλου. Αυτός ο κανόνας ισχύει και για τις αναθέσεις που ήταν μέρος των ευρέως χρησιμοποιούμενων δοκιμών που χτίστηκαν στις αρχές της κλασσικής θεωρίας. Η δοκιμή γίνεται μικρότερη και συνεπώς η αξιοπιστία μειώνεται.

Το IRT προσφέρει μαθηματικά μοντέλα για να μελετήσει τα πραγματικά φαινόμενα. Τα μοντέλα θα πρέπει να μας βοηθήσουν να κατανοήσουμε τις βασικές πτυχές αυτών των φαινομένων. Ωστόσο, η κύρια θεωρητική ερώτηση βρίσκεται εδώ. Τα μοντέλα μπορούν να ληφθούν υπόψη

Η προσέγγιση Watikak στη μελέτη της περίπλοκης πραγματικότητας στην οποία ζούμε. Αλλά το μοντέλο και η πραγματικότητα δεν είναι το ίδιο πράγμα. Σύμφωνα με μια απαισιόδοξη ματιά, είναι δυνατόν να προσομοιωθεί μόνο ένα μόνο (και το ηθικό όχι τα πιο ενδιαφέροντα) είδη συμπεριφοράς. Μπορείτε επίσης να ικανοποιήσετε τη δήλωση ότι η πραγματικότητα δεν υπόκειται σε μοντελοποίηση καθόλου, επειδή Δεν υπακούει σε έναν αιτιώδη νόμο. Στην καλύτερη περίπτωση, είναι δυνατό να προσομοιωθούν τα ατομικά (ιδανικά) φαινόμενα συμπεριφοράς. Υπάρχει ένα άλλο, πιο αισιόδοξο, εξετάστε τη δυνατότητα μοντελοποίησης. Η παραπάνω θέση εμποδίζει τη δυνατότητα βαθιάς κατανόησης της φύσης των φαινομένων της ανθρώπινης συμπεριφοράς. Η χρήση ενός συγκεκριμένου μοντέλου εγείρει μερικές από τις πιο θεμελιώδεις ερωτήσεις. Κατά τη γνώμη μας, δεν είναι αμφίβολο ότι η IRT είναι η έννοια της θεωρητικά και τεχνικά ανώτερων από την κλασική θεωρία των δοκιμών.

Ο πρακτικός σκοπός των δοκιμών, για οποιαδήποτε θεωρητική βάση, δεν δημιουργούνται, είναι να εντοπιστούν σημαντικά κριτήρια και την καθιέρωση των χαρακτηριστικών ορισμένων ψυχολογικών κατασκευαστών πάνω τους. Το μοντέλο IRT έχει πλεονεκτήματα και από την άποψη αυτή; Είναι πιθανό οι δοκιμές που δημιουργούνται βάσει αυτού του μοντέλου να μην δίνουν μια ακριβέστερη πρόβλεψη σε σύγκριση με τις δοκιμές που δημιουργούνται με βάση την κλασσική θεωρία και είναι πιθανό η συμβολή τους στην ανάπτυξη ψυχολογικών κατασκευών να μην είναι πιο σημαντική. Οι διαγνώσεις προτιμούν τα κριτήρια που αφορούν άμεσα ένα ξεχωριστό πρόσωπο, το Ινστιτούτο ή την Κοινότητα. Ένα μοντέλο, πιο τέλειο σε επιστημονική σχέση, "ipso facto" * δεν καθορίζει ένα καταλληλότερο κριτήριο και είναι ένα ορισμένο βαθμό περιορισμένο στην εξήγηση επιστημονικών κατασκευών. Προφανώς, η ανάπτυξη των δοκιμών που βασίζονται στην κλασική θεωρία θα συνεχιστεί, αλλά ταυτόχρονα θα δημιουργηθούν νέα μοντέλα IRT, που θα επεκταθούν στη μελέτη ενός μεγαλύτερου αριθμού ψυχολογικών φαινομένων.

Στην κλασική θεωρία των δοκιμών, διακρίνονται οι έννοιες της "αξιοπιστίας" και "εγκυρότητας". Τα αποτελέσματα Teszeshai πρέπει να είναι αξιόπιστα, δηλ. Τα αποτελέσματα της αρχικής και επανεξέτασης πρέπει να συντονιστούν. Εξάλλου,

* ΑΥΤΟΜΑΤΩΣ.(βερνίκι) - από μόνο του (περίπου trans.).

Τα αποτελέσματα πρέπει να είναι ελεύθερα (όσο το δυνατόν περισσότερο) από σφάλματα αξιολόγησης. Η παρουσία της εγκυρότητας είναι μία από τις απαιτήσεις για τα επιτευχθέντα αποτελέσματα. Στην περίπτωση αυτή, η αξιοπιστία θεωρείται απαραίτητη, αλλά όχι ακόμη επαρκή προϋπόθεση για την εγκυρότητα της δοκιμής.

Η έννοια της εγκυρότητας υποθέτει ότι τα αποτελέσματα που προέκυψαν ανήκουν σε οτιδήποτε σημαντικό στις πρακτικές ή θεωρητικές σχέσεις. Τα συμπεράσματα που γίνονται με βάση τις εκτιμήσεις δοκιμών πρέπει να ισχύουν. Τις περισσότερες φορές μιλάμε για δύο τύπους εγκυρότητας: προγνωστικά (κριτήρια) και δομικά. Υπάρχουν επίσης και άλλοι τύποι εγκυρότητας (βλ. CH. 3). Επιπλέον, η εγκυρότητα μπορεί να οριστεί στην περίπτωση του οιονεί-πειραματισμού (Campbell, 1976, Cook & Shadish, 1994). Ωστόσο, ο κύριος τύπος εγκυρότητας εξακολουθεί να είναι η προγνωστική εγκυρότητα, σύμφωνα με την οποία γίνεται κατανοητή ως η δυνατότητα πρόβλεψης κάτι σημαντικό για τη συμπεριφορά στο μέλλον, καθώς και τη δυνατότητα βαθύτερης κατανόησης μιας ή άλλης ψυχολογικής ιδιοκτησίας ή ποιότητας.

Οι υποψήφιοι τύποι εγκυρότητας συζητούνται σε κάθε καταλόγιο και συνοδεύονται από περιγραφή των μεθόδων ανάλυσης ισχύος δοκιμής. Η ανάλυση του παράγοντα είναι πιο κατάλληλη για τον προσδιορισμό της δομικής επικύρωσης και οι γραμμικές εξισώσεις παλινδρόμησης χρησιμοποιούνται για την ανάλυση της προγνωστικής εγκυρότητας. Αυτά ή άλλα χαρακτηριστικά (απόδοση, απόδοση θεραπείας) μπορούν να προβλεφθούν με βάση έναν ή περισσότερους δείκτες, ημι-επιστήμονες όταν εργάζονται με πνευματικές ή προσωπικές δοκιμές. Τέτοιες τεχνικές επεξεργασίας δεδομένων, ως συσχέτιση, παλινδρόμηση, ανάλυση διασποράς, ανάλυση μερικών συσχετίσεων και διασπορών, χρησιμεύουν για τον προσδιορισμό της προγνωστικής εγκυρότητας της δοκιμής.

Περιγράφει επίσης σημαντική εγκυρότητα. Θεωρείται ότι όλα τα καθήκοντα και τα καθήκοντα της δοκιμής θα πρέπει να ανήκουν στον συγκεκριμένο τομέα (νοητικές ιδιότητες, συμπεριφορά κ.λπ.). Η έννοια της ουσιαστικής εγκυρότητας χαρακτηρίζει την αλληλογραφία κάθε δοκιμαστικού καθήκοντος της μετρούμενης περιοχής. Η ουσιαστική ισχύς θεωρείται μερικές φορές ως μέρος της αξιοπιστίας ή της "γενικευμένης" (Cronbach, Gleser, Nanda & Rajaratnam, 1972). Ωστόσο

Η επιλογή των καθηκόντων για τις δοκιμές επιτεύξεων σε ένα συγκεκριμένο θέμα είναι επίσης σημαντικό να δοθεί προσοχή στους κανόνες για την εργασία στη δοκιμασία.

Στην κλασική θεωρία δοκιμών, η αξιοπιστία και η εγκυρότητα θεωρούνται σχετικά ανεξάρτητες μεταξύ τους. Αλλά υπάρχει μια άλλη κατανόηση της αναλογίας αυτών των εννοιών. Η σύγχρονη θεωρία δοκιμών βασίζεται στη χρήση μοντέλων. Οι παράμετροι υπολογίζονται μέσα σε ένα συγκεκριμένο μοντέλο. Εάν η εργασία δεν πληροί τις απαιτήσεις του μοντέλου, στη συνέχεια στο πλαίσιο αυτού του μοντέλου, αναγνωρίζεται ως άκυρη. Η δομική επικύρωση αποτελεί μέρος του ίδιου του μοντέλου ελέγχου. Αυτή η επικύρωση αναφέρεται κυρίως για να ελέγξει την ύπαρξη μιας μονοδιάστατης λανθάνουσας γραμμής υπό μελέτη με γνωστά χαρακτηριστικά κλίμακας. Οι δέσμες θα χρησιμοποιηθούν αναμφισβήτητα για τον προσδιορισμό των αντίστοιχων κριτηρίων και η συσχέτισή τους είναι δυνατή με τους δείκτες άλλων κατασκευών για τη συλλογή πληροφοριών σχετικά με τη συγκλίνουσα και την αποκλίνουσα εγκυρότητα του κατασκευάσματος.

Η ψυχοδιάγνωση είναι παρόμοια με τη γλώσσα που περιγράφεται ως η ενότητα τεσσάρων συστατικών που παρουσιάζονται σε τρία επίπεδα. Το πρώτο συστατικό, η θεωρία των δοκιμών, παρόμοια με τη σύνταξη, τη γραμματική της γλώσσας. Η δημιουργία (γενετική) γραμματική είναι, αφενός, ένα πνευματικό μοντέλο, αφετέρου, το σύστημα υποβάλλει τους κανόνες. Χρησιμοποιώντας αυτούς τους κανόνες, οι περίπλοκες βασίζονται βάσει απλών συναισθηματικών προτάσεων. Ταυτόχρονα, ωστόσο, αυτό το μοντέλο αφήνει την περιγραφή του τρόπου με τον οποίο οργανώνεται η διαδικασία επικοινωνίας (η οποία μεταδίδεται και τι γίνεται αντιληπτό) και με ποιους στόχους πραγματοποιείται. Για την κατανόηση αυτού απαιτεί πρόσθετες γνώσεις. Το ίδιο μπορεί να ειπωθεί για τη θεωρία των δοκιμών: Είναι απαραίτητο στην ψυχοδιαγνωστική, αλλά δεν είναι σε θέση να εξηγήσει ότι το ψυχοδιαγνωστό κάνει και ποιος είναι ο στόχος του.

1.3.2. Ψυχολογικές θεωρίες και ψυχολογικές κατασκευές

Το ψυχοδιαγνωστικό είναι πάντα μια διάγνωση κάτι συγκεκριμένο: προσωπικά χαρακτηριστικά, συμπεριφορά, σκέψη, συναισθήματα. Οι δοκιμές αποσκοπούν στην αξιολόγηση των επιμέρους διαφορών. Υπάρχουν πολλές έννοιες

Ατομικές διαφορές, καθένα από τα οποία έχει τα δικά του χαρακτηριστικά. Εάν αναγνωρίζεται ότι η ψυχοδιαγνωστική δεν περιορίζεται σε μια αξιολόγηση των επιμέρους διαφορών, τότε άλλες θεωρίες είναι απαραίτητες για την ψυχοδιαγνωστική. Ένα παράδειγμα είναι να αξιολογηθεί η διαφοροποίηση των διαδικασιών και των διαφορών της ψυχικής ανάπτυξης στο κοινωνικό περιβάλλον. Παρόλο που η αξιολόγηση των μεμονωμένων διαφορών δεν αποτελεί απαραίτητο χαρακτηριστικό της ψυχοδιαγνωστικής, παρ 'όλα αυτά υπάρχουν ορισμένες παραδόσεις έρευνας στον τομέα αυτό. Η ψυχοδιαγνωστική ξεκίνησε με μια αξιολόγηση των διαφορών πληροφοριών. Το κύριο καθήκον των δοκιμών "καθορίζει την κληρονομική μετάδοση της ιδιοφυΐας" (γαλόνι) ή την επιλογή των παιδιών για εκπαίδευση (Binet, Simon). Η μέτρηση του συντελεστή διανοητικής έλαβε θεωρητική κατανόηση και πρακτική ανάπτυξη στα έργα του Spirmend (Ηνωμένο Βασίλειο) και Terestone (ΗΠΑ). Ο Raymond B.Qottel έκανε αυτό παρόμοιο με την αξιολόγηση των προσωπικών χαρακτηριστικών. Η ψυχοδιαγνωστική γίνεται άρρηκτα συνδεδεμένη με τις θεωρίες και τις ιδέες σχετικά με τις ατομικές διαφορές στα επιτεύγματα (αξιολόγηση των περιορισμών) και των μορφών συμπεριφοράς (επίπεδο τυπικής λειτουργίας). Αυτή η παράδοση εξακολουθεί να παραμένει αποτελεσματική σήμερα. Κατά τη διδασκαλία των παροχών στην ψυχοδιαγνωστική, οι διαφορές στο κοινωνικό περιβάλλον είναι πολύ λιγότερο αξιογενείς σε σχέση με την εξέταση των ιδιαιτεροτήτων των ίδιων των διαδικασιών ανάπτυξης. Για αυτό, δεν υπάρχουν εύλογες εξηγήσεις. Από τη μία πλευρά, η διάγνωση δεν περιορίζεται σε ορισμένες θεωρίες και έννοιες. Από την άλλη πλευρά, χρειάζεται θεωρίες, δεδομένου ότι ακριβώς είναι σε αυτούς ένα διαγνωστικό περιεχόμενο (δηλαδή "που" διαγνωσθεί). Για παράδειγμα, η νοημοσύνη μπορεί επίσης να θεωρηθεί ως γενικό χαρακτηριστικό, και ως βάση για μια ποικιλία ανεξάρτητων ικανοτήτων. Εάν η ψυχοδιαγνωστική προσπαθεί να "άδεια" από τη μια ή την άλλη θεωρία, τότε η βάση μιας ψυχοδιαγνωστικής διαδικασίας γίνεται οι ιδέες της κοινής λογικής. Οι μελέτες χρησιμοποιούν διάφορους τρόπους για την ανάλυση των δεδομένων και η γενική λογική της έρευνας καθορίζει την επιλογή ενός μαθηματικού μοντέλου και καθορίζει τη δομή των χρησιμοποιούμενων ψυχολογικών εννοιών. Τέτοιες μέθοδοι μαθηματικών στατιστικών

ki, ως ανάλυση διασποράς, ανάλυση παλινδρόμησης, ανάλυση παράγοντα, η καταμέτρηση των συσχετίσεων συνεπάγεται την ύπαρξη γραμμικών εξαρτήσεων. Σε περίπτωση εσφαλμένης χρήσης αυτών των μεθόδων, "φέρνουν" τη δομή στα ληφθέντα δεδομένα και τα κατασκευάσματα που χρησιμοποιήθηκαν.

Οι ιδέες για τις διαφορές στο κοινωνικό περιβάλλον και η ανάπτυξη της προσωπικότητας σχεδόν δεν επηρέασαν την ψυχοδιαγνωστική. Στα εγχειρίδια (βλ., Για παράδειγμα, Murphy & Davidshofer, 1988), η θεωρία κλασικής δοκιμής εξετάζεται και συζητούνται οι σχετικές μέθοδοι στατιστικής επεξεργασίας, περιγράφονται καλά γνωστές δοκιμασίες, περιγράφεται η χρήση ψυχοδιαγνωστικών στην πράξη: στο Ψυχολογία της διοίκησης, στην επιλογή του προσωπικού, στην αξιολόγηση των ψυχολογικών χαρακτηριστικών του ατόμου.

Οι θεωρίες των ατομικών διαφορών (καθώς και οι ιδέες σχετικά με τις διαφορές μεταξύ του κοινωνικού περιβάλλοντος και της ψυχικής ανάπτυξης) είναι παρόμοιες με τη μελέτη της σημασιολογίας της γλώσσας. Αυτή είναι η μελέτη και οντότητα και το περιεχόμενο και οι αξίες. Οι τιμές είναι δομημένες με έναν ορισμένο τρόπο (όπως τα ψυχολογικά κατασκευάσματα), για παράδειγμα, στην ομοιότητα ή την αντίθεση (αναλογία, σύγκλιση, απόκλιση).

1.3.3. Ψυχολογικές εξετάσεις και άλλα μεθοδολογικά μέσα

Το τρίτο συστατικό των προτεινόμενων ελέγχων, των διαδικασιών και των μεθοδολογικών μέσων με τις οποίες συλλέγονται πληροφορίες σχετικά με τα χαρακτηριστικά της προσωπικότητας. Η Δράζ θεωρητικά λογικά χαρακτηριστικά ενός συγκεκριμένου ατόμου ανθρώπινης συμπεριφοράς (για πλαίσια μιας δοκιμαστικής κατάστασης). Ταυτόχρονα, η αντίδραση των ερωτηθέντων εξετάζεται σε ορισμένο αριθμό προσεκτικά επιλεγμένων κινήτρων και οι ληφθείσες απαντήσεις συγκρίνονται με τα πρότυπα δοκιμών. "

Το Diagnostics απαιτεί δοκιμές και τεχνικές για τη συλλογή αξιόπιστων, ακριβών και έγκυρων πληροφοριών σχετικά με τις λειτουργίες.

και χαρακτηριστικά χαρακτηριστικά του ατόμου, της σκέψης, των συναισθημάτων και της ανθρώπινης συμπεριφοράς. Εκτός από την ανάπτυξη των διαδικασιών δοκιμών, αυτό το στοιχείο περιλαμβάνει επίσης τις ακόλουθες ερωτήσεις: Πώς δημιουργούνται οι δοκιμές, πώς επιλέγονται οι διαμορφώσεις και οι εργασίες, καθώς η διαδικασία δοκιμής προχωρά, ποιες είναι οι απαιτήσεις για τις συνθήκες δοκιμής, καθώς τα σφάλματα μέτρησης είναι τα σφάλματα μέτρησης Λαμβάνονται υπόψη, τα αποτελέσματα των δοκιμών υπολογίζονται και ερμηνεύονται.

Κατά τη διαδικασία των αναπτυσσόμενων δοκιμών, οι ορθολογικές και εμπειρικές στρατηγικές διαφέρουν. Η εφαρμογή μιας ορθολογικής στρατηγικής αρχίζει με τον ορισμό των βασικών εννοιών (για παράδειγμα, την έννοια της νοημοσύνης, της εξωστρέφειας) και σύμφωνα με αυτές τις ιδέες, διατυπώνονται τα καθήκοντα της δοκιμής. Ένα παράδειγμα μιας τέτοιας στρατηγικής μπορεί να είναι η έννοια της ανάλυσης των πτυχών (η θεωρία της Facet) Guttman (1957, 1968, 1978). Πρώτον, καθορίζονται διάφορες πτυχές του κύριου κατασκεύρου, τότε οι εργασίες και τα καθήκοντα επιλέγονται κατά τέτοιο τρόπο ώστε να λαμβάνεται υπόψη καθεμία από αυτές τις πτυχές. Η δεύτερη στρατηγική είναι ότι τα καθήκοντα επιλέγονται σε εμπειρική βάση. Για παράδειγμα, εάν ένας ερευνητής προσπαθεί να δημιουργήσει μια δοκιμή επαγγελματικών συμφερόντων, γεγονός που θα επέτρεπε τη διαφοροποίηση των ιατρών από τους μηχανικούς, τότε η διαδικασία θα πρέπει να είναι έτσι. Και οι δύο ομάδες ερωτηθέντων πρέπει να ανταποκρίνονται σε όλα τα καθήκοντα της δοκιμής και τα στοιχεία αυτά, στις απαντήσεις στις οποίες ανιχνεύονται στατιστικά σημαντικές διαφορές, περιλαμβάνονται στην τελική έκδοση της δοκιμής. Εάν, για παράδειγμα, υπάρχουν διαφορές μεταξύ των ομάδων στις απαντήσεις στην έγκριση "Λατρεύω να πιάσω τα ψάρια", τότε αυτή η δήλωση γίνεται ένα στοιχείο της δοκιμής. Η κύρια θέση αυτού του βιβλίου είναι ότι η δοκιμή συνδέεται με μια εννοιολογική ή ταξινομική θεωρία που καθορίζει αυτά τα χαρακτηριστικά.

Η εκχώρηση δοκιμής ορίζεται συνήθως στις οδηγίες για τη χρήση του. Η δοκιμή πρέπει να τυποποιηθεί προκειμένου να καταστεί δυνατή η εκτίμηση των διαφορών μεταξύ των ανθρώπων και όχι μεταξύ των συνθηκών δοκιμών. Υπάρχουν, ωστόσο, αποκλίσεις από την τυποποίηση των διαδικασιών που ονομάζονται "δοκιμές των ορίων των δυνατοτήτων" (δοκιμές των ορίων) και των δοκιμών "δοκιμών δοκιμών" (δοκιμές μάθησης). Υπό αυτές τις συνθήκες, ο εναγόμενος είναι η βοήθεια στη διαδικασία.

Δοκιμές και στη συνέχεια εκτιμάται η επίδραση μιας τέτοιας διαδικασίας για το αποτέλεσμα. Τα σημεία μέτρησης των απαντήσεων στα καθήκοντα είναι αντικειμενικά, δηλ. Πραγματοποιείται σύμφωνα με την τυποποιημένη διαδικασία. Η ερμηνεία των ληφθέντων αποτελεσμάτων καθορίζεται επίσης αυστηρά και διεξάγεται με βάση τους κανόνες δοκιμής.

Το τρίτο στοιχείο της ψυχοδιαγνωστικής είναι ψυχολογικές εξετάσεις, εργαλεία, διαδικασίες - περιέχει ορισμένες εργασίες, οι οποίες είναι οι χαμηλότερες μονάδες ψυχοδιαγνωστικής και με αυτή την έννοια του έργου είναι παρόμοιες με τις γλώσσες. Ο αριθμός των πιθανών συνδυασμών του τηλεφώνου είναι περιορισμένος. Μόνο ορισμένες λεκάνικες δομές μπορούν να σχηματίσουν λέξεις και προτάσεις για να εξασφαλίσουν πληροφορίες στον ακροατή. Επίσης καιΕργασίες δοκιμής: Μόνο σε ένα συγκεκριμένο συνδυασμό μεταξύ τους, μπορούν να αποτελέσουν ένα αποτελεσματικό μέσο για την αξιολόγηση του αντίστοιχου κατασκευάσματος.