الأسس الرياضية لنظرية تصميم الاختبار. خصائص اختبار التحكم في التربية البدنية

الأسس الرياضية لنظرية تصميم الاختبار.  خصائص اختبار التحكم في التربية البدنية
الأسس الرياضية لنظرية تصميم الاختبار. خصائص اختبار التحكم في التربية البدنية

وصف العرض التقديمي للشرائح الفردية:

شريحة واحدة

وصف الشريحة:

2 شريحة

وصف الشريحة:

من المعتاد تسمية الصفات الجسدية بالصفات المورفولوجية والوظيفية الفطرية (الموروثة وراثيًا) ، والتي بفضلها يكون النشاط البشري (المعبر عنه ماديًا) ممكنًا ، والذي يتلقى مظاهره الكاملة في النشاط الحركي الهادف. تشمل الصفات الجسدية الرئيسية القوة والسرعة والتحمل والمرونة وخفة الحركة.

3 شريحة

وصف الشريحة:

القدرات الحركية هي خصائص فردية تحدد مستوى القدرات الحركية للشخص (V. I. Lyakh ، 1996). يتكون أساس القدرات الحركية للشخص من الصفات الجسدية ، وشكل المظهر هو المهارات والقدرات الحركية. تشمل القدرات الحركية القدرة ، والسرعة العالية ، والقدرة على السرعة ، وقدرات التنسيق الحركي ، والتحمل العام والخاص

4 شريحة

وصف الشريحة:

مخطط منهجية للقدرات البدنية (الحركية) القدرات البدنية (الحركية) التكييف (الطاقة) توليفات القدرات التكييفية القدرة على التحمل السرعة والمرونة التنسيق (إعلامي) CS المتعلقة بمجموعات منفصلة من الإجراءات الحركية ، CS الخاصة مجموعات CS الخاصة بقدرات التنسيق مجموعات قدرات التكييف والتنسيق

5 شريحة

وصف الشريحة:

احصل على معلومات دقيقة حول مستوى تطوير قدرة المحرك / مرتفع ، متوسط ​​، منخفض / من الممكن بمساعدة الاختبارات / أو تمارين التحكم /.

6 شريحة

وصف الشريحة:

بمساعدة اختبارات التحكم (الاختبارات) ، من الممكن الكشف عن المؤشرات المطلقة (الصريحة) والنسبية (الخفية ، الكامنة) لهذه القدرات. تميز المؤشرات المطلقة مستوى تطور بعض القدرات الحركية دون مراعاة تأثيرها على بعضها البعض. تسمح المؤشرات النسبية بالحكم على مظهر من مظاهر القدرات الحركية ، مع مراعاة هذا التأثير.

7 شريحة

وصف الشريحة:

يمكن تقديم القدرات البدنية المذكورة أعلاه على أنها قائمة محتملة ، أي قبل بدء أداء أي نشاط أو أنشطة حركية (يمكن تسميتها بالقدرات المحتملة) وكما تظهر في الواقع في البداية (بما في ذلك عند إجراء الاختبارات الحركية) وفي عملية أداء هذه الأنشطة (القدرات البدنية الفعلية).

8 شريحة

وصف الشريحة:

بدرجة معينة من الاصطلاح ، يمكننا التحدث عن القدرات البدنية والبدائية المعقدة

9 شريحة

وصف الشريحة:

تسمح نتائج البحث بالاختلاف في القدرات الفيزيائية التالية: نسخة خاصة عامة

10 شريحة

وصف الشريحة:

تشير القدرات البدنية الخاصة إلى مجموعات متجانسة من الأعمال أو الأنشطة الحركية المتكاملة: الجري ، والتمارين البهلوانية والجمباز على الجهاز ، وحركات الرمي ، والألعاب الرياضية (كرة السلة ، والكرة الطائرة).

11 شريحة

وصف الشريحة:

يمكن التحدث عن مظاهر محددة للقدرات البدنية على أنها المكونات التي تشكل هيكلها الداخلي.

12 شريحة

وصف الشريحة:

وبالتالي ، فإن المكونات الرئيسية لقدرات التنسيق لدى الشخص هي: القدرة على التوجيه والتوازن والاستجابة والتمييز بين معلمات الحركات ؛ القدرة على الإيقاع ، وإعادة تنظيم الحركات ، والاستقرار الدهليزي ، واسترخاء العضلات الطوعي. هذه القدرات محددة.

13 شريحة

وصف الشريحة:

تعتبر المكونات الرئيسية لهيكل قدرات السرعة هي سرعة الاستجابة وسرعة الحركة الفردية وتكرار الحركات والسرعة التي تتجلى في الإجراءات الحركية المتكاملة.

14 شريحة

وصف الشريحة:

تشمل مظاهر قدرات القوة: القوة الساكنة (متساوية القياس) ، القوة الديناميكية (متساوية التوتر) - القوة المتفجرة ، قوة امتصاص الصدمات.

15 شريحة

وصف الشريحة:

هيكل القدرة على التحمل معقد للغاية: هوائي ، يتطلب مصادر الأكسجين لتفتيت الطاقة لمظاهره ؛ اللاهوائية (مصادر الطاقة حال السكر ، فوسفات الكرياتين - بدون مشاركة الأكسجين) ؛ التحمل من مجموعات العضلات المختلفة في المواقف الثابتة - التحمل الثابت ؛ القدرة على التحمل في التمارين الديناميكية التي يتم إجراؤها بسرعة 20-90٪ من الحد الأقصى.

16 شريحة

وصف الشريحة:

تكون مظاهر (أشكال) المرونة ، حيث يتم تمييز المرونة النشطة والمرونة السلبية ، أقل تعقيدًا.

17 شريحة

وصف الشريحة:

يجب فهم القدرات الجسدية العامة على أنها القدرات المحتملة والمتحققة للشخص ، والتي تحدد استعداده للتنفيذ الناجح للأفعال الحركية ، المختلفة في الأصل والمعنى. القدرات الجسدية الخاصة هي قدرات الشخص ، والتي تحدد استعداده للتنفيذ الناجح لأعمال حركية مماثلة في الأصل والمعنى. لذلك ، توفر الاختبارات معلومات ، أولاً وقبل كل شيء ، عن درجة تكوين القدرات البدنية الخاصة والمحددة (السرعة ، التنسيق ، القوة ، التحمل ، المرونة).

18 شريحة

وصف الشريحة:

القدرات الجسدية الخاصة هي قدرات الشخص ، والتي تحدد استعداده للتنفيذ الناجح لأعمال حركية مماثلة في الأصل والمعنى. لذلك ، توفر الاختبارات معلومات ، أولاً وقبل كل شيء ، عن درجة تكوين القدرات البدنية الخاصة والمحددة (السرعة ، التنسيق ، القوة ، التحمل ، المرونة).

19 شريحة

وصف الشريحة:

تتمثل مهام الاختبار في تحديد مستويات تطوير قدرات التكييف والتنسيق ، لتقييم جودة الاستعداد الفني والتكتيكي. بناءً على نتائج الاختبار ، يمكن للمرء: مقارنة استعداد كل من الطلاب الفرديين والمجموعات بأكملها التي تعيش في مناطق ودول مختلفة ؛ لإجراء اختيار رياضي لممارسة رياضة معينة ، للمشاركة في المسابقات ؛ لممارسة سيطرة موضوعية إلى حد كبير على تعليم (تدريب) أطفال المدارس والرياضيين الشباب ؛ التعرف على مزايا وعيوب الأدوات المستخدمة وطرق التدريس وأشكال تنظيم الفصول ؛ أخيرًا ، لإثبات معايير (العمر ، الفرد) للياقة البدنية للأطفال والمراهقين.

20 شريحة

وصف الشريحة:

إلى جانب المهام المذكورة أعلاه في ممارسة البلدان المختلفة ، يتم تقليل مهام الاختبار إلى ما يلي: لتعليم أطفال المدارس أنفسهم تحديد مستوى لياقتهم البدنية وتخطيط المجمعات اللازمة من التمارين البدنية ؛ تحفيز الطلاب على تحسين حالتهم الجسدية (الشكل) ؛ عدم معرفة المستوى الأولي لتطور القدرة الحركية بقدر ما يعرف تغيرها خلال فترة زمنية معينة ؛ تحفيز الطلاب الذين حققوا نتائج عالية ، ولكن ليس بدرجة كبيرة ، كما هو الحال بالنسبة للزيادة المخطط لها في النتائج الشخصية.

21 شريحة

وصف الشريحة:

الاختبار هو قياس أو اختبار يتم إجراؤه لتحديد قدرة الشخص أو حالته.

22 شريحة

وصف الشريحة:

يمكن فقط استخدام الاختبارات (العينات) التي تفي بالمتطلبات الخاصة كاختبارات: يجب تحديد الغرض من تطبيق أي اختبار (أو اختبارات) ؛ ينبغي تطوير طريقة قياس معيارية وإجراء اختبار ؛ من الضروري تحديد موثوقية الاختبارات ومحتوى المعلومات ؛ يمكن الإبلاغ عن نتائج الاختبار في نظام الدرجات المناسب

23 شريحة

وصف الشريحة:

اختبار. اختبارات. نتيجة الاختبار يسمى نظام استخدام الاختبارات وفقًا للمهمة المطروحة وتنظيم الظروف وإجراء الاختبارات حسب الموضوعات وتقييم النتائج وتحليلها. القيمة العددية التي يتم الحصول عليها في سياق القياسات هي نتيجة الاختبار (الاختبار).

24 شريحة

وصف الشريحة:

تعتمد الاختبارات المستخدمة في الثقافة البدنية على الإجراءات الحركية (التمارين البدنية ، المهام الحركية). تسمى هذه الاختبارات اختبارات المحرك أو المحرك.

25 شريحة

وصف الشريحة:

يُعرف تصنيف الاختبارات وفقًا لتركيبها ووفقًا لمؤشراتها السائدة ، يتم تمييز الاختبارات الفردية والمعقدة. يستخدم اختبار واحد لقياس وتقييم سمة واحدة (التنسيق أو القدرة التكييفية).

26 شريحة

وصف الشريحة:

27 شريحة

وصف الشريحة:

بمساعدة اختبار معقد ، يتم تقييم العديد من الخصائص أو المكونات ذات القدرة المختلفة أو نفسها. على سبيل المثال ، قفزة من مكان (مع موجة من الذراعين ، بدون موجة من الذراعين ، إلى ارتفاع معين).

28 شريحة

وصف الشريحة:

29 شريحة

وصف الشريحة:

قد تكون الاختبارات عبارة عن اختبارات تكييفية لتقييم قدرة القوة على تقييم القدرة على التحمل ؛ لتقييم قدرات السرعة ؛ لتقييم المرونة ، اختبارات التنسيق لتقييم قدرات التنسيق المتعلقة بمجموعات مستقلة منفصلة من الإجراءات الحركية ، والتي تقيس قدرات التنسيق الخاصة ؛ لتقييم قدرات التنسيق المحددة - القدرة على التوازن ، والتوجيه في الفضاء ، والاستجابة ، والتمايز بين معلمات الحركة ، والإيقاع ، وإعادة هيكلة الحركات الحركية ، والتنسيق (التواصل) ، والاستقرار الدهليزي ، واسترخاء العضلات الطوعي).

30 شريحة

وصف الشريحة:

كل تصنيف هو نوع من المبادئ التوجيهية لاختيار (أو إنشاء) نوع الاختبارات الأكثر صلة بأهداف الاختبار.

31 شريحة

وصف الشريحة:

معايير اختبارات المحرك اللطيفة يفي مفهوم "اختبار المحرك" بالغرض منه عندما يفي الاختبار بالمعايير الأساسية ذات الصلة: الموثوقية ، والاستقرار ، والتكافؤ ، والموضوعية ، ومحتوى المعلومات (الصلاحية) ، بالإضافة إلى معايير إضافية: التقييس ، والمقارنة ، والاقتصاد. تسمى الاختبارات التي تفي بمتطلبات الموثوقية ومحتوى المعلومات بجودة جيدة أو موثوقة (موثوقة).

32 شريحة

وصف الشريحة:

تُفهم موثوقية الاختبار على أنها درجة الدقة التي يقيم بها قدرة حركية معينة ، بغض النظر عن متطلبات الشخص الذي يقيمها. تتجلى الموثوقية في درجة تطابق النتائج عند إعادة اختبار نفس الأشخاص في نفس الظروف ؛ إنه استقرار أو تناسق نتيجة اختبار الفرد عند تكرار تمرين التحكم. بمعنى آخر ، يحتفظ الطفل في مجموعة الأشخاص الذين تم فحصهم وفقًا لنتائج الاختبارات المتكررة (على سبيل المثال ، مؤشرات القفز ، ووقت الجري ، ومدى الرمي) بمرتبة رتبته. يتم تحديد مصداقية الاختبار باستخدام التحليل الإحصائي للارتباط من خلال حساب عامل الموثوقية. في هذه الحالة ، يتم استخدام طرق مختلفة ، على أساسها يتم الحكم على موثوقية الاختبار.

33 شريحة

وصف الشريحة:

يعتمد استقرار الاختبار على العلاقة بين المحاولات الأولى والثانية ، التي تتكرر بعد فترة زمنية معينة في نفس الظروف بواسطة نفس المجرب. تسمى طريقة إعادة الاختبار لتحديد الموثوقية إعادة الاختبار. يعتمد استقرار الاختبار على نوع الاختبار ، وعمر وجنس الأشخاص ، والفاصل الزمني بين الاختبار وإعادة الاختبار. على سبيل المثال ، تكون مؤشرات اختبارات التكييف أو السمات المورفولوجية على فترات زمنية قصيرة أكثر ثباتًا من نتائج اختبارات التنسيق ؛ بالنسبة للأطفال الأكبر سنًا ، تكون النتائج أكثر استقرارًا من الأطفال الأصغر سنًا. عادة ما يتم إجراء إعادة الاختبار في موعد لا يتجاوز أسبوع بعد ذلك. على فترات أطول (على سبيل المثال ، بعد شهر) ، يصبح استقرار الاختبارات المتساوية مثل الجري 1000 متر أو الوثب الطويل من مكان ما أقل بشكل ملحوظ.

34 شريحة

وصف الشريحة:

معادلة اختبار معادلة الاختبار هو ارتباط نتيجة الاختبار بنتائج الاختبارات الأخرى من نفس النوع. على سبيل المثال ، عندما يكون من الضروري اختيار الاختبار الذي يعكس قدرات السرعة بشكل أكثر ملاءمة: الركض عند 30 أو 50 أو 60 أو 100 متر يعتمد الموقف من الاختبارات المكافئة (المتجانسة) على عدة أسباب. إذا كان من الضروري زيادة موثوقية التقديرات أو استنتاجات البحث ، فمن المستحسن استخدام اختبارين أو أكثر معادلين. وإذا كان الهدف هو إنشاء بطارية تحتوي على حد أدنى من الاختبارات ، فيجب استخدام اختبار واحد فقط من الاختبارات المكافئة. هذه البطارية ، كما لوحظ ، غير متجانسة ، لأن الاختبارات المدرجة فيها تقيس القدرات الحركية المختلفة. أمثلة على بطارية غير متجانسة من الاختبارات هي تشغيل 30 مترًا ، وشد الذقن لأعلى ، والانحناء الأمامي ، و 1000 متر من الجري.

35 شريحة

وصف الشريحة:

يتم تحديد موثوقية الاختبارات أيضًا من خلال مقارنة متوسط ​​درجات المحاولات الفردية والزوجية المدرجة في الاختبار. على سبيل المثال ، تتم مقارنة متوسط ​​رميات الهدف المتمثلة في محاولات 1 و 3 و 5 و 7 و 9 مع متوسط ​​رميات الهدف البالغة 2 و 4 و 6 و 8 و 10 محاولات. تسمى هذه الطريقة لتقييم الموثوقية طريقة المضاعفة أو التقسيم. يتم استخدامه بشكل أساسي في تقييم قدرات التنسيق وفي حالة ألا يقل عدد المحاولات لتشكيل نتيجة الاختبار عن ستة.

36 شريحة

وصف الشريحة:

موضوعية (اتساق) الاختبار تُفهم موضوعية (اتساق) الاختبار على أنها درجة اتساق النتائج التي تم الحصول عليها على نفس الموضوعات من قبل مجربين مختلفين (مدرسون ، قضاة ، خبراء). لزيادة موضوعية الاختبار ، من الضروري الامتثال لشروط الاختبار القياسية: وقت الاختبار والمكان والظروف الجوية ؛ دعم موحد للمواد والأجهزة ؛ العوامل النفسية (حجم وشدة الحمل ، الدافع) ؛ عرض المعلومات (الصياغة اللفظية الدقيقة لمشكلة الاختبار ، الشرح والشرح). هذا هو ما يسمى بموضوعية الاختبار. هناك أيضًا حديث عن الموضوعية التفسيرية ، في إشارة إلى درجة استقلالية تفسير نتائج الاختبار من قبل مجربين مختلفين.

37 شريحة

وصف الشريحة:

بشكل عام ، كما يلاحظ الخبراء ، يمكن تحسين موثوقية الاختبارات بطرق مختلفة: من خلال توحيد المعايير الصارمة للاختبار ، وزيادة عدد المحاولات ، وتحفيز أفضل للموضوعات ، وزيادة عدد المقيّمين (القضاة ، الخبراء) ، زيادة في اتساق آرائهم ، زيادة في عدد الاختبارات المكافئة. لا توجد قيم ثابتة لمؤشرات موثوقية الاختبار. في معظم الحالات ، يستخدمون التوصيات التالية: 0.95 - 0.99 - موثوقية ممتازة ؛ 0.90 - 0.94 - جيد ؛ 0.80 - 0.89 - مقبول ؛ 0.70 - 0.79 - سيء ؛ 0.60 - 0.69 - مشكوك فيه بالنسبة للتقييمات الفردية ، الاختبار مناسب فقط لتوصيف مجموعة من الموضوعات.

38 شريحة

وصف الشريحة:

المعلوماتية للاختبار هي الدرجة التي يقيس بها القدرة أو المهارة الحركية المقدرة. في الأدبيات الأجنبية (والمحلية) ، بدلاً من كلمة "معلوماتية" ، يتم استخدام مصطلح "الصلاحية" (من اللغة الإنجليزية. الصلاحية ، الصلاحية ، الصلاحية ، الشرعية). في الواقع ، عند الحديث عن محتوى المعلومات ، يجيب الباحث على سؤالين: ما الذي يقيسه هذا الاختبار المحدد (مجموعة الاختبارات) وما هي درجة دقة القياس. هناك عدة أنواع من المصداقية: منطقية (ذات مغزى) وتجريبي (بناءً على بيانات تجريبية) وتنبؤية.

39 شريحة

وصف الشريحة:

معايير الاختبار الإضافية المهمة ، كما هو مذكور ، هي التقنين ، وإمكانية المقارنة ، وفعالية التكلفة. جوهر التوحيد القياسي هو أنه على أساس نتائج الاختبار ، من الممكن إنشاء معايير ذات أهمية خاصة للممارسة. قابلية المقارنة للاختبار هي القدرة على مقارنة النتائج التي تم الحصول عليها من شكل واحد أو أكثر من الاختبارات المتوازية (المتجانسة). من الناحية العملية ، فإن استخدام الاختبارات الحركية المماثلة يقلل من احتمالية أنه نتيجة للاستخدام المنتظم لنفس الاختبار ، ليس فقط وليس مستوى القدرة بقدر ما يتم تقييم درجة المهارة. نتائج الاختبار التي تمت مقارنتها في نفس الوقت تزيد من موثوقية الاستنتاجات. يتمثل جوهر الاقتصاد كمعيار لصلاحية الاختبار في أن الاختبار لا يتطلب وقتًا طويلاً وتكاليف مادية كبيرة ومشاركة العديد من المساعدين.

40 شريحة

وصف الشريحة:

تنظيم اختبار الاستعداد للأطفال في سن المدرسة المشكلة الثانية المهمة لاختبار القدرات الحركية (تذكر أن الأولى هي اختيار الاختبارات التثقيفية ، وهي تنظيم تطبيقها.اختبار توقيت الاختبار يتوافق مع المناهج المدرسية ، والتي توفر لاختبار اللياقة البدنية الإلزامي مرتين للطلاب.

41 شريحة

وصف الشريحة:

تتيح معرفة التغييرات السنوية في تنمية القدرات الحركية للأطفال للمعلم إجراء التعديلات المناسبة على عملية الثقافة البدنية للعام الدراسي المقبل. ومع ذلك ، يجب على المعلم ويمكنه إجراء المزيد من الاختبارات المتكررة ، وإجراء ما يسمى بالتحكم التشغيلي. يُنصح بالقيام بذلك من أجل تحديد ، على سبيل المثال ، التغيير في مستوى السرعة وقدرات القوة والقدرة على التحمل تحت تأثير دروس ألعاب القوى خلال الربع الأول. لهذا الغرض ، يمكن للمعلم تطبيق اختبارات لتقييم القدرات التنسيقية للأطفال في بداية ونهاية إتقان مادة البرنامج ، على سبيل المثال ، في الألعاب الرياضية ، لتحديد التغييرات في مؤشرات تنمية هذه القدرات .

42 شريحة

وصف الشريحة:

يجب أن يؤخذ في الاعتبار أن تنوع المشكلات التربوية التي يتعين حلها لا يسمح بتزويد المعلم بمنهجية اختبار موحدة ، ونفس القواعد لإجراء الاختبارات وتقييم نتائج الاختبار. وهذا يتطلب من المجربين (المعلمين) إظهار الاستقلال في حل القضايا النظرية والمنهجية والتنظيمية للاختبار. يجب ربط الاختبار في الدرس بمحتواه. بمعنى آخر ، يجب تضمين الاختبار أو الاختبارات التطبيقية ، التي تخضع للمتطلبات المقابلة (فيما يتعلق بطريقة البحث) ، بشكل عضوي في التمرين البدني المخطط له. على سبيل المثال ، إذا كان مطلوبًا عند الأطفال تحديد مستوى تطور قدرات السرعة أو التحمل ، فيجب التخطيط للاختبارات اللازمة في ذلك الجزء من الدرس الذي سيتم فيه حل مهام تطوير القدرات البدنية المقابلة.

43 شريحة

وصف الشريحة:

يتم تحديد وتيرة الاختبار إلى حد كبير من خلال معدل تطور القدرات البدنية المحددة والعمر والجنس والخصائص الفردية لتطورها. على سبيل المثال ، لتحقيق زيادة كبيرة في السرعة أو التحمل أو القوة ، يستغرق الأمر عدة أشهر من التمارين المنتظمة (التدريب). في الوقت نفسه ، من أجل الحصول على زيادة موثوقة في المرونة أو قدرات التنسيق الفردية ، يلزم فقط 4-12 تمرينًا. يمكن تحسين الجودة المادية ، إذا بدأت من الصفر ، في وقت أقصر. ومن أجل تحسين الجودة نفسها ، عندما يكون الأمر في حالة طفل رفيع المستوى ، يستغرق الأمر وقتًا أطول. في هذا الصدد ، يجب على المعلم أن يدرس بشكل أعمق سمات تطور وتحسين القدرات الحركية المختلفة لدى الأطفال في مختلف الفترات العمرية والجنسية.

44 شريحة

وصف الشريحة:

عند تقييم اللياقة البدنية العامة للأطفال ، يمكن استخدام مجموعة متنوعة من بطاريات الاختبار ، ويعتمد اختيارها على مهام الاختبار المحددة وتوافر الشروط اللازمة. ومع ذلك ، نظرًا لحقيقة أنه لا يمكن تقييم نتائج الاختبار التي تم الحصول عليها إلا عن طريق المقارنة ، فمن المستحسن اختيار الاختبارات التي يتم تمثيلها على نطاق واسع في نظرية وممارسة التربية البدنية للأطفال. على سبيل المثال ، اعتمد على تلك الموصى بها في برنامج FC. لمقارنة المستوى العام للياقة البدنية لطالب أو مجموعة من الطلاب باستخدام مجموعة من الاختبارات ، يلجأون إلى ترجمة نتائج الاختبار إلى نقاط أو نقاط. يتيح لك تغيير مجموع النقاط أثناء الاختبارات المتكررة الحكم على تقدم كل من الطفل ومجموعة الأطفال.

49 شريحة

وصف الشريحة:

يتمثل أحد الجوانب المهمة للاختبار في مشكلة اختيار اختبار لتقييم قدرة بدنية معينة ولياقة بدنية عامة.

50 شريحة

وصف الشريحة:

نصائح ومشورة عملية. هام: تحديد (حدد) بطارية (أو مجموعة) من الاختبارات اللازمة مع بيان مفصل لجميع تفاصيل سلوكهم ؛ ضبط وقت الاختبار (أفضل - 2-3 أسابيع من سبتمبر - الاختبار الأول ، 2-3 أسابيع من مايو - الاختبار الثاني) ؛ وفقًا للتوصية ، حدد بدقة عمر الأطفال في يوم الاختبار وجنسهم ؛ تطوير بروتوكولات موحدة لتسجيل البيانات (ربما تستند إلى استخدام تكنولوجيا المعلومات والاتصالات) ؛ تحديد دائرة المساعدين وتنفيذ إجراء الاختبار نفسه ؛ إجراء المعالجة الرياضية لبيانات الاختبار على الفور - حساب المعلمات الإحصائية الرئيسية (المتوسط ​​الحسابي ، والخطأ الحسابي ، والانحراف المعياري ، ومعامل الاختلاف ، وتقييم موثوقية الاختلافات بين مؤشرات المتوسط ​​الحسابي ، على سبيل المثال ، الفئات المتوازية من نفس الشيء ومختلفة مدارس الأطفال من نفس العمر والجنس) ؛ يمكن أن تكون إحدى مراحل العمل المهمة ترجمة نتائج الاختبار إلى نقاط أو نقاط. من خلال الاختبار المنتظم (مرتين في السنة ، على مدار عدة سنوات) ، سيسمح ذلك للمعلم بتكوين فكرة عن تقدم النتائج.

51 شريحة

وصف الشريحة:

موسكو "التنوير" 2007 يحتوي الكتاب على أكثر الاختبارات الحركية شيوعًا لتقييم التكييف وقدرات التنسيق لدى الطلاب. يوفر الدليل نهجًا فرديًا لمعلم التربية البدنية لكل طالب محدد ، مع مراعاة عمره ولياقة البدنية.

المفاهيم الأساسية لنظرية الاختبار.

يُطلق على القياس أو الاختبار الذي يتم إجراؤه لتحديد حالة أو قدرة الرياضي اسم اختبار. يتضمن أي اختبار القياس. لكن ليس كل تغيير هو اختبار. يسمى إجراء القياس أو الاختبار بالاختبار.

يسمى الاختبار الذي يعتمد على المهام الحركية اختبار المحرك. هناك ثلاث مجموعات من اختبارات الحركة:

  • 1. تمارين التحكم ، والتي يؤديها اللاعب الذي يتلقى المهمة لإظهار النتيجة القصوى.
  • 2. الاختبارات الوظيفية المعيارية ، والتي يتم خلالها تحديد جرعات المهمة ، والتي هي نفسها للجميع ، إما من خلال مقدار العمل المنجز ، أو بمقدار التحولات الفسيولوجية.
  • 3. الاختبارات الوظيفية القصوى ، والتي يجب على الرياضي خلالها إظهار أقصى نتيجة.

يتطلب اختبار الجودة العالية معرفة نظرية القياس.

المفاهيم الأساسية لنظرية القياس.

القياس هو تحديد التطابق بين الظاهرة قيد الدراسة من جهة والأرقام من جهة أخرى.

أساسيات نظرية القياس ثلاثة مفاهيم: المقاييس ووحدات القياس ودقة القياس.

موازين القياس.

مقياس القياس هو القانون الذي بموجبه يتم تخصيص قيمة رقمية لنتيجة مُقاسة لأنها تزيد أو تنقص. دعونا ننظر في بعض المقاييس المستخدمة في الرياضة.

مقياس الأسماء (المقياس الاسمي).

هذا هو أبسط جميع المقاييس. في ذلك ، تعمل الأرقام كتسميات وتعمل على اكتشاف وتمييز الأشياء قيد الدراسة (على سبيل المثال ، ترقيم لاعبي فريق كرة القدم). يُسمح بتغيير الأرقام التي يتكون منها مقياس التسمية باستخدام metas. لا توجد علاقات أقل في هذا المقياس ، لذلك يشعر بعض الناس أن مقياس التسمية لا ينبغي اعتباره مقياسًا. عند استخدام مقياس التسمية ، يمكن إجراء بعض العمليات الحسابية فقط. على سبيل المثال ، لا يمكن إضافة أرقامها أو طرحها ، ولكن يمكنك حساب عدد المرات (عدد المرات) التي يحدث فيها رقم معين.

مقياس الطلب.

هناك رياضات يتم فيها تحديد نتيجة الرياضي فقط من خلال المكان الذي يحتله في المنافسة (على سبيل المثال ، فنون الدفاع عن النفس). بعد هذه المسابقات ، يتضح أي الرياضيين أقوى وأيهم أضعف. ولكن كم هو أقوى أو أضعف ، لا يستطيع المرء أن يقول. إذا احتل ثلاثة رياضيين المراكز الأولى والثانية والثالثة على التوالي ، فإن الاختلافات في روحهم الرياضية تظل غير واضحة: قد يكون الرياضي الثاني مساويًا تقريبًا للمركز الأول ، أو قد يكون أضعف منه ويكون تقريبًا هو نفسه مع المركز الثالث. تسمى الأماكن المشغولة في مقياس الترتيب الرتب ، ويسمى المقياس نفسه رتبة أو غير متري. في مثل هذا المقياس ، يتم ترتيب الأرقام المكونة له حسب الرتب (أي الأماكن المشغولة) ، ولكن لا يمكن قياس الفترات الفاصلة بينها بدقة. على النقيض من مقياس الأسماء ، فإن مقياس الترتيب لا يسمح فقط بإثبات حقيقة المساواة أو عدم المساواة في الأشياء المقاسة ، ولكن أيضًا لتحديد طبيعة عدم المساواة في شكل أحكام: "أكثر - أقل" ، "أفضل - أسوأ "، إلخ.

بمساعدة جداول الترتيب ، يمكنك قياس المؤشرات النوعية التي لا تحتوي على مقياس كمي صارم. تستخدم هذه المقاييس على نطاق واسع بشكل خاص في العلوم الإنسانية: علم أصول التدريس وعلم النفس وعلم الاجتماع.

يمكن تطبيق المزيد من العمليات الحسابية على رتب مقياس الترتيب بدلاً من أرقام مقياس الطائفة.

مقياس الفاصل.

إنه مقياس لا يتم فيه ترتيب الأرقام حسب الرتبة فحسب ، بل يتم فصلها أيضًا بفواصل زمنية محددة. الميزة التي تميزها عن مقياس العلاقات الموصوف أدناه هي أنه يتم اختيار نقطة الصفر بشكل تعسفي. تشمل الأمثلة وقت التقويم (تم تعيين بداية التسلسل الزمني في التقويمات المختلفة لأسباب عشوائية) ، الزاوية المفصلية (الزاوية في مفصل المرفق مع الامتداد الكامل للساعد يمكن اعتبارها إما صفرًا أو 180 درجة) ، ودرجة الحرارة ، والطاقة الكامنة للحمل المرفوع ، إمكانات المجال الكهربائي ، إلخ. د.

يمكن معالجة نتائج القياسات على مقياس الفترات بجميع الطرق الرياضية ، باستثناء حساب النسب. تعطي هذه المقاييس الفاصلة إجابة على السؤال: "كم أكثر" ، لكن لا تسمح بتأكيد أن قيمة واحدة للكمية المقاسة أكبر أو أقل بعدة مرات من قيمة أخرى. على سبيل المثال ، إذا ارتفعت درجة الحرارة من 10 إلى 20 درجة مئوية ، فلا يمكن القول أنها أصبحت أكثر دفئًا بمقدار الضعف.

مقياس العلاقة.

يختلف هذا المقياس عن مقياس الفاصل الزمني فقط في أن موضع نقطة الصفر محدد بدقة فيه. نتيجة لذلك ، لا يفرض مقياس النسب أي قيود على الجهاز الرياضي المستخدم لمعالجة نتائج الملاحظات.

في الرياضة ، يقيس مقياس العلاقة المسافة والقوة والسرعة وعشرات المتغيرات الأخرى. يقيس مقياس العلاقات أيضًا تلك القيم التي يتم تكوينها كفرق بين الأرقام المحسوبة على مقياس الفواصل الزمنية. لذلك ، يتم حساب وقت التقويم على مقياس من الفواصل الزمنية والفترات الزمنية - على مقياس من العلاقات. عند استخدام مقياس النسب (وفي هذه الحالة فقط!) ، يتم تقليل قياس أي كمية إلى التحديد التجريبي لنسبة هذه الكمية إلى كمية أخرى مماثلة ، تؤخذ كوحدة. بقياس طول القفزة ، نكتشف عدد المرات التي يكون فيها هذا الطول أكبر من طول جسم آخر ، كوحدة للطول (مسطرة المتر في حالة معينة) ؛ عند وزن الحديد ، نحدد نسبة كتلته إلى كتلة جسم آخر - وحدة وزن "كيلوجرام" ، إلخ. إذا قصرنا أنفسنا على استخدام مقاييس العلاقات فقط ، فيمكننا تقديم تعريف آخر (أضيق ، خاص) للقياس: لقياس أي كمية تعني إيجاد علاقتها التجريبية بوحدة القياس المقابلة.

وحدات القياس.

من أجل مقارنة نتائج القياسات المختلفة مع بعضها البعض ، يجب التعبير عنها في نفس الوحدات. في عام 1960 ، في المؤتمر العام الدولي للأوزان والمقاييس ، تم اعتماد النظام الدولي للوحدات ، والذي تم اختصاره كـ SI (من الأحرف الأولى من الكلمات System International). في الوقت الحاضر ، تم إنشاء التطبيق المفضل لهذا النظام في جميع مجالات العلوم والتكنولوجيا ، في الاقتصاد الوطني ، وكذلك في التدريس.

يتضمن النظام الدولي للوحدات حاليًا سبع وحدات أساسية مستقلة (انظر الجدول 2.1.)

الجدول 1.1.

وحدات الكميات الفيزيائية الأخرى مشتقة من هذه الوحدات الأساسية كمشتقات. يتم تحديد الوحدات المشتقة على أساس الصيغ التي تربط الكميات المادية. على سبيل المثال ، وحدة الطول (متر) ووحدة الوقت (ثانية) هي الوحدات الأساسية ، ووحدة السرعة (متر لكل ثانية) هي المشتق.

بالإضافة إلى الوحدات الرئيسية ، يتم تمييز وحدتين إضافيتين في النظام الدولي للوحدات: راديان - وحدة زاوية الطائرة وستيراديان - وحدة الزاوية الصلبة (الزاوية في الفضاء).

دقة القياسات.

لا يمكن إجراء قياس بدقة مطلقة. تحتوي نتيجة القياس حتمًا على خطأ ، تكون قيمته أصغر ، وكلما زادت دقة طريقة القياس وجهاز القياس. على سبيل المثال ، باستخدام مسطرة عادية بأقسام ملليمتر ، لا يمكنك قياس الطول بدقة 0.01 مم.

خطأ أساسي وإضافي.

الخطأ الأساسي هو خطأ طريقة القياس أو أداة القياس التي تحدث في ظل ظروف الاستخدام العادية.

الخطأ الإضافي هو خطأ جهاز القياس الناتج عن انحراف ظروف التشغيل عن الوضع الطبيعي. من الواضح أن الأجهزة المصممة للعمل في درجة حرارة الغرفة ستعطي قراءات غير دقيقة إذا تم استخدامها في الصيف في الملعب تحت أشعة الشمس الحارقة أو في الشتاء في البرد. يمكن أن تحدث أخطاء القياس عندما يكون جهد الشبكة الكهربائية أو مصدر طاقة البطارية أقل من الطبيعي أو غير ثابت في القيمة.

الأخطاء المطلقة والنسبية.

تسمى القيمة E = A - Ao ، التي تساوي الفرق بين قراءة جهاز القياس (A) والقيمة الحقيقية للكمية المقاسة (Ao) ، خطأ القياس المطلق. يتم قياسها بنفس الوحدات مثل القيمة المقاسة نفسها.

من الناحية العملية ، غالبًا ما يكون من الملائم عدم استخدام خطأ مطلق ، بل خطأ نسبي. خطأ القياس النسبي من نوعين - حقيقي ومخفض. الخطأ النسبي الفعلي هو نسبة الخطأ المطلق إلى القيمة الحقيقية للكمية المقاسة:

أ د = --------- * 100٪

الخطأ النسبي المخفض هو نسبة الخطأ المطلق إلى أقصى قيمة ممكنة للكمية المقاسة:

AP = ---------- * 100٪

أخطاء منهجية وعشوائية.

النظام المنهجي خطأ لا تتغير قيمته من قياس إلى آخر. نظرًا لهذه الخصوصية ، غالبًا ما يمكن التنبؤ بالخطأ المنتظم مقدمًا أو ، في الحالات القصوى ، اكتشافه وإزالته في نهاية عملية القياس.

تعتمد طريقة التخلص من الخطأ المنهجي في المقام الأول على طبيعته. يمكن تقسيم أخطاء القياس المنهجية إلى ثلاث مجموعات:

أخطاء من أصل معروف وقيمة معروفة ؛

أخطاء معروفة المصدر ، لكن قيمتها غير معروفة ؛

أخطاء مجهولة المصدر وقيمة غير معروفة. الأكثر ضررا هي أخطاء المجموعة الأولى. يتم القضاء عليهم بسهولة.

من خلال إدخال التصحيحات المناسبة لنتيجة القياس.

تتضمن المجموعة الثانية ، أولاً وقبل كل شيء ، الأخطاء المرتبطة بنقص طريقة القياس ومعدات القياس. على سبيل المثال ، الخطأ في قياس الأداء البدني باستخدام قناع لاستنشاق هواء الزفير: القناع يجعل التنفس صعبًا ، ويظهر الرياضي بشكل طبيعي الأداء البدني الذي يتم التقليل من شأنه مقارنة بالأداء الحقيقي الذي تم قياسه بدون القناع. لا يمكن التنبؤ بحجم هذا الخطأ مسبقًا: فهو يعتمد على القدرات الفردية للرياضي وحالته الصحية في وقت الدراسة.

مثال آخر على خطأ منهجي لهذه المجموعة هو الخطأ المرتبط بنقص المعدات ، عندما يبالغ جهاز القياس عمدًا أو يقلل من القيمة الحقيقية للقيمة المقاسة ، لكن حجم الخطأ غير معروف.

تعتبر أخطاء المجموعة الثالثة هي الأكثر خطورة ، ويرتبط مظهرها بنقص طريقة القياس وخصائص كائن القياس - الرياضي.

تنشأ الأخطاء العشوائية تحت تأثير عوامل مختلفة لا يمكن التنبؤ بها مسبقًا أو أخذها في الاعتبار بدقة. من حيث المبدأ ، لا يمكن إزالة الأخطاء العشوائية. ومع ذلك ، باستخدام طرق الإحصاء الرياضي ، من الممكن تقدير حجم الخطأ العشوائي وأخذها في الاعتبار عند تفسير نتائج القياس. لا يمكن اعتبار نتائج القياس موثوقة بدون معالجة إحصائية.

ما هو الاختبار

وفقًا لـ IEEE Std 829-1983 اختباراتهي عملية تحليل برمجية تهدف إلى تحديد الاختلافات بين خصائصها الحالية والمطلوبة (عيب) وتقييم خصائص البرمجيات.

وفقًا لـ GOST R ISO IEC 12207-99 ، في دورة حياة البرنامج ، من بين أمور أخرى ، يتم تحديد العمليات المساعدة للتحقق والشهادة والتحليل المشترك والتدقيق. عملية التحقق هي عملية تحديد أن منتجات البرامج تعمل في الامتثال الكامل للمتطلبات أو الشروط المطبقة في العمل السابق. يمكن أن تشمل هذه العملية التحليل والتحقق والاختبار (الاختبار). عملية التصديق هي عملية تحديد مدى اكتمال الامتثال للمتطلبات المحددة أو النظام الذي تم إنشاؤه أو منتج البرنامج مع الغرض الوظيفي. عملية التحليل المشترك هي عملية تقييم الحالات ، وإذا لزم الأمر ، نتائج العمل (المنتجات) في المشروع. عملية التدقيق هي عملية تحديد الامتثال لمتطلبات وخطط وشروط العقد. تضيف هذه العمليات إلى ما يشار إليه عمومًا باسم الاختبار.

يعتمد الاختبار على إجراءات الاختبار ذات المدخلات المحددة والظروف الأولية والنتائج المتوقعة المصممة لغرض معين ، مثل اختبار برنامج واحد أو التحقق من الامتثال لمتطلبات معينة. يمكن أن تختبر إجراءات الاختبار جوانب مختلفة من أداء البرنامج ، من التشغيل الصحيح لوظيفة واحدة إلى الوفاء المناسب بمتطلبات العمل.

عند تنفيذ المشروع ، من الضروري مراعاة المعايير والمتطلبات التي سيتم اختبار المنتج وفقًا لها. ما هي الأدوات التي سيتم استخدامها (إن وجدت) للعثور على العيوب التي تم العثور عليها وتوثيقها. إذا كنت تتذكر الاختبار منذ بداية المشروع ، فإن اختبار المنتج قيد التطوير لن يجلب لك أي مفاجآت غير سارة. هذا يعني أن جودة المنتج من المحتمل أن تكون عالية جدًا.

دورة حياة المنتج والاختبار

على نحو متزايد ، في عصرنا ، يتم استخدام عمليات تطوير البرامج التكرارية ، على وجه الخصوص ، التكنولوجيا RUP - عملية موحدة عقلانية(رسم بياني 1). عند استخدام هذا الأسلوب ، يتوقف الاختبار عن أن يكون عملية "خارج الصندوق" تبدأ بعد أن يكتب المبرمجون كل التعليمات البرمجية الضرورية. يبدأ العمل في الاختبارات من المرحلة الأولية لتحديد متطلبات منتج مستقبلي ويتم دمجه بإحكام مع المهام الحالية. وهذا يخلق متطلبات جديدة للمختبرين. لا يقتصر دورهم على مجرد تحديد الأخطاء بشكل كامل وفي أقرب وقت ممكن. يجب أن يشاركوا في العملية الشاملة لتحديد ومعالجة مخاطر المشروع الأكثر أهمية. للقيام بذلك ، لكل تكرار ، يتم تحديد هدف اختبار وطرق تحقيقه. وفي نهاية كل تكرار ، يتم تحديد مدى تحقيق هذا الهدف ، وما إذا كانت هناك حاجة لاختبارات إضافية ، وما إذا كانت المبادئ والأدوات اللازمة لإجراء الاختبارات بحاجة إلى التغيير. في المقابل ، يجب أن يمر كل عيب تم اكتشافه خلال دورة حياته الخاصة.

أرز. 1. دورة حياة المنتج وفقًا لـ RUP

يتم إجراء الاختبار عادةً في دورات ، ولكل منها قائمة محددة من الأهداف والغايات. يمكن أن تتزامن دورة الاختبار مع تكرار أو تتوافق مع جزء معين منها. عادة ، يتم إجراء دورة الاختبار لبناء معين للنظام.

تتكون دورة حياة منتج البرنامج من سلسلة من التكرارات القصيرة نسبيًا (الشكل 2). التكرار هو دورة تطوير كاملة تؤدي إلى إصدار منتج نهائي أو نسخة مختصرة منه ، والتي تمتد من التكرار إلى التكرار لتصبح في النهاية نظامًا كاملاً.

يتضمن كل تكرار ، كقاعدة عامة ، مهام تخطيط العمل وتحليل وتصميم وتنفيذ واختبار وتقييم النتائج المحققة. ومع ذلك ، يمكن أن تختلف العلاقة بين هذه المهام بشكل كبير. وفقًا لنسبة المهام المختلفة في التكرار ، يتم تجميعها في مراحل. المرحلة الأولى - التأسيس - تركز على مهام التحليل. تركز تكرارات المرحلة الثانية - التطوير - على تصميم واختبار حلول التصميم الرئيسية. المرحلة الثالثة - البناء - لديها النصيب الأكبر من مهام التطوير والاختبار. وفي المرحلة الأخيرة - النقل - يتم حل مهام اختبار ونقل النظام للعميل إلى أقصى حد.

أرز. 2. تكرار دورة حياة منتج البرنامج

كل مرحلة لها أهدافها الخاصة في دورة حياة المنتج وتعتبر مكتملة عند تحقيق هذه الأهداف. تكتمل جميع التكرارات ، باستثناء تكرارات مرحلة التأسيس ، بإنشاء نسخة عاملة من النظام قيد التطوير.

فئات الاختبار

تختلف الاختبارات اختلافًا كبيرًا في المهام التي يتم حلها بمساعدتهم وفي التقنية المستخدمة.

فئات الاختبار وصف التصنيف أنواع الاختبار
الاختبار الحالي مجموعة من الاختبارات التي يتم إجراؤها لتحديد صحة ميزات النظام الجديدة المضافة.
  • اختبار الإجهاد
  • اختبار دورة العمل
  • اختبار الإجهاد.
اختبار الانحدار الغرض من اختبار الانحدار هو التحقق من أن الإضافات إلى النظام لم تقلل من إمكانياته ، أي. يتم إجراء الاختبار وفقًا للمتطلبات التي تم تلبيتها بالفعل قبل إضافة ميزات جديدة.
  • اختبار الإجهاد
  • اختبار دورة العمل
  • اختبار الإجهاد.

اختبار الفئات الفرعية

اختبار الفئات الفرعية وصف نوع الاختبار اختبار الأنواع الفرعية
اختبار الإجهاد يتم استخدامه لاختبار جميع وظائف التطبيق دون استثناء. في هذه الحالة ، لا يهم تسلسل وظائف الاختبار.
  • الاختبار الوظيفي؛
  • اختبار الواجهة
  • اختبار قاعدة البيانات
اختبار دورة الأعمال يتم استخدامه لاختبار وظائف التطبيق في التسلسل الذي يطلق عليه المستخدم. على سبيل المثال ، تقليد جميع تصرفات المحاسب لربع واحد.
  • اختبار الوحدة (اختبار الوحدة) ؛
  • الاختبار الوظيفي؛
  • اختبار الواجهة
  • اختبار قاعدة البيانات.
اختبار الإجهاد

تستخدم للاختبار

أداء التطبيق. الغرض من هذا الاختبار هو تحديد إطار العمل للتشغيل المستقر للتطبيق. خلال هذا الاختبار ، يتم استدعاء جميع الوظائف المتاحة.

  • اختبار الوحدة (اختبار الوحدة) ؛
  • الاختبار الوظيفي؛
  • اختبار الواجهة
  • اختبار قاعدة البيانات.

أنواع الاختبار

وحدة التجارب (اختبار الوحدة) - يتضمن هذا النوع اختبار وحدات التطبيق الفردية. للحصول على أقصى نتيجة ، يتم إجراء الاختبار بالتزامن مع تطوير الوحدات.

الاختبار الوظيفي - الغرض من هذا الاختبار هو التأكد من أن عنصر الاختبار يعمل بشكل صحيح. يتم اختبار صحة التنقل عبر الكائن ، وكذلك إدخال البيانات ومعالجتها وإخراجها.

اختبار قاعدة البيانات - التحقق من قابلية تشغيل قاعدة البيانات أثناء التشغيل العادي للتطبيق ، في لحظات التحميل الزائد وفي وضع المستخدمين المتعددين.

وحدة التجارب

بالنسبة إلى OOP ، فإن التنظيم المعتاد لاختبار الوحدة هو اختبار طرق كل فئة ، ثم فئة كل حزمة ، وما إلى ذلك. تدريجيًا ننتقل إلى اختبار المشروع بأكمله ، والاختبارات السابقة هي اختبارات انحدار.

يتضمن توثيق مخرجات هذه الاختبارات إجراءات الاختبار وبيانات الإدخال والرمز الذي ينفذ الاختبار وبيانات الإخراج. فيما يلي عرض لوثائق الإخراج.

الاختبار الوظيفي

يتم التخطيط للاختبار الوظيفي لعنصر الاختبار وتنفيذه بناءً على متطلبات الاختبار المحددة خلال مرحلة تحديد المتطلبات. المتطلبات هي قواعد العمل ، ومخططات حالة الاستخدام ، ووظائف الأعمال ، ومخططات النشاط ، إن وجدت. الغرض من الاختبارات الوظيفية هو التحقق من أن مكونات الرسومات المطورة تفي بالمتطلبات المحددة.

لا يمكن أن يكون هذا النوع من الاختبار مؤتمت بالكامل. ومن ثم تنقسم إلى:

  • الاختبار الآلي (يستخدم في حالة إمكانية التحقق من المخرجات).

الغرض: اختبار إدخال البيانات ومعالجتها وإخراجها ؛

  • الاختبار اليدوي (في حالات أخرى).

الغرض: اختبار صحة استيفاء متطلبات المستخدم.

من الضروري تنفيذ (تشغيل) كل حالة من حالات الاستخدام ، باستخدام كل من القيم الصحيحة والقيم الخاطئة عن عمد ، لتأكيد الأداء الصحيح ، وفقًا للمعايير التالية:

  • المنتج يستجيب بشكل مناسب لجميع بيانات الإدخال (يتم عرض النتائج المتوقعة استجابة للبيانات المدخلة بشكل صحيح) ؛
  • المنتج يستجيب بشكل مناسب للبيانات التي تم إدخالها بشكل غير صحيح (تظهر رسائل الخطأ المقابلة).

اختبار قاعدة البيانات

الغرض من هذا الاختبار هو التأكد من أن طرق الوصول إلى قاعدة البيانات موثوقة ومنفذة بشكل صحيح دون المساس بتكامل البيانات.

يجب أن تستخدم باستمرار أكبر عدد ممكن من استدعاءات قاعدة البيانات. يتم استخدام نهج يتكون الاختبار فيه بطريقة "تحميل" القاعدة بسلسلة من القيم الصحيحة والقيم الخاطئة عن عمد. يتم تحديد استجابة قاعدة البيانات لإدخال البيانات ، وتقدير الفترات الزمنية لمعالجتها.

يسمى القياس أو الاختبار الذي يتم إجراؤه لتحديد حالة أو قدرة الرياضي عجينة... لا يمكن استخدام جميع القياسات كاختبارات ، ولكن فقط تلك التي تفي بالمتطلبات الخاصة: المعيار ، وتوافر نظام التصنيف ، والموثوقية ، ومحتوى المعلومات ، والموضوعية. تسمى الاختبارات التي تفي بمتطلبات الموثوقية ومحتوى المعلومات والموضوعية صلب.

تسمى عملية الاختبار اختبارات، والقيم العددية التي تم الحصول عليها نتيجة القياس هي نتيجة الاختبار.

تسمى الاختبارات على أساس المهام الحركية محركأو محرك... هناك ثلاث مجموعات من الاختبارات الحركية ، اعتمادًا على المهمة التي يواجهها الموضوع.

أنواع مختلفة من الاختبارات الحركية

اسم تجربة

مهمة رياضي

نتيجة الاختبار

ممارسة السيطرة

الإنجازات الحركية

1500 متر على التوالي ، وقت التشغيل

الاختبارات المعيارية الوظيفية

نفس الشيء بالنسبة للجميع ، بجرعات: 1) حسب حجم العمل المنجز ؛ 2) بحجم التحولات الفسيولوجية

المؤشرات الفسيولوجية أو البيوكيميائية في العمل القياسي المؤشرات الحركية بالحجم القياسي للتحولات الفسيولوجية

تسجيل معدل ضربات القلب عند العمل القياسي 1000 كجم / دقيقة سرعة الجري بمعدل ضربات القلب 160 نبضة / دقيقة

الاختبارات الوظيفية القصوى

تظهر النتيجة القصوى

المعلمات الفسيولوجية أو البيوكيميائية

تحديد الحد الأقصى لدين الأكسجين أو الحد الأقصى لاستهلاك الأكسجين

في بعض الأحيان لا يتم استخدام اختبار واحد ، ولكن يتم استخدام عدة اختبارات بهدف نهائي واحد. تسمى هذه المجموعة من الاختبارات مجموعة من الاختبارات.

من المعروف أنه حتى مع التوحيد القياسي الأكثر صرامة والأجهزة الدقيقة ، فإن نتائج الاختبار تختلف دائمًا إلى حد ما. لذلك ، فإن أحد الشروط المهمة لاختيار الاختبارات الجيدة هو موثوقيتها.

موثوقية الاختبارهي درجة تطابق النتائج عندما يتم اختبار نفس الأشخاص مرة أخرى في نفس الظروف. هناك أربعة أسباب رئيسية للاختلاف داخل الفرد أو داخل المجموعة في نتائج الاختبار:

    التغييرات في حالة الموضوعات (التعب ، التغيير في الدافع ، إلخ) ؛ التغييرات غير المنضبط في الظروف والمعدات الخارجية ؛

    التغيير في حالة الشخص الذي يجري الاختبار أو يقيمه (الرفاه ، استبدال المجرب ، إلخ) ؛

    النقص في الاختبار (على سبيل المثال ، الاختبارات غير الكاملة وغير الموثوقة عمدًا - رميات حرة في سلة كرة السلة قبل الخطأ الأول ، وما إلى ذلك).

يمكن أن يكون معيار موثوقية الاختبار عامل الموثوقيةمحسوبة كنسبة التباين الحقيقي إلى التباين المسجل في التجربة: r = صحيح s 2 / مسجل s 2 ، حيث تُفهم القيمة الحقيقية على أنها التباين الذي تم الحصول عليه بعدد لا حصر له من الملاحظات في ظل نفس الظروف ؛ التباين المسجل مشتق من الدراسات التجريبية. وبعبارة أخرى ، فإن معامل الموثوقية هو ببساطة جزء الاختلاف الحقيقي في التباين المسجل في التجربة.

بالإضافة إلى هذا المعامل ، يستخدمون أيضًا مؤشر الموثوقية، والذي يعتبر المعامل النظري للارتباط أو العلاقة بين القيم المسجلة والحقيقية لنفس الاختبار. هذه الطريقة هي الأكثر شيوعًا كمعيار لتقييم جودة (موثوقية) الاختبار.

واحدة من خصائص موثوقية الاختبار هو التكافؤوالتي تعكس درجة تطابق نتائج الاختبار بنفس الجودة (على سبيل المثال ، الفيزيائية) باختبارات مختلفة. يعتمد الموقف تجاه معادلة الاختبار على المهمة المحددة. من ناحية أخرى ، إذا كان اختباران أو أكثر متكافئين ، فإن استخدامهما المشترك يزيد من موثوقية التقديرات ؛ من ناحية أخرى ، يبدو أنه من الممكن تطبيق اختبار مكافئ واحد فقط ، والذي من شأنه تبسيط الاختبار.

إذا كانت جميع الاختبارات في أي بطارية اختبار متكافئة للغاية ، فيتم استدعاؤها متجانس(على سبيل المثال ، لتقييم جودة القفز ، يجب افتراض أن الوثب الطويل ، والقفزات الثلاثية لأعلى ، ستكون متجانسة). على العكس من ذلك ، إذا لم يكن هناك اختبارات مكافئة في المجمع (على سبيل المثال ، لتقييم اللياقة البدنية العامة) ، فإن جميع الاختبارات المدرجة فيه تقيس خصائص مختلفة ، أي في الأساس هو المركب غير متجانسة.

يمكن تحسين موثوقية الاختبارات إلى حد معين من خلال:

    توحيد أكثر صرامة للاختبار ؛

    زيادة عدد المحاولات

    زيادة عدد المقيّمين وتحسين اتساق آرائهم ؛

    زيادة عدد الاختبارات المعادلة ؛

    دافع أفضل للمواضيع.

موضوعية الاختبارهناك حالة خاصة من الموثوقية ، أي استقلالية نتائج الاختبار عن الشخص الذي يجري الاختبار.

المعلوماتية للاختبارهي درجة الدقة التي تقيس بها الخاصية (جودة الرياضي) التي تستخدم من أجلها. في حالات مختلفة ، يمكن أن تحتوي نفس الاختبارات على محتوى إعلامي مختلف. تنقسم مسألة المعلوماتية للاختبار إلى سؤالين محددين:

ماذا يتغير هذا الاختبار؟ كيف يقيس بالضبط؟

على سبيل المثال ، هل من الممكن الحكم على ملاءمة العدائين عن بعد بمؤشر مثل IPC ، وإذا كان الأمر كذلك ، فما درجة الدقة؟ هل يمكن استخدام هذا الاختبار في عملية المراقبة؟

إذا تم استخدام الاختبار لتحديد حالة الرياضي في وقت الفحص ، فإنهم يتحدثون عنه التشخيصالمعلوماتية للاختبار. إذا أرادوا ، بناءً على نتائج الاختبار ، التوصل إلى استنتاج حول الأداء المستقبلي المحتمل للرياضي ، فإنهم يتحدثون عن تنبؤيالمعلومات. يمكن أن يكون الاختبار مفيدًا من الناحية التشخيصية ، ولكن ليس من الناحية الإنذارية ، والعكس صحيح.

يمكن وصف درجة محتوى المعلومات كمياً - على أساس البيانات التجريبية (ما يسمى ب تجريبيالمعلوماتية) ونوعيًا - بناءً على تحليل ذي مغزى للوضع ( منطقيالمعلومات). على الرغم من أنه في العمل العملي ، يجب دائمًا أن يسبق التحليل المنطقي أو الهادف التحليل الرياضي. مؤشر المعلوماتية للاختبار هو معامل الارتباط المحسوب لاعتماد المعيار على النتيجة في الاختبار ، والعكس صحيح (يتم أخذ المؤشر كمعيار ، مما يعكس بوضوح الخاصية التي سيتم قياسها باستخدام اختبار).

في حالة عدم كفاية محتوى المعلومات لأي اختبار ، يلجأون إلى استخدام مجموعة من الاختبارات. ومع ذلك ، فإن الأخير ، حتى مع وجود معايير منفصلة عالية لمحتوى المعلومات (وفقًا لمعاملات الارتباط) ، لا يسمح بالحصول على رقم واحد. هنا يمكن أن تنقذ طريقة أكثر تعقيدًا للإحصاء الرياضي - تحليل العوامل.مما يسمح لك بتحديد عدد الاختبارات التي تعمل معًا على عامل معين وما هي درجة مساهمتها في كل عامل وأيها. وبعد ذلك يكون من السهل بالفعل تحديد الاختبارات (أو مجموعاتها) التي تقيم العوامل الفردية بدقة أكبر.

1 ما يسمى الاختبار؟

2 ما هو الاختبار؟

القياس الكمي لجودة أو حالة الرياضي قياس أو اختبار لتحديد حالة الرياضي أو عملية اختبار القدرة التي تحدد جودة الرياضي أو حالته. لا يوجد تعريف مطلوب

3 ما يسمى نتيجة الاختبار؟

القياس الكمي لجودة أو حالة الرياضي قياس أو اختبار لتحديد حالة الرياضي أو عملية اختبار القدرة التي تحدد جودة الرياضي أو حالته. لا يوجد تعريف مطلوب

4 ما نوع الاختبارات الجري 100 متر?

5 ما هو نوع الاختبارات دينامومتر اليد?

تمرين التحكم الاختبار الوظيفي الاختبار الوظيفي الأقصى

6 ما نوع الاختبارات التي تنتمي إليها العينة؟ IPC?

تمرين التحكم الاختبار الوظيفي الاختبار الوظيفي الأقصى

7 ما هو نوع الاختبارات تشغيل لمدة ثلاث دقائق تحت بندول الإيقاع?

تمرين التحكم الاختبار الوظيفي الاختبار الوظيفي الأقصى

8 ما هو نوع الاختبارات أقصى عدد من عمليات السحب على الشريط?

تمرين التحكم الاختبار الوظيفي الاختبار الوظيفي الأقصى

9 في أي حالة يعتبر الاختبار مفيدًا؟

10 متى يعتبر الاختبار موثوقًا به؟

قدرة الاختبار على إعادة إنتاج النتائج عند إعادة الاختبار قدرة الاختبار على قياس جودة الرياضي المعني استقلالية نتائج الاختبار عن الشخص الذي يجري الاختبار

11 متى يعتبر الاختبار موضوعيًا؟

قدرة الاختبار على إعادة إنتاج النتائج عند إعادة الاختبار قدرة الاختبار على قياس جودة الرياضي المعني استقلالية نتائج الاختبار عن الشخص الذي يجري الاختبار

12 ما هو المعيار الضروري عند تقييم اختبار محتوى المعلومات؟

13 ما هو المعيار المطلوب عند تقييم اختبار الموثوقية؟

معيار t للطالب معيار F-Fisher معامل الارتباط معامل تحديد التباين

14 ما هو المعيار المطلوب عند تقييم اختبار الموضوعية؟

معيار t للطالب معيار F-Fisher معامل الارتباط معامل تحديد التباين

15 ما هو اسم المعلوماتية للاختبار إذا تم استخدامه لتقييم درجة تدريب الرياضي؟

16 ما هي المعلوماتية في تمارين التحكم التي يسترشد بها المدرب عند اختيار الأطفال لقسم الرياضة؟

التشخيص التجريبي المنطقي التنبئي

17 هل تحليل الارتباط ضروري لتقييم المعلوماتية للاختبارات؟

18 هل تحليل العوامل ضروري لتقييم المعلوماتية للاختبارات؟

19 هل من الممكن تقييم موثوقية الاختبار باستخدام تحليل الارتباط؟

20 هل يمكن تقييم موضوعية الاختبار باستخدام تحليل الارتباط؟

21 هل الاختبارات المصممة لتقييم اللياقة البدنية العامة ستكون مكافئة؟

22 عند قياس نفس الجودة باختبارات مختلفة ، يتم استخدام الاختبارات ...

مصممة لقياس نفس الجودة وجود علاقة ارتباط عالية فيما بينها وجود ارتباط منخفض فيما بينها

أساسيات نظرية التقييم

لتقييم الأداء الرياضي ، غالبًا ما تستخدم جداول التسجيل الخاصة. الغرض من هذه الجداول هو تحويل النتيجة الرياضية المعروضة (المعبر عنها في مقاييس موضوعية) إلى نقاط شرطية. يسمى قانون تحويل النتائج الرياضية إلى نقاط مقياس التصنيف... يمكن تحديد المقياس كتعبير رياضي أو جدول أو رسم بياني. هناك 4 أنواع رئيسية من المقاييس المستخدمة في الرياضة والتربية البدنية.

المقاييس النسبية

المقاييس الانحدارية

المقاييس التقدمية.

المقاييس النسبيةافترض مسبقًا تراكم نفس عدد النقاط لزيادة متساوية في النتائج (على سبيل المثال ، لكل 0.1 ثانية من التحسن في النتيجة في سباق 100 متر ، يتم منح 20 نقطة). تستخدم هذه المقاييس في الخماسي الحديث ، والتزلج السريع ، والتزلج ، ورياضة الشمال مجتمعة ، والبيثلون وغيرها من الرياضات.

المقاييس الانحداريةيعني الاستحقاق ، لنفس الزيادة في النتيجة مع زيادة الإنجازات الرياضية ، عدد نقاط أصغر باستمرار (على سبيل المثال ، لتحسين النتيجة في 100 متر على التوالي من 15 ، من 0 إلى 14.9 ثانية ، تتم إضافة 20 نقطة ، و لمدة 0.1 ثانية في النطاق 10.0-9.9 ثانية - 15 نقطة فقط).

المقاييس التقدمية.هنا ، كلما زادت النتيجة الرياضية ، كلما زاد عدد النقاط التي تم تقييم تحسنها (على سبيل المثال ، تمت إضافة 10 نقاط لتحسين وقت الجري من 15.0 إلى 14.9 ثانية ، و 100 نقطة من 10.0 إلى 9.9 ثانية). تستخدم المقاييس التقدمية في السباحة وأنواع معينة من ألعاب القوى ورفع الأثقال.

المقاييس السينيةنادرًا ما تستخدم في الألعاب الرياضية ، ولكنها تستخدم على نطاق واسع في تقييم اللياقة البدنية (على سبيل المثال ، هذا هو الشكل الذي يبدو عليه مقياس معايير اللياقة البدنية لسكان الولايات المتحدة). في هذه المقاييس ، يتم تشجيع التحسينات في الأداء في مناطق الأداء المنخفضة جدًا والعالية جدًا ؛ يتم الحصول على معظم النقاط من خلال الزيادة في النتائج في منطقة الإنجاز المتوسط.

الأهداف الرئيسية للتقييم هي:

    مقارنة الإنجازات المختلفة في نفس المهمة ؛

    مقارنة الإنجازات في المهام المختلفة ؛

    تحديد القواعد.

القاعدةفي علم القياس الرياضي ، يتم استدعاء القيمة الحدودية للنتيجة ، والتي تعمل كأساس لإسناد رياضي إلى إحدى مجموعات التصنيف. هناك ثلاثة أنواع من القواعد: المقارنة ، الفردية ، المستحقة.

القواعد المقارنةتستند إلى مقارنة الأشخاص الذين ينتمون إلى نفس السكان. على سبيل المثال ، تقسيم الناس إلى مجموعات فرعية وفقًا لدرجة المقاومة (عالية ، متوسطة ، منخفضة) أو التفاعل (مفرط النشاط ، طبيعي ، قليل النشاط) لنقص الأكسجة.

درجات مختلفة من التقييمات والقواعد

نسبة المواد

المعايير في المقاييس

شفهي

بالنقاط

النسبة المئوية

منخفظ جدا

أقل من M - 2

من M - 2 إلى M - 1

أقل من المتوسط

من M-1 إلى M-0.5

من M - 0.5 إلى M + 0.5

فوق المتوسط

من M + 0.5 إلى M + 1

من M + 1 إلى M + 2

عالي جدا

فوق M + 2

تميز هذه المعايير فقط النجاح المقارن للموضوعات في مجموعة سكانية معينة ، لكنها لا تقول أي شيء عن السكان ككل (أو في المتوسط). لذلك ، يجب مقارنة معدلات المقارنة مع البيانات من السكان الآخرين واستخدامها جنبًا إلى جنب مع المعدلات الفردية والمستحقة.

القواعد الفرديةبناءً على مقارنة أداء نفس الرياضي في حالات مختلفة. على سبيل المثال ، في العديد من الألعاب الرياضية لا توجد علاقة بين وزن جسمك والأداء الرياضي. يتمتع كل رياضي بوزن أمثل فرديًا يتوافق مع حالة الشكل الرياضي. يمكن مراقبة هذا المعدل في مراحل مختلفة من التدريب الرياضي.

القواعد الواجبةتستند إلى تحليل لما يجب أن يكون الشخص قادرًا على التعامل بنجاح مع المهام التي تحددها الحياة أمامه. مثال على ذلك يمكن أن يكون معايير المجمعات الفردية للتدريب البدني ، والقيم المناسبة لـ VC ، ومعدل الأيض الأساسي ، ووزن الجسم والطول ، إلخ.

1 هل من الممكن قياس جودة التحمل بشكل مباشر؟

2 هل من الممكن قياس جودة السرعة بشكل مباشر؟

3 هل من الممكن قياس جودة البراعة مباشرة؟

4 هل من الممكن قياس جودة المرونة بشكل مباشر؟

5 هل من الممكن قياس قوة العضلات الفردية بشكل مباشر؟

6 هل يمكن التعبير عن التقييم بخاصية نوعية (جيد ، مرض ، سيئ ، ائتماني ، إلخ)؟

7 هل هناك فرق بين مقياس القياس ومقياس التصنيف؟

8 ما هو مقياس التصنيف؟

نظام قياس النتائج الرياضية قانون تحويل النتائج الرياضية إلى نظام نقاط لتقييم المعايير

9 يفترض المقياس استحقاق نفس عدد النقاط لزيادة متساوية في النتائج. هو - هي …

10 بالنسبة لنفس الزيادة في النتيجة ، يتم منح عدد أقل من النقاط مع زيادة الإنجازات الرياضية. هو - هي …

المقياس التدريجي المقياس الانحداري المقياس النسبي المقياس السيني

11 كلما زادت النتيجة الرياضية ، كلما زاد عدد النقاط المقدر تحسنها. هو - هي …

المقياس التدريجي المقياس الانحداري المقياس النسبي المقياس السيني

12 يتم تشجيع تحسين الأداء في المجالات ذات الأداء المنخفض جدًا والعالي جدًا ؛ يتم الحصول على معظم النقاط من خلال الزيادة في النتائج في منطقة الإنجاز المتوسط. هو - هي …

المقياس التدريجي المقياس الانحداري المقياس النسبي المقياس السيني

13 تسمى القواعد المستندة إلى مقارنة الأشخاص الذين ينتمون إلى نفس السكان ...

14 تسمى المعايير القائمة على مقارنة أداء نفس الرياضي في ولايات مختلفة ...

المعايير الفردية المعايير الواجبة المعايير المقارنة

15 تسمى القواعد التي تستند إلى تحليل ما يجب أن يكون الشخص قادرًا على القيام به من أجل التعامل مع المهام الموكلة إليه ...

المعايير الفردية المعايير الواجبة المعايير المقارنة

المفاهيم الأساسية للجودة

قياس الجودة(الجودة اللاتينية - الجودة ، المترون - القياس) تدرس وتطور طرقًا كمية لتقييم الخصائص النوعية.

يعتمد القياس على عدة افتراضات:

يمكن قياس أي جودة ؛

تعتمد الجودة على عدد من الخصائص التي تشكل "شجرة الجودة" (على سبيل المثال ، تتكون شجرة جودة أداء التمرين في التزلج على الجليد من ثلاثة مستويات - أعلى ، ومتوسط ​​، وأدنى) ؛

يتم تحديد كل خاصية برقمين: المؤشر النسبي والوزن ؛ مجموع أوزان الخصائص في كل مستوى يساوي واحد (أو 100٪).

تنقسم الأساليب المنهجية للقياس إلى مجموعتين:

إرشادية (حدسية) تستند إلى تقييمات الخبراء واستبياناتهم ؛

مفيدة.

خبيريسمى تقدير تم الحصول عليه عن طريق سؤال آراء المتخصصين. أمثلة نموذجية للخبرة: التحكيم في الجمباز والتزلج على الجليد ، المنافسة على أفضل عمل علمي ، إلخ.

يشمل الفحص المراحل الرئيسية التالية: تشكيل هدفه ، واختيار الخبراء ، واختيار المنهجية ، والمسح ومعالجة المعلومات الواردة ، بما في ذلك تقييم اتساق تقييمات الخبراء الفردية. أثناء الفحص ، تكون درجة اتساق آراء الخبراء ذات أهمية كبيرة ، ويتم تقييمها حسب القيمة معامل ارتباط الرتبة(في حالة وجود عدة خبراء). وتجدر الإشارة إلى أن ارتباط الرتب يكمن وراء حل العديد من مشاكل القياس النوعي ، لأنه يسمح بالحسابات الرياضية بسمات نوعية.

من الناحية العملية ، غالبًا ما يكون مؤشر مؤهلات الخبير هو انحراف تقييماته عن متوسط ​​التقييمات لمجموعة من الخبراء.

عن طريق الاستجوابتسمى طريقة جمع الآراء بملء الاستبيانات. يشير الاستبيان ، جنبًا إلى جنب مع المقابلة والمحادثة ، إلى طرق المسح. على عكس المقابلات والمحادثات ، يفترض استطلاع الاستبيان مسبقًا إجابات مكتوبة من الشخص الذي يملأ الاستبيان - المستفتى - لنظام الأسئلة الموحدة. يسمح لك بدراسة دوافع السلوك والنوايا والآراء وما إلى ذلك.

بمساعدة الاستبيانات ، من الممكن حل العديد من المشكلات العملية في الرياضة: تقييم الحالة النفسية للرياضي ؛ موقفه من طبيعة وتوجيه الدورات التدريبية ؛ العلاقات الشخصية في الفريق ؛ التقييم الخاص للجاهزية الفنية والتكتيكية ؛ تقييم النظام الغذائي وغيرها الكثير.

1 ما الذي يدرسه القياس؟

دراسة جودة الاختبارات - دراسة الخصائص النوعية للسمة - دراسة وتطوير الأساليب الكمية لتقدير الجودة.

2 الأساليب الرياضية المستخدمة في القياس؟

تحليل التباين

3 ما هي الأساليب المستخدمة لتقييم مستوى الأداء؟

4 ما هي الأساليب المستخدمة لتقييم تنوع العناصر التقنية؟

طريقة الاستبيان طريقة تقييم الخبراء الطريقة غير محددة

5 ما هي الأساليب المستخدمة لتقييم مدى تعقيد العناصر التقنية؟

طريقة الاستبيان طريقة تقييم الخبراء الطريقة غير محددة

6 ما هي الأساليب المستخدمة لتقييم الحالة النفسية للرياضي؟

طريقة الاستبيان طريقة تقييم الخبراء الطريقة غير محددة

يحتوي المكون الأول ، نظرية الاختبار ، على وصف للنماذج الإحصائية لمعالجة بيانات التشخيص. يحتوي على نماذج لتحليل الإجابات في عناصر الاختبار ونماذج لحساب إجمالي نتائج الاختبار. أطلق ميلينبيرج (1980 ، 1990) على هذا "القياس النفسي". نظرية الاختبار الكلاسيكي ، نظرية الاختبار الحديثة (أو نموذج لتحليل إجابات عناصر الاختبار - IRT) والنموذج


تشكل عناصر العينة أهم ثلاثة أنواع من نماذج نظرية الاختبار. موضوع التشخيص النفسي هو أول نموذجين.

نظرية الاختبار الكلاسيكي. تم تطوير معظم اختبارات الذكاء والشخصية على أساس هذه النظرية. المفهوم المركزي لهذه النظرية هو مفهوم "الموثوقية". تشير الموثوقية إلى اتساق النتائج عند إعادة التقييم. في الكتب المرجعية ، عادة ما يتم تقديم هذا المفهوم باختصار شديد ، ثم يتم تقديم وصف مفصل لجهاز الإحصاء الرياضي. في هذا الفصل التمهيدي ، نقدم وصفًا موجزًا ​​للمعنى الرئيسي للمفهوم المذكور. في النظرية الكلاسيكية للاختبارات ، تُفهم الموثوقية على أنها تكرار نتائج العديد من إجراءات القياس (بشكل أساسي القياسات باستخدام الاختبارات). تتضمن الموثوقية حساب خطأ القياس. يمكن تقديم النتائج التي تم الحصول عليها أثناء عملية الاختبار كمجموع النتيجة الحقيقية وخطأ القياس:

Xi = Ti+ Еj

أين شيهو تقييم النتائج التي تم الحصول عليها ، Ti هي النتيجة الحقيقية ، و Еj- خطأ في القياس.

تقييم النتائج التي تم الحصول عليها هو ، كقاعدة عامة ، عدد الإجابات الصحيحة لمهام الاختبار. يمكن اعتبار النتيجة الحقيقية تقديرًا حقيقيًا بالمعنى الأفلاطوني (Gulliksen ، 1950). مفهوم النتائج المتوقعة منتشر على نطاق واسع ، أي النقاط التي يمكن الحصول عليها نتيجة لعدد كبير من عمليات تكرار إجراءات القياس (Lord & نوفيتش ، 1968). لكن لا يمكن إجراء نفس التقييم مع شخص واحد. لذلك ، من الضروري البحث عن حلول أخرى للمشكلة (Witlman ، 1988).

ضمن هذا المفهوم ، يتم وضع بعض الافتراضات فيما يتعلق بالنتائج الحقيقية وأخطاء القياس. يتم أخذ هذا الأخير كعامل مستقل ، وهو بالطبع افتراض قائم على أسس جيدة ، لأن التقلبات العشوائية في النتائج لا تعطي تباينات: ص EE = 0.

من المفترض أنه لا يوجد ارتباط بين الدرجات الحقيقية وأخطاء القياس: ص EE = 0.


الخطأ الإجمالي هو 0 ، لأن يتم أخذ المتوسط ​​الحسابي كتقدير حقيقي:

تقودنا هذه الافتراضات في النهاية إلى التعريف المعروف للوثوقية كنسبة النتيجة الحقيقية إلى التباين الكلي أو التعبير: 1 مطروحًا منها النسبة ، في بسطها خطأ القياس ، وفي المقام - التباين الكلي :


، أو

من هذه الصيغة لتحديد الموثوقية ، نحصل على تباين الخطأ ق 2 (هـ)يساوي التباين الكلي في عدد الحالات (1 - r XX ") ؛ وبالتالي ، يتم تحديد الخطأ القياسي للقياس بواسطة الصيغة:

بعد الإثبات النظري للموثوقية ومشتقاتها ، من الضروري تحديد مؤشر الموثوقية لاختبار معين. هناك إجراءات عملية لتقييم موثوقية الاختبار ، مثل استخدام أشكال قابلة للتبديل (اختبارات متوازية) ، وتقسيم العناصر إلى قسمين ، وإعادة الاختبار ، وقياس الاتساق الداخلي. يحتوي كل مرجع على فهارس لثبات نتائج الاختبار:

ص XX '= ص (× 1 ، × 2)

أين ص XX ' هو معامل الاستقرار ، و × 1 و × 2 - نتائج قياسين.

تم تقديم مفهوم موثوقية الأشكال القابلة للتبديل وتطويرها بواسطة Gulliksen (1950). هذا الإجراء شاق للغاية ، لأنه يرتبط بالحاجة إلى إنشاء سلسلة متوازية من المهام.

ص XX '= ص (× 1 ، × 2)

أين ص XX ' هو معامل التكافؤ و × 1 و × 2 - اختباران متوازيان.

الإجراء التالي - تقسيم الاختبار الرئيسي إلى جزأين A و B - أسهل في الاستخدام. المؤشرات التي تم الحصول عليها لكلا الجزأين من الاختبار مترابطة. باستخدام صيغة Spearman-Brown ، يتم تقييم موثوقية الاختبار ككل:

حيث A و B جزءان متوازيان من الاختبار.

الطريقة التالية هي تحديد الاتساق الداخلي لأداء عناصر الاختبار. تعتمد هذه الطريقة على تحديد التباين المشترك للعناصر الفردية. Sg هو تباين عنصر محدد عشوائيًا ، و Sgh هو التباين المشترك بين عنصرين تم اختيارهما عشوائيًا. المعامل الأكثر استخدامًا لتحديد الاتساق الداخلي هو معامل كرونباخ ألفا. الصيغة تستخدم أيضا KP20 و λ-2(لامدا -2).

في المفهوم الكلاسيكي للموثوقية ، يتم تحديد أخطاء القياس التي تحدث أثناء الاختبار وأثناء الملاحظات. تختلف مصادر هذه الأخطاء: يمكن أن تكون سمات شخصية وخصائص ظروف الاختبار ومهام الاختبار نفسها. هناك طرق محددة لحساب الأخطاء. نحن نعلم أن ملاحظاتنا يمكن أن تكون خاطئة ، وأدواتنا المنهجية غير كاملة ، تمامًا كما أن الناس أنفسهم غير كاملين. (كيف لا تتذكر شكسبير: "أنت غير موثوق ، واسمك رجل"). تعتبر حقيقة أن أخطاء القياس في نظرية الاختبار الكلاسيكية مفسرة ومفسرة نقطة إيجابية مهمة.

تحتوي نظرية الاختبار الكلاسيكي على عدد من الميزات المهمة التي يمكن اعتبارها من أوجه القصور فيها. بعض هذه الخصائص مذكورة في الكتب المرجعية ، ولكن نادرًا ما يتم التأكيد على أهميتها (من وجهة نظر يومية) ، تمامًا كما لم يُلاحظ أنه من وجهة نظر نظرية أو منهجية ، ينبغي اعتبارها عيوبًا.

أولا. تركز النظرية الكلاسيكية للاختبارات ومفهوم الموثوقية على حساب مؤشرات الاختبار الإجمالية ، والتي هي نتيجة إضافة التقديرات التي تم الحصول عليها في مهام منفصلة. لذلك ، عند العمل


ثانيا. يفترض عامل الموثوقية تقدير حجم انتشار المؤشرات المقاسة. ويترتب على ذلك أن معامل الموثوقية سيكون أقل إذا كانت العينة أكثر تجانسًا (مع المساواة مع المؤشرات الأخرى). لا يوجد معامل واحد للتناسق الداخلي لعناصر الاختبار ؛ هذا المعامل دائمًا "سياقي". Crocker and Aljina (1986) ، على سبيل المثال ، يقترحان صيغة خاصة "لتصحيح العينة المتجانس" المصممة لأعلى وأدنى الدرجات التي حصل عليها أولئك الذين يخضعون للاختبار. من المهم للطبيب التشخيص أن يعرف خصائص الاختلافات في العينة ، وإلا فلن يتمكن من استخدام معاملات الاتساق الداخلي المحددة في الدليل لهذا الاختبار.

ثالث. ظاهرة الاختزال إلى الوسط الحسابي هي نتيجة منطقية لمفهوم الموثوقية الكلاسيكي. إذا تذبذبت النتيجة في الاختبار (أي أنها ليست موثوقة بدرجة كافية) ، فمن الممكن تمامًا أنه عند تكرار الإجراء ، سيحصل الأشخاص ذوو الدرجات المنخفضة على درجات أعلى ، والعكس صحيح ، سيحصل الأشخاص ذوو الدرجات العالية على درجات منخفضة . لا يمكن الخلط بين هذه الأداة من إجراء القياس لتغيير حقيقي أو مظهر من مظاهر العمليات التنموية. لكن في الوقت نفسه ، ليس من السهل التمييز بينهما ، tk. لا يمكن أبدا استبعاد إمكانية التغيير في مسار التنمية. للحصول على ثقة كاملة ، من الضروري "المقارنة مع مجموعة التحكم.

السمة الرابعة للاختبارات المصممة وفقًا لمبادئ النظرية الكلاسيكية هي توافر البيانات المعيارية. تسمح معرفة معايير الاختبار للباحث بتفسير نتائج الاختبار بشكل مناسب. خارج القاعدة ، درجات الاختبار لا معنى لها. يعد تطوير معايير الاختبار مهمة مكلفة إلى حد ما ، حيث يجب على عالم النفس الحصول على نتائج الاختبار على عينة تمثيلية.

2 ج. تير لاك

إذا تحدثنا عن أوجه القصور في المفهوم الكلاسيكي للموثوقية ، فمن المناسب الاستشهاد ببيان Si-tsma (1992 ، ص 123-125). ويلاحظ أن الافتراض الأول والأهم لنظرية الاختبار الكلاسيكية هو أن نتائج الاختبار تخضع لمبدأ الفاصل الزمني. ومع ذلك ، لا توجد دراسات لدعم هذا الافتراض. من حيث الجوهر ، هذا "قياس وفقًا لقاعدة راسخة بشكل تعسفي". تضع هذه الميزة النظرية الكلاسيكية للاختبارات في موضع أقل تفضيلًا مقارنة بمقاييس قياس الاتجاهات وبالطبع بالمقارنة مع نظرية الاختبارات الحديثة. تعتمد العديد من طرق تحليل البيانات (تحليل التباين ، تحليل الانحدار ، الارتباط وتحليل العوامل) على افتراض وجود مقياس فاصل. ومع ذلك ، ليس لها أساس متين. بالنظر إلى مقياس النتائج الحقيقية كمقياس لقيم الخصائص النفسية (على سبيل المثال ، القدرات الحسابية والذكاء والعصابية) لا يمكن افتراضه إلا.

الملاحظة الثانية تتعلق بحقيقة أن نتائج الاختبار ليست مؤشرات مطلقة لخاصية نفسية أو أخرى للشخص الذي تم اختباره ، يجب اعتبارها فقط نتائج أداء هذا الاختبار أو ذاك. يمكن أن يدعي اختباران دراسة نفس الخصائص النفسية (على سبيل المثال ، الذكاء ، والقدرة اللفظية ، والانبساط) ، لكن هذا لا يعني أن الاختبارين متكافئان ولديهما نفس القدرات. المقارنة بين أداء شخصين تم اختبارهما باختبارات مختلفة غير صحيحة. الأمر نفسه ينطبق على إكمال اختبارين مختلفين من قبل نفس الموضوع. تشير الملاحظة الثالثة إلى افتراض أن الخطأ القياسي للقياس هو نفسه بالنسبة لأي مستوى من قدرة الفرد القابلة للقياس. ومع ذلك ، لا يوجد اختبار تجريبي لهذا الافتراض. لذلك ، على سبيل المثال ، ليس هناك ما يضمن أن المتقدم للاختبار الذي يتمتع بقدرة رياضية جيدة سيحصل على درجات عالية عند العمل باختبار حسابي بسيط نسبيًا. في هذه الحالة ، من المرجح أن يحصل الشخص ذو القدرات المنخفضة أو المتوسطة على تصنيف عالٍ.

في إطار نظرية الاختبار الحديثة أو نظرية تحليل الإجابة ، تحتوي عناصر الاختبار على وصف كبير


عدد نماذج الإجابات المحتملة للمستجيبين. تختلف هذه النماذج في افتراضاتها ومتطلباتها الأساسية فيما يتعلق بالبيانات التي تم الحصول عليها. غالبًا ما يُنظر إلى نموذج Rush على أنه مرادف لنظريات تحليل الإجابة في أسئلة الاختبار (1RT). في الواقع ، هذا مجرد أحد النماذج. الصيغة المقدمة فيه لوصف المنحنى المميز لضبط g هي كما يلي:

أين ز- مهمة اختبار منفصلة ؛ إكسب- دالة أسية (اعتماد غير خطي) ؛ δ ("دلتا") - مستوى صعوبة الاختبار.

عناصر الاختبار الأخرى مثل حتحصل أيضًا على منحنياتها المميزة. استيفاء الشرط δ ح> ز (زيعني أن ح- مهمة أكثر صعوبة. لذلك ، لأي قيمة للمؤشر Θ ("ثيتا" - الخصائص الكامنة لقدرات المتقدمين للاختبار) احتمالية إتمام المهمة بنجاح حالأصغر. يُطلق على هذا النموذج اسم صارم لأنه من الواضح أنه مع وجود درجة منخفضة من التعبير عن السمة ، يكون احتمال إكمال المهمة قريبًا من الصفر. لا يوجد مجال للتخمين أو التخمين في هذا النموذج. بالنسبة للتعيينات ذات الخيارات ، ليست هناك حاجة لعمل افتراضات حول احتمالية النجاح. بالإضافة إلى ذلك ، يعد هذا النموذج صارمًا بمعنى أن جميع عناصر الاختبار يجب أن تتمتع بنفس القدرة التمييزية (ينعكس التمييز العالي في منحدر المنحنى ؛ وهنا من الممكن إنشاء مقياس جوتمان ، والذي وفقًا لكل نقطة من منحنى مميز يختلف احتمال إكمال مهمة ما من O إلى 1). بسبب هذا الشرط ، لا يمكن تضمين جميع الواجبات في الاختبارات بناءً على نموذج Rush.

هناك العديد من المتغيرات لهذا النموذج (على سبيل المثال ، Birnbaura ، 1968 ، See Lord & Novik). يسمح بوجود مهام ذات تمييزات مختلفة

قدرة.

طور الباحث الهولندي Mokken (1971) نموذجين لتحليل الإجابات في عناصر الاختبار ، متطلباتهما ليست صارمة كما في نموذج Rush ، وبالتالي ، ربما أكثر واقعية. كشرط رئيسي

يطرح Viya Mokken الموقف الذي يجب أن يتبعه المنحنى المميز للمهمة بشكل رتيب ، دون فواصل. في الوقت نفسه ، تهدف جميع مهام الاختبار إلى دراسة نفس الخصائص النفسية التي يجب قياسها الخامس.أي شكل من أشكال هذه التبعية مسموح به طالما أنه لا ينكسر. لذلك ، لا يتم تحديد شكل المنحنى المميز بأي وظيفة محددة. تتيح لك هذه "الحرية" استخدام المزيد من العناصر في الاختبار ، ومستوى التقييم ليس أعلى من المستوى المعتاد.

تختلف منهجية IRT عن منهجية معظم الدراسات التجريبية ودراسات الارتباط. تم تصميم النموذج الرياضي لدراسة الخصائص السلوكية والمعرفية والعاطفية ، وكذلك الظواهر التنموية. غالبًا ما تقتصر هذه الظواهر قيد الدراسة على الاستجابات للمهام ، مما دفع Mellenberg (1990) للإشارة إلى IRT على أنها "نظرية مصغرة للسلوك المصغر". يمكن تقديم نتائج الدراسة إلى حد ما كمنحنيات توافق ، خاصة في الحالات التي لا يوجد فيها فهم نظري للخصائص المدروسة. حتى الآن ، لدينا فقط عدد قليل من اختبارات الذكاء والقدرة والشخصية ، التي تم إنشاؤها على أساس العديد من نماذج نظرية IRT. تُستخدم متغيرات نموذج Rush بشكل أكثر شيوعًا في تصميم اختبارات الإنجاز (Verhelst ، 1993) ، بينما تعد نماذج Mocken أكثر ملاءمة للظواهر التنموية (انظر أيضًا الفصل 6).

استجابة المتقدم للاختبار لعناصر الاختبار هي الوحدة الأساسية لنماذج IRT. يتم تحديد نوع الاستجابة من خلال شدة السمة المدروسة في الشخص. يمكن أن تكون هذه الخاصية ، على سبيل المثال ، حسابية أو قدرة مكانية. في معظم الحالات ، يكون هذا جانبًا أو آخر من جوانب الذكاء أو خصائص الإنجاز أو سمات الشخصية. من المفترض أن هناك علاقة غير خطية بين موقف هذا الشخص المعين في نطاق معين للخاصية المدروسة واحتمال إكمال مهمة معينة بنجاح. اللاخطية لهذه العلاقة حدسية إلى حد ما. العبارات المعروفة "كل بداية صعبة" (بطيئة


البداية الخطية) و "أن تصبح قديسًا ليس بهذه السهولة" تعني أن المزيد من التحسين بعد الوصول إلى مستوى معين أمر صعب. يقترب المنحنى ببطء ، لكنه لا يصل أبدًا إلى معدل نجاح بنسبة 100٪.

من المرجح أن تتعارض بعض النماذج مع فهمنا البديهي. لنأخذ هذا المثال. الشخص الذي لديه مؤشر شدة خاصية عشوائية تساوي 1.5 لديه احتمال 60 بالمائة للنجاح في المهمة. يتعارض هذا مع فهمنا البديهي لمثل هذا الموقف ، لأنه يمكنك إما التعامل مع المهمة بنجاح ، أو عدم التعامل معها على الإطلاق. لنأخذ هذا المثال: 100 مرة يحاول شخص أن يرتفع 1 م 50 سم. النجاح يرافقه 60 مرة ، أي لديها نسبة نجاح 60 في المئة.

لتقييم شدة الخاصية ، هناك حاجة إلى مهمتين على الأقل. يفترض نموذج Rush تحديد شدة الخصائص ، بغض النظر عن صعوبة المهمة. يتناقض هذا أيضًا مع فهمنا البديهي: لنفترض أن لدى الشخص احتمال 80 في المائة للقفز فوق 1.30 متر ، وإذا كان الأمر كذلك ، وفقًا للمنحنى المميز للمهام ، فإن لديه احتمال 60 في المائة للقفز فوق 1.50 متر و 40 في المائة من احتمالية القفز فوق 1.70 م ، لذلك ، بغض النظر عن قيمة المتغير المستقل (الارتفاع) ، من الممكن تقييم قدرة الشخص على القفز في الارتفاع.

يوجد حوالي 50 نموذجًا من نماذج IRT (Goldstein & Wood ، 1989) ، وهناك العديد من الوظائف غير الخطية التي تصف (تشرح) احتمالية النجاح في مهمة أو مجموعة من المهام. تختلف متطلبات وقيود هذه النماذج ، ويمكن العثور على هذه الاختلافات عند مقارنة نموذج Rush ومقياس Mocken. تشمل متطلبات هذه النماذج ما يلي:

1) الحاجة إلى تحديد الخصائص قيد الدراسة وتقييم وضع الشخص في نطاق هذه السمة ؛

2) تقييم تسلسل المهام ؛

3) التحقق من نماذج محددة. في القياس النفسي ، تم تطوير العديد من الإجراءات لاختبار النموذج.

في بعض الكتب المرجعية ، تعتبر نظرية IRT كشكل من أشكال تحليل عناصر الاختبار (انظر ، على سبيل المثال ،

كروكر & ألجينا ، J 986). ومع ذلك ، من الممكن المجادلة بأن نظرية IRT هي "نظرية مصغرة للسلوك المصغر". لاحظ أنصار نظرية IRT أنه إذا كانت مفاهيم المستوى المتوسط ​​(النماذج) غير كاملة ، فماذا عن التركيبات الأكثر تعقيدًا في علم النفس؟

نظرية الاختبار الكلاسيكية والحديثة. لا يسع الناس إلا مقارنة الأشياء التي تبدو متشابهة تقريبًا. (ربما يتمثل المعادل اليومي للقياس النفسي بشكل أساسي في مقارنة الأشخاص وفقًا لخصائص مهمة والاختيار بينهم). كل من النظريات المقدمة - كل من نظرية قياس أخطاء التقدير والنموذج الرياضي لإجابات عناصر الاختبار - لها مؤيدوها (Goldstein & Wood ، 1986).

لا يتم لوم نماذج IRT لكونها "قائمة على القواعد" ، على عكس نظرية الاختبار الكلاسيكية. يركز نموذج IRT على تحليل الخصائص التي تم تقييمها. يتم تقييم خصائص وخصائص المهام الشخصية باستخدام المقاييس (الترتيبية أو الفاصلة). علاوة على ذلك ، من الممكن مقارنة مؤشرات الأداء للاختبارات المختلفة التي تهدف إلى دراسة الخصائص المتشابهة. أخيرًا ، الموثوقية ليست هي نفسها لكل قيمة على المقياس ، وعادة ما تكون المتوسطات أكثر موثوقية من تلك الموجودة في بداية ونهاية المقياس. وبالتالي ، يبدو أن نماذج IRT أكثر تقدمًا من الناحية النظرية. كما توجد اختلافات في الاستخدام العملي لنظرية الاختبار الحديثة والنظرية الكلاسيكية (سيجستما ، 1992 ، ص 127-130). تعتبر نظرية الاختبار الحديثة أكثر تعقيدًا من نظرية الاختبار الكلاسيكية ، لذلك فهي أقل استخدامًا من قبل غير المتخصصين. علاوة على ذلك ، لدى IRT متطلبات خاصة للمهام. هذا يعني أنه يجب استبعاد العناصر من الاختبار إذا كانت لا تفي بمتطلبات النموذج. تنطبق هذه القاعدة أيضًا على تلك المهام التي كانت جزءًا من الاختبارات المستخدمة على نطاق واسع ، والتي تم إنشاؤها وفقًا لمبادئ النظرية الكلاسيكية. يصبح الاختبار أقصر وبالتالي أقل موثوقية.

يقدم IRT نماذج رياضية لدراسة ظواهر العالم الحقيقي. يجب أن تساعدنا النماذج في فهم الجوانب الرئيسية لهذه الظواهر. ومع ذلك ، هناك سؤال نظري أساسي هنا. يمكن النظر في النماذج


ضريبة القيمة المضافة كنهج لدراسة الواقع المعقد الذي نعيش فيه. لكن النموذج والواقع ليسا نفس الشيء. وفقًا لوجهة النظر المتشائمة ، من الممكن فقط نمذجة أنواع السلوك المعزولة (وليس الأكثر إثارة للاهتمام) فقط. يمكنك أيضًا أن تجد العبارة القائلة بأن الواقع لا يخضع للنمذجة على الإطلاق ، لأن لا يخضع فقط لقوانين السبب والنتيجة. في أحسن الأحوال ، من الممكن نمذجة الظواهر السلوكية الفردية (المثالية). هناك وجهة نظر أخرى أكثر تفاؤلاً لإمكانيات النمذجة. الموقف أعلاه يمنع إمكانية الفهم العميق لطبيعة ظواهر السلوك البشري. يطرح تطبيق هذا النموذج أو ذاك بعض الأسئلة الأساسية العامة. في رأينا ، ليس هناك شك في أن IRT مفهوم متفوق نظريًا وتقنيًا على نظرية الاختبار الكلاسيكية.

الغرض العملي من الاختبارات ، على أي أساس نظري يتم إنشاؤه ، هو تحديد معايير مهمة وإنشاء ، على أساسها ، خصائص بعض التركيبات النفسية. هل يتمتع نموذج IRT بمزايا في هذا الصدد أيضًا؟ من الممكن أن الاختبارات القائمة على هذا النموذج لا تقدم تنبؤًا أكثر دقة من الاختبارات القائمة على النظرية الكلاسيكية ، ومن الممكن ألا تكون مساهمتها في تطوير التركيبات النفسية أكثر أهمية. يفضل خبراء التشخيص المعايير ذات الصلة المباشرة بالفرد أو المؤسسة أو المجتمع. النموذج الأكثر تقدمًا علميًا "بحكم الواقع" * لا يحدد معيارًا أكثر ملاءمة وهو محدود إلى حد ما في شرح التركيبات العلمية. من الواضح أن تطوير الاختبارات على أساس النظرية الكلاسيكية سيستمر ، ولكن في نفس الوقت سيتم إنشاء نماذج IRT جديدة ، تمتد إلى دراسة عدد أكبر من الظواهر النفسية.

في النظرية الكلاسيكية للاختبارات ، يتم تمييز مفهومي "الموثوقية" و "الصلاحية". يجب أن تكون نتائج الاختبار موثوقة ، أي يجب أن تكون نتائج الاختبار الأولي وإعادة الاختبار متسقة. بجانب،

* بحكم الواقع(ورنيش) - بحد ذاته (ترجمة تقريبًا).

يجب أن تكون النتائج خالية (بقدر الإمكان) من أخطاء التقدير. وجود الصلاحية هو أحد متطلبات النتائج التي تم الحصول عليها. في هذه الحالة ، تعتبر الموثوقية شرطًا ضروريًا ، ولكنها ليست شرطًا كافيًا لصلاحية الاختبار.

تفترض الصلاحية أن النتائج التي تم الحصول عليها مرتبطة بشيء ذي أهمية عملية أو نظرية. يجب أن تكون الاستنتاجات المستخلصة من درجات الاختبار صالحة. غالبًا ما يتحدثون عن نوعين من الصلاحية: تنبؤي (معيار) وبناء. هناك أنواع أخرى من الصلاحية (انظر الفصل 3). بالإضافة إلى ذلك ، يمكن تحديد الصلاحية في حالة التجارب شبه (Cook & Campbell ، 1976 ، Cook & شاديش ، 1994). ومع ذلك ، فإن النوع الرئيسي للصلاحية لا يزال هو الصلاحية التنبؤية ، مما يعني القدرة على التنبؤ بشيء مهم حول السلوك في المستقبل من نتيجة الاختبار ، وكذلك إمكانية فهم أعمق لخاصية نفسية أو جودة معينة.

تتم مناقشة أنواع الصلاحية المقدمة في كل كتيب وتكون مصحوبة بأوصاف طرق تحليل صلاحية الاختبار. يعد تحليل العامل أكثر ملاءمة لتحديد التحقق من صحة البناء ، وتستخدم معادلات الانحدار الخطي لتحليل الصلاحية التنبؤية. يمكن توقع هذه الخصائص أو تلك (الأداء الأكاديمي ، فعالية العلاج) على أساس مؤشر واحد أو عدة مؤشرات ، يتم الحصول عليها من خلال العمل مع الاختبارات الفكرية أو الشخصية. تُستخدم تقنيات معالجة البيانات مثل الارتباط والانحدار وتحليل التباين وتحليل الارتباطات الجزئية والتباينات لتحديد الصلاحية التنبؤية للاختبار.

غالبًا ما يتم وصف صلاحية المحتوى أيضًا. من المفترض أن جميع مهام ومهام الاختبار يجب أن تنتمي إلى منطقة معينة (الخصائص العقلية ، والسلوك ، وما إلى ذلك). يميز مفهوم صلاحية المحتوى تطابق كل مهمة اختبار مع المنطقة المقاسة. يُنظر أحيانًا إلى صلاحية المحتوى على أنها جزء من المتانة أو "قابلية التعميم" (كرونباخ ، جليسر ، ناندا & راجاراتنام ، 1972). ومع ذلك ، مع


عند اختيار عناصر لاختبارات الإنجاز في مجال موضوع معين ، من المهم أيضًا الانتباه إلى القواعد الخاصة بتضمين العناصر في الاختبار.

في نظرية الاختبار الكلاسيكي ، تعتبر الموثوقية والصلاحية بشكل مستقل نسبيًا عن بعضهما البعض. ولكن هناك أيضًا فهم آخر للعلاقة بين هذه المفاهيم. تعتمد نظرية الاختبار الحديثة على تطبيق النماذج. يتم تقييم المعلمات ضمن نموذج معين. إذا كانت المهمة لا تفي بمتطلبات النموذج ، فعندئذ في إطار هذا النموذج يتم التعرف عليها على أنها غير صالحة. يعد التحقق من صحة الإنشاء جزءًا من التحقق من صحة النموذج نفسه. يشير هذا التحقق بشكل أساسي إلى التحقق من وجود سمة كامنة أحادية البعد قيد التحقيق بخصائص مقياس معروفة. يمكن استخدام درجات المقياس ، بالطبع ، لتحديد المعايير المناسبة ، ومن الممكن أن يكون ارتباطها بمؤشرات التركيبات الأخرى ممكنًا لجمع معلومات حول الصلاحية المتقاربة والمتباينة للبناء.

يعتبر التشخيص النفسي مشابهًا للغة ، ويوصف بالوحدة المكونة من أربعة مكونات ، ممثلة في ثلاثة مستويات. المكون الأول ، نظرية الاختبار ، يماثل بناء الجملة ، قواعد اللغة. تعد القواعد التوليدية ، من ناحية ، نموذجًا بارعًا ، ومن ناحية أخرى ، نظام يلتزم بالقواعد. بمساعدة هذه القواعد ، يتم بناء الجمل المعقدة على أساس جمل إيجابية بسيطة. ومع ذلك ، في الوقت نفسه ، يترك هذا النموذج جانبًا وصف كيفية تنظيم عملية الاتصال (ما يتم نقله وما يتم إدراكه) ، ولأي أغراض يتم تنفيذها. لفهم هذا ، مطلوب معرفة إضافية. يمكن قول الشيء نفسه عن نظرية الاختبارات: فهي ضرورية في التشخيص النفسي ، لكنها غير قادرة على تفسير ما يفعله الطبيب النفسي وما هي أهدافه.

1.3.2. النظريات النفسية والتراكيب النفسية

التشخيص النفسي هو دائمًا تشخيص لشيء محدد: الخصائص الشخصية ، والسلوك ، والتفكير ، والعواطف. الاختبارات مصممة لقياس الفروق الفردية. هناك عدة مفاهيم

الفروق الفردية ، لكل منها خصائصه المميزة. إذا تم الاعتراف بأن التشخيص النفسي لا يقتصر فقط على تقييم الفروق الفردية ، فإن النظريات الأخرى تكتسب أيضًا أهمية كبيرة للتشخيص النفسي. مثال على ذلك هو تقييم الاختلافات في عمليات النمو العقلي والاختلافات في البيئة الاجتماعية. على الرغم من أن تقييم الفروق الفردية ليس سمة لا غنى عنها للتشخيص النفسي ، إلا أن هناك تقاليد معينة للبحث في هذا المجال. بدأ التشخيص النفسي بتقييم الاختلافات في الذكاء. كانت المهمة الرئيسية للاختبارات هي "تحديد انتقال العبقري الموروث" (جالون) أو اختيار الأطفال للتدريب (بينيه ، سيمون). تلقى قياس حاصل الذكاء الفهم النظري والتطور العملي في أعمال سبيرمان (بريطانيا العظمى) وثورستون (الولايات المتحدة الأمريكية). قام Raymond B. Kettel بعمل مماثل لتقييم سمات الشخصية. يرتبط التشخيص النفسي ارتباطًا وثيقًا بالنظريات والأفكار حول الفروق الفردية في الإنجازات (تقييم الاحتمالات القصوى) وأشكال السلوك (مستوى الأداء النموذجي). هذا التقليد لا يزال ساري المفعول اليوم. في الكتب المدرسية عن التشخيص النفسي ، يتم تقييم الاختلافات في البيئة الاجتماعية في كثير من الأحيان بشكل أقل مقارنة مع مراعاة خصائص عمليات التنمية نفسها. لا يوجد تفسير معقول لهذا. من ناحية أخرى ، لا يقتصر التشخيص على نظريات ومفاهيم محددة. من ناحية أخرى ، يحتاج إلى نظريات ، حيث يتم تحديد المحتوى المشخص فيها (أي "ما" يتم تشخيصه). لذلك ، على سبيل المثال ، يمكن اعتبار الذكاء كخاصية عامة وكأساس للعديد من القدرات المستقلة. إذا حاول التشخيص النفسي "الابتعاد" عن نظرية أو أخرى ، فإن أفكار الفطرة السليمة تصبح أساس عملية التشخيص النفسي. في البحث ، يتم استخدام طرق مختلفة لتحليل البيانات ، ويحدد المنطق العام للبحث اختيار نموذج رياضي معين ويحدد بنية المفاهيم النفسية المستخدمة. مثل هذه الأساليب في الإحصاء الرياضي


ki ، حيث يفترض تحليل التباين وتحليل الانحدار وتحليل العوامل وحساب الارتباطات وجود تبعيات خطية. في حالة التطبيق غير الصحيح لهذه الأساليب ، فإنها "تجلب" هيكلها إلى البيانات المستلمة والتركيبات المستخدمة.

الأفكار حول الاختلافات في البيئة الاجتماعية وحول تطور الشخصية لم يكن لها أي تأثير تقريبًا على التشخيص النفسي. تنظر الكتب المدرسية (انظر ، على سبيل المثال ، Murphy & Davidshofer ، 1988) في النظرية الكلاسيكية للاختبارات وتناقش الطرق المناسبة للمعالجة الإحصائية ، وتصف الاختبارات المعروفة ، وتفكر في استخدام التشخيص النفسي في الممارسة: في علم النفس الإداري ، في اختيار الموظفين ، في تقييم الخصائص النفسية للإنسان ...

نظريات الفروق الفردية (وكذلك الأفكار حول الاختلافات بين البيئة الاجتماعية والنمو العقلي) تشبه دراسة دلالات اللغة. هذه هي دراسة الجوهر والمحتوى والمعنى. يتم تنظيم المعاني بطريقة معينة (مثل التركيبات النفسية) ، على سبيل المثال ، عن طريق التشابه أو التباين (القياس ، التقارب ، الاختلاف).

1.3.3. الاختبارات النفسية والأدوات المنهجية الأخرى

المكون الثالث للمخطط المقترح هو الاختبارات والإجراءات والأدوات المنهجية ، والتي يتم من خلالها جمع المعلومات حول خصائص الشخصية. يقدم Drene and Siitsma (1990 ، ص 31) التعريف التالي للاختبارات: "يعتبر الاختبار النفسي تصنيفًا وفقًا لنظام معين أو كإجراء قياس يجعل من الممكن إصدار حكم معين حول واحد أو أكثر من الناحية التجريبية. الخصائص المحددة أو المثبتة نظريًا لجانب معين من السلوك البشري (لإطار حالة الاختبار). في الوقت نفسه ، يتم النظر في استجابة المستجيبين لعدد معين من المحفزات المختارة بعناية ، وتتم مقارنة الإجابات المتلقاة مع معايير الاختبار ".

تتطلب عمليات التشخيص اختبارات وأساليب لجمع معلومات موثوقة ودقيقة وصالحة حول الميزات.

وسمات الشخص وتفكيره وعواطفه وسلوكه. بالإضافة إلى تطوير إجراءات الاختبار ، يتضمن هذا المكون أيضًا الأسئلة التالية: كيف يتم إنشاء الاختبارات ، وكيف يتم صياغة المهام واختيارها ، وكيف تستمر عملية الاختبار ، وما هي متطلبات ظروف الاختبار ، وكيف يتم أخذ أخطاء القياس في الاعتبار ، وكيف يتم حساب نتائج الاختبار وتفسيرها.

تتميز الاستراتيجيات العقلانية والتجريبية في عملية تصميم الاختبار. يبدأ تطبيق الإستراتيجية العقلانية بتعريف المفاهيم الأساسية (على سبيل المثال ، مفاهيم الذكاء والانبساط) ، ووفقًا لهذه الأفكار ، تتم صياغة مهام الاختبار. مثال على هذه الاستراتيجية هو مفهوم جوتمان لنظرية الوجوه (1957 ، 1968 ، 1978). أولاً ، يتم تحديد الجوانب المختلفة للبنى الأساسية ، ثم يتم تحديد المهام والمهام بطريقة يتم أخذ كل جانب من هذه الجوانب في الاعتبار. الاستراتيجية الثانية هي أن يتم اختيار المهام على أساس تجريبي. على سبيل المثال ، إذا حاول الباحث إنشاء اختبار للمصالح المهنية من شأنه أن يميز الأطباء عن المهندسين ، فيجب أن يكون الإجراء على هذا النحو. يجب أن تجيب كلتا المجموعتين من المستجيبين على جميع عناصر الاختبار ، ويتم تضمين العناصر الموجودة في الإجابات التي تم العثور على فروق ذات دلالة إحصائية بشأنها في الإصدار النهائي من الاختبار. على سبيل المثال ، إذا كانت هناك اختلافات بين المجموعات في الردود على عبارة "أحب الصيد" ، فإن هذه العبارة تصبح جزءًا من الاختبار. النقطة الأساسية في هذا الكتاب هي أن الاختبار مرتبط بالنظرية المفاهيمية أو التصنيفية التي تحدد هذه الخصائص.

عادة ما يتم تحديد الغرض من الاختبار في التعليمات الخاصة باستخدامه. يجب أن يكون الاختبار معياريًا بحيث يمكنه قياس الاختلافات بين الأشخاص وليس بين ظروف الاختبار. ومع ذلك ، هناك انحرافات عن التوحيد القياسي في الإجراءات التي تسمى اختبار الحدود واختبارات التعلم المحتملة. في هذه الظروف ، يتم مساعدة المستفتى في العملية


اختبار ثم تقييم تأثير هذا الإجراء على النتيجة. يعد تسجيل الإجابات على المهام موضوعيًا ، أي يتم إجراؤها وفقًا للإجراء القياسي. يتم أيضًا تحديد تفسير النتائج التي تم الحصول عليها بدقة ويتم تنفيذه على أساس معايير الاختبار.

يحتوي المكون الثالث للتشخيص النفسي - الاختبارات النفسية ، والأدوات ، والإجراءات - على مهام معينة ، وهي أصغر وحدات التشخيص النفسي ، وبهذا المعنى ، فإن المهام تشبه أصوات اللغة. عدد التوليفات الممكنة من الصوتيات محدود. فقط بعض الهياكل الصوتية يمكن أن تشكل كلمات وجمل توفر معلومات للمستمع. أيضا ومهام الاختبار: فقط في مجموعة معينة مع بعضها البعض يمكن أن تصبح وسيلة فعالة لتقييم البنية المقابلة.