Université d'État de l'imprimerie de Moscou. Détermination de la structure des tests. Développement de spécifications de test Spécification de test

Planification du contenu des tests

Objectifs d'apprentissage spécifiques

Objectifs d'apprentissage généralisés prévus par l'enseignant	Exemples d'objectifs d'apprentissage spécifiques atteints par l'étudiant
Connaissances au niveau de la mémorisation et de la reproduction	Connaît la signification des termes utilisés, les concepts et définitions de base, les formules, les lois, les principes
Connaissance au niveau de la compréhension	Comprend et interprète les termes, interprète les concepts et les définitions, convertit le matériel verbal en expressions mathématiques, interprète le matériel verbal en diagrammes et graphiques
Capacité à appliquer ses connaissances dans une situation connue	Capable d'appliquer des termes, des concepts et des définitions dans une situation familière à l'aide d'un modèle, ainsi que des formules, des lois et des principes dans une situation familière
Capacité à appliquer ses connaissances dans une situation inconnue	Utilise les lois et les principes dans des situations nouvelles, transfère les méthodes connues à des situations inconnues
Analyse	Voit les erreurs et les omissions dans la logique du raisonnement, corrige les énoncés de problèmes incomplets ou redondants, met en évidence les hypothèses cachées, fait la distinction entre les faits et les conséquences.

Une fois les objectifs des tests déterminés, le type de test sélectionné et les approches de création de tests clarifiées, les développeurs passent à l'étape suivante : sélection du contenu du test.

Puisque la fonction principale du test est contrôle du niveau des résultats scolaires dans certains domaines de connaissances, matières et disciplines, alors le test en tant qu'instrument de mesure doit être adéquat par rapport au matériau testé. Le contenu du test doit correspondre de manière optimale au contenu de la discipline académique. Pour réaliser cette correspondance, il faut analyser le contenu du sujet, de la section, du sujet, etc. testé, mettre en évidence les éléments les plus importants qui nécessitent des tests, déterminer quelles connaissances et compétences dans ce domaine de contenu seront testées à l'aide de tâches de test.

Sur la base de l'analyse du contenu de la discipline, un plan de test est ensuite élaboré. Le développeur doit déterminer le nombre de parties (sous-tests) du test, le nombre prévu de tâches et les formes de tâches de test qui seront utilisées.

Planifier un test implique de déterminer le ratio d'éléments de contenu et le nombre requis de tâches pour les tester, qui est déterminé par l'importance et le temps alloué à l'étude.

Une manière plus efficace de concevoir un test consiste à prendre en compte non seulement les éléments de contenu, mais également les activités testées. Parallèlement, les types d'activités, selon le niveau de maîtrise du matériel pédagogique, sont répartis en reproducteur(connaissance des définitions, des formules, des faits et utilisation des connaissances selon le modèle) et productif(application des connaissances dans une situation inconnue).

Chaque test doit être accompagné spécification, ceux. sa description, qui indique les finalités du test, à qui ce test est destiné, le contenu du test, le pourcentage de tâches dans les différentes sections et types d'activités, les formes de tâches utilisées, le temps de réalisation recommandé. La spécification du test est élaborée en tenant compte des documents réglementaires et des normes pédagogiques utilisées lors de la planification du contenu du test. La structure de test dans la spécification est présentée sous forme de tableau.

Note. Considérez des exemples de spécifications pour des disciplines spécifiques : histoire, mathématiques, informatique, etc.

Au cours du processus d'apprentissage, les étudiants peuvent se voir proposer des tâches aussi bien sous forme de tests que sous forme de tests (questions, tâches, exercices, etc.) comme test de connaissances.

Du point de vue du développeur, la tâche de test se présente comme une combinaison de forme et de contenu.

La forme est un moyen d'exister et d'exprimer un contenu dont la fonction principale est de transmettre le contenu de la tâche à tester aussi clairement et visuellement que possible.

La combinaison idéale de forme et de contenu donne lieu à une tâche de test de haute qualité, capable d’évaluer de manière adéquate les connaissances du sujet testé.

Cette tâche se caractérise par :

forme logique de déclaration;
brièveté du libellé;
forme de présentation optimale ;
avoir un endroit précis pour les réponses ;
adéquation de la disposition des éléments de tâche ;
des règles communes pour évaluer les réponses ;
adéquation des instructions à la forme et au contenu de la tâche.

Sur la base de leur forme, toutes les tâches de test connues dans la pratique peuvent être divisées en quatre groupes principaux : fermés, ouverts, séquentiels et par correspondance.

Formulaire fermé

Les tâches de cette forme sont également appelées tâches avec le choix d'une ou plusieurs conclusions correctes.

Se compose d'un énoncé de test incomplet et d'un ensemble de conclusions valides, dont une ou plusieurs sont correctes. Le candidat au test détermine les conclusions correctes à partir d’un ensemble donné. Lorsque ces (ou ces) conclusions sont substituées au jugement test, celui-ci devient complet et devient une déclaration vraie.

Sous une forme fermée, les réponses ne peuvent pas être toutes vraies ou toutes fausses.

Exemples:

Nouvelle page 1

Ouvrir le formulaire

Cela ressemble à une déclaration incomplète dans laquelle il manque un ou plusieurs éléments clés (chiffre, lettre, mot). La réponse est formulée par le candidat lui-même.

Exemples:

Nouvelle page 1

Formulaire de conformité

Il se compose de deux groupes d'éléments et d'une formulation claire du critère de choix d'une correspondance entre eux. La correspondance peut être un à un ou un à plusieurs. Ceci est déterminé par le nombre de connexions qui mappent un élément du premier groupe aux éléments du second. Afin de compliquer le choix de la réponse, la tâche de correspondance peut contenir des éléments supplémentaires (alternatifs) qui n'ont pas de lien correspondant.

Exemples:

Nouvelle page 1

1) Correspondance entre les auteurs et leurs œuvres		2) Correspondance entre les auteurs et leurs œuvres
U. Eco	Le nom de Rose	B. Akounine	Chariot de diamant
F. Nietzsche	Ainsi parlait Zarathoustra	B. Akounine	Amoureux de la mort
F. Dostoïevski	Idiot	Osho	Proximité
	Conscience	Osho	Conscience
	Guerre et Paix	F. Nietzsche	Ainsi parlait Zarathoustra
			Les misérables

Veuillez noter que dans cet exemple, la tâche 1 est une tâche de correspondance un-à-un avec deux éléments alternatifs (« Conscience », « Guerre et Paix »), et la tâche 2 est une « correspondance un-à-plusieurs » avec une alternative. élément - "Les Misérables."

nom du test;
algorithmes de test (méthode de sélection des tâches auprès de la banque) ;
restrictions de temps (absent, présent, fixées par le candidat) ;
informations spéciales (affichage de l'heure, réponses aux tâches) ;
méthodes d'évaluation de la réponse à une tâche ;
échelle de notation;
composition thématique de l'épreuve (unités didactiques testées).

Une spécification de test est une description de celui-ci qui comprend les informations nécessaires sur les buts, les objectifs, le plan et la structure du test, ainsi que les exigences de base concernant les règles de test, le traitement des résultats des tests et leur interprétation. Pour les tests critériés (CORT), l'élaboration d'un cahier des charges détaillé est très importante, puisque la sélection du contenu est l'étape la plus importante de sa création. Pour prendre une décision sur la réalisation d'un objectif d'apprentissage donné (par exemple, une norme de performance), il est nécessaire de décrire de manière suffisamment précise et complète toutes les composantes de cette norme et de l'exprimer dans un ensemble de tâches qui seraient représentatives de cet objectif.

Afin de s'assurer que tous les objectifs éducatifs importants seront inclus dans le test en cours d'élaboration, un tableau spécial est établi, appelé matrice technologique .

Le contenu des lignes de la matrice technologique sont des domaines, des sections, des sujets éducatifs, les colonnes de la matrice sont remplies en fonction du ratio des objectifs éducatifs des différents niveaux et de leur hiérarchie. Le nombre total de questions incluses dans l'éventail des tâches de test doit être réparti de manière à refléter leur importance - le « poids » de certaines actions mentales et leurs niveaux, ou le volume et la quantité de temps d'étude alloué à l'étude du matériel testé. Lors de l'élaboration d'une matrice pour tout sujet de test, le développeur doit s'assurer que l'ensemble du sujet est couvert par les questions proposées. Le contenu du sujet doit être entièrement « couvert » par la matrice sur tous les sujets. S'il existe des tests dans des matières académiques individuelles, il est alors nécessaire que toutes ses sections soient couvertes par des questions de test.

Par exemple, dans le test développé pour le suivi international de l'enseignement des mathématiques - T1M85, le test des acquis scolaires des élèves vise à la fois à évaluer la maîtrise d'éléments de contenu sélectionnés et à évaluer les types d'activités éducatives et cognitives que les élèves ayant suivi un cours de mathématiques en quatrième et quatrième années doivent démontrer la 8e année. En conséquence, les auteurs du test ont identifié des blocs de contenu qui reflètent la complexité spécifique des mathématiques étudiées dans ces tranches d'âge éducatives. Ainsi, par rapport à la 8e année, au niveau junior, beaucoup plus d'attention est accordée au thème « Les nombres ». En 8e année, l'algèbre et la géométrie sont des matières scolaires distinctes, elles sont donc désignées comme des unités de contenu distinctes. Parallèlement, en 4e année, un cours général de mathématiques est étudié, de sorte que le diagnostic des acquis scolaires des élèves de quatrième année se concentre sur les formes géométriques les plus simples et les mesures de leurs éléments, ainsi que sur les idées initiales sur les concepts algébriques ( par exemple, sur les séquences de nombres), qui sont incluses dans la rubrique « Nombres ». En 4e année, le sujet « Présentation des données » se concentre sur le diagnostic de la capacité à comprendre et à représenter des conditions simples et les relations initiales d'un problème, et les questions liées au thème « Probabilités » ne sont pas du tout abordées. Parallèlement, en 8e année, l'accent est mis sur l'évaluation de la capacité à interpréter des données et à maîtriser les premiers concepts de la théorie des probabilités, classés dans la section « Chances ».

Les types d'activités éducatives et cognitives sont les mêmes pour les 4e et 8e années, car elles reflètent des processus cognitifs caractéristiques lors de l'application des mathématiques dans diverses situations dans les écoles primaires et secondaires. Les auteurs du test ont inclus les connaissances, l'application et le raisonnement.

La première activité, la connaissance, se concentre sur la connaissance de l'étudiant des faits, concepts et procédures nécessaires. Contrairement aux exigences habituelles de l'école russe, seule connaissance des faits, dans « PMZB, ce type d'activité est associé à l'utilisation d'algorithmes et de méthodes standards dans des situations standard (par exemple, additionner deux fractions, diviser un nombre dans un nombre donné). ratio, résolution d’une équation linéaire standard).

La catégorie « connaissance » comprend la connaissance du langage mathématique et des faits et propriétés mathématiques qui constituent la base de la pensée mathématique. Plus un élève est capable de reproduire de connaissances, plus l'éventail de concepts qu'il possède est large, plus sa capacité potentielle à faire face à divers problèmes nécessitant l'utilisation des mathématiques est grande.

Les activités associées à la catégorie « connaissances » comprennent la reproduction, la reconnaissance, les calculs, l'extraction d'informations, l'utilisation d'appareils informatiques et d'instruments de mesure, la classification d'objets mathématiques (corps, figures géométriques).

La deuxième activité, l'application, se concentre sur la capacité des élèves à appliquer les concepts appris pour résoudre des problèmes et répondre à des questions impliquant des situations d'apprentissage familières ou légèrement modifiées.

Le troisième type d'activité - le raisonnement - va clairement au-delà de la résolution de problèmes standards et est associé à l'application de connaissances dans une situation inconnue, à la solution de problèmes complexes et en plusieurs étapes. Les caractéristiques de l'activité du groupe « application » en mathématiques peuvent être caractérisées comme le choix d'une méthode ou d'une stratégie productive pour résoudre un problème.

Le raisonnement implique une variété d’activités, dont chacune constitue un résultat d’apprentissage significatif et contribue au développement d’un style de pensée plus généralisé. Par exemple, le raisonnement implique la capacité d’observer, de tirer des conséquences logiques basées sur des hypothèses et des règles, et d’expliquer les résultats. Les tâches de raisonnement incluent des tâches de généralisation qui vous demandent d'élargir le champ d'application des résultats du raisonnement mathématique et de la résolution de problèmes en formulant les résultats en termes plus généraux. Par exemple, un problème est proposé dans lequel une séquence de nombres est donnée : 1, 4, 7, 10. Il est nécessaire de décrire mathématiquement sous forme de formules la relation entre chaque membre de la séquence et le membre qui le suit. Bonne réponse - P. + 3.

Le résultat d'une analyse détaillée du contenu et des types d'activités est un tableau reflétant les caractéristiques de la structure du test pour différents groupes éducatifs et d'âge (tableau 8.1).

Tableau 8.1. Répartition des tâches V tests de mathématiques TIMSS

Lors de l'élaboration d'un test, il est nécessaire de s'assurer que le contenu correspond aux formes de tâches de test utilisées, et également de prévoir la variété possible de ces formes. Il ne faut pas oublier que différentes formes de tâches sont adaptées à différents éléments du contenu testé. Pour les définitions complexes, vérifier la compréhension des éléments factuels - tâches avec réponses alternatives, pour la connaissance des dates - tâches pour restaurer la séquence. Pour la capacité de distinguer les organes ou leurs systèmes en anatomie, les composés chimiques en chimie, les phonèmes dans une langue maternelle ou étrangère, les styles architecturaux en histoire de l'art, des tâches d'identification sont utilisées.

Il convient également de prendre en compte le fait que lors de l'utilisation d'un test basé sur des tâches d'un type donné, il est possible que la capacité des étudiants à travailler avec cette forme particulière de tâches soit obtenue comme composante principale de la note finale. Les étudiants qui s'y adaptent plus rapidement, pour qui cette forme s'avère la plus familière, bénéficieront d'avantages significatifs. Cela peut être évité en utilisant différents types de tâches. Enfin, des tâches de différents types rendent les tests plus variés, du point de vue des sujets, ce qui permet de repousser le seuil d'apparition de la fatigue et, par conséquent, d'accorder plus de temps aux tests.

Un aspect important du test en cours de développement est l'approche d'évaluation de ses résultats. En règle générale, les questions du test sont notées de manière dichotomique : soit un point (vrai) ou zéro (faux). Cependant, certaines questions nécessitent un codage plus fractionnaire – polymétrique. Il est nécessaire de prendre en compte que la réponse à une question libre dans les tâches de type ouvert peut être incomplète, mais en même temps significative. Considérer une telle réponse comme incorrecte (avec un score nul) serait injuste. Par conséquent, pour évaluer les questions du test les plus difficiles, un modèle de notation partielle est utilisé, qui vous permet de différencier les réponses correctes complètes et incomplètes. Une réponse correcte et complète reçoit deux points, une réponse incomplète reçoit un point. Cette procédure d'évaluation est largement utilisée dans les tests de réussite et, à certains égards, elle est préférable car elle prend mieux en compte les informations contenues dans la réponse. Par exemple, déjà dans les tests TIMSS mentionnés ci-dessus, les explications suivantes sont données pour évaluer la performance des tâches mathématiques avec une réponse courte et complète.

Une réponse détaillée, valant deux points, est complète et correcte. La réponse démontre une compréhension complète des concepts mathématiques et (ou) des méthodes nécessaires pour résoudre le problème :

- la réponse montre que l'étudiant a pleinement accompli la tâche et a utilisé les bonnes méthodes mathématiques ;
- la réponse contient une explication ou une justification claire et complète et/ou une solution appropriée lorsque cela est requis.

Une réponse étendue valant un point est partiellement correcte. La réponse ne démontre qu'une compréhension partielle des concepts mathématiques et (ou) des méthodes nécessaires pour résoudre le problème, alors que :

- seules certaines conditions du problème sont correctement prises en compte, mais la solution est soit incomplète, soit contient des erreurs dans l'utilisation de certaines méthodes ou dans la compréhension des concepts ;
- la bonne réponse peut être donnée si l'explication ou la solution est incorrecte ou inappropriée, la solution et (ou) l'explication n'est pas donnée du tout, bien que les termes de la tâche l'exigent ;
- Il peut y avoir des erreurs dans la solution, mais des méthodes mathématiques appropriées sont utilisées.

Une réponse avec un score de zéro est complètement incorrecte, non pertinente ou incohérente.

Lors de l'évaluation de l'achèvement d'une tâche à réponse courte, des échelles à deux points plutôt qu'à trois points sont utilisées. Une réponse valant un point est correcte ; une réponse valant zéro point est complètement incorrecte, inappropriée ou incohérente. Une approche d’évaluation similaire a été mise en œuvre dans les tests PISA.

L’interprétation des résultats des tests de réussite ne devrait pas se limiter uniquement à l’enregistrement du niveau de connaissances ou de compétences mesuré. Il est important que les concepteurs et les utilisateurs de tests comprennent l'importance de certains résultats éducatifs pour les perspectives d'avenir (pas seulement éducatives), tant pour les étudiants eux-mêmes que pour la société dans laquelle ils vivront et travailleront.

Un exemple d'interprétation contextuelle des acquis scolaires (dans le cas de l'évaluation des compétences en lecture) sont les caractéristiques suivantes de groupes de lecteurs de différents niveaux identifiés par le test de compétences en lecture du programme PISA. Ainsi, les lecteurs ayant atteint le 6ème échelon du niveau le plus élevé sont considérés comme des lecteurs hautement compétents. Leur capacité à extraire de nouvelles informations d’un texte et à y réfléchir de manière critique est extrêmement précieuse pour la société moderne ; où le développement de la structure économique et sociale dépend de la capacité à s’améliorer et à prendre des décisions basées sur un compte rendu sensible de toutes les informations disponibles. Les lecteurs de la 5ème étape de ce niveau sont prêts à poursuivre leurs études et peuvent devenir parmi les professionnels de classe mondiale. Les lecteurs qui ont atteint le 4ème niveau d'un niveau élevé de maîtrise de la lecture ont démontré leur capacité à apprendre à l'aide de textes, acquérant non seulement des connaissances quotidiennes, mais également des connaissances formelles et spécialisées. Les lecteurs intermédiaires démontrent une forme rudimentaire de capacité à apprendre à partir de textes. Ils sont capables de naviguer dans de nouvelles situations quotidiennes à l’aide de textes. Les lecteurs qui n’ont pas atteint ce niveau peuvent rencontrer des difficultés dans les tâches quotidiennes (personnelles, sociales, professionnelles et éducatives) qui nécessitent un minimum de connaissances en lecture. Le niveau moyen de compétences en lecture est considéré comme « la condition seuil pour le fonctionnement réussi d'un adulte moderne dans la vie quotidienne. Deux autres niveaux inférieurs au seuil (1a et 16) sont identifiés, indiquant de graves problèmes dans la formation de la compétence en lecture ».

Au fur et à mesure que les éléments de test sont développés, les options pour leur évaluation et leur interprétation sont déterminées, une spécification est préparée, qui est une sorte de mission technique pour le texte. Il comprend une brève description du domaine de contenu que le test est destiné à étudier, des exemples de tâches, des signes de stimulus du critère et des réponses typiques que les sujets peuvent donner dans une situation de test.

Mayorov L.P. Théorie et pratique de la création de tests pour le système éducatif. Comment sélectionner, créer et utiliser des tests à des fins pédagogiques. M., 2000.
Approches conceptuelles pour évaluer les résultats scolaires en mathématiques et en sciences dans l'étude comparative internationale TIMSS / Kovaleva G. S. [et al.| M.. 2008. URL : hUp://enteroko.ru/public.htm
Tsukerman G.A. Alphabétisation en lecture des étudiants russes : matériel de discussion. M., 2010. URL : stratégie2020.rian.ni/load/366070484

spécification fonctionnelle produit, les exigences du produit sont la principale source qui détermine quels tests seront développés. Pour chaque exigence, un ou plusieurs tests sont rédigés, qui doivent ensemble vérifier le respect de cette exigence dans le produit.

Soit le fragment suivant d'un ensemble d'exigences pour le modèle d'échange de transactions :

La fonction DoTransaction doit accepter une adresse et des données conformément aux paramètres, créer un nouvel élément dans la file d'attente, remplir son adresse et une partie des champs de données avec les informations transférées et lancer une transaction
La fonction DoAddressTenure doit accepter une adresse conformément aux paramètres, créer un nouvel élément dans la file d'attente et remplir sa partie adresse
La fonction DoDataTenure doit recevoir des données conformément aux paramètres, trouver le premier élément de la file d'attente avec des champs de données partiellement vides, le compléter avec les informations transmises et lancer une transaction

Une description conceptuelle d'une suite de tests qui vérifie une spécification pourrait ressembler à ceci :

Appelez DoTransaction avec l'adresse et les données. Vérifiez qu'un autre élément apparaît dans la file d'attente. Vérifiez qu'une transaction avec l'adresse et les données correctes apparaît sur le bus.
Appelez DoAddressTenure avec l’adresse. Vérifiez qu'un autre élément apparaît dans la file d'attente. Vérifiez qu'il n'y a pas de nouvelle transaction dans le bus.
Appelez DoDataTenure avec des données. Vérifiez que les champs de données sont remplis. Vérifiez qu'une transaction avec l'adresse et les données correctes apparaît sur le bus

Scénarios de test

L'élaboration de tests basés sur l'utilisation de scénarios est réalisée selon la méthodologie suivante :

Un modèle d'utilisation est défini, incluant l'environnement d'exploitation du produit et les « acteurs ». Un acteur peut être un utilisateur, un autre produit, un matériel, etc., c'est-à-dire tout ce avec lequel le produit communique. La division en environnement et acteurs est arbitraire et sert à décrire les manières optimales d'utiliser le produit.
Des scénarios d'utilisation du produit sont en cours d'élaboration. La description du scénario, selon le produit et l'approche choisie, peut être strictement définie, paramétrée, ou autoriser un certain degré d'incertitude. Par exemple, la description des scripts dans le langage MSC permet de définir des scripts paramétrés avec la possibilité de réorganiser les événements.
Un ensemble de tests couvrant des scénarios spécifiés est développé. Compte tenu du degré d'incertitude inhérent au scénario, chaque test peut porter sur un scénario, plusieurs scénarios ou, à l'inverse, une partie du scénario.

L'utilisation de scripts ne nécessite pas de spécification formelle exigences, mais peut nécessiter plus de temps pour le développement et l’analyse.

Une autre fonctionnalité test de script est que cette méthode demande aux tests de tester des modèles d'utilisation spécifiques du produit, ce qui lui permet de détecter des défauts que la méthode de test des exigences pourrait manquer.

Un exemple d'utilisation de la spécification des exigences pour le développement de tests.

Ainsi, pour l'exemple discuté ci-dessus, il est possible de créer le script et les tests suivants.

Scénario : l'utilisateur dispose de deux threads de contrôle indépendants, l'un étant responsable de la génération de transactions complètes via DoTransaction et l'autre responsable de la collecte des transactions de la partie adresse et de la partie données lorsque ces informations proviennent de sources différentes. Ainsi, le deuxième thread utilise des appels à DoAddressTenure et DoDataTenure .
Description des tests : Appelez DoAddressTenure avec l'adresse A1, appelez DoTransaction avec l'adresse A2 et la donnée D2, appelez DoDataTenure avec la donnée D1. Vérifier l'apparition séquentielle de deux transactions sur le bus : (A1, D1) et (A2, D2)

Lors de la réalisation de ce test, il a notamment été découvert que la fonction DoTransaction était implémentée via des appels à DoAddressTenure et DoDataTenure, ce qui conduisait à l'apparition de transactions de la forme (A1, D2) et (A2, D1) sur le bus. Un tel défaut peut être difficile à détecter si les tests sont développés uniquement sur la base de la spécification des exigences.

Développement de tests manuels

La manière la plus courante de développer des tests consiste à créer le code de test manuellement. Il s'agit du moyen le plus flexible de développer des tests, mais la productivité typique des ingénieurs de test dans la création de code de test n'est pas beaucoup plus élevée que la vitesse de création du code de produit, et le volume de code de test dans la pratique dépasse souvent de 10 le volume de code de produit. fois. Compte tenu de ce fait, l’industrie moderne s’oriente de plus en plus vers des moyens plus intelligents d’obtenir du code de test, comme l’utilisation de codes de test spéciaux. langues (scripts) et génération de tests.

Génération de tests

Actuellement, certains langages de spécification utilisés pour décrire les algorithmes de test peuvent être utilisés pour générer du code de test. Envisageons de générer du code à partir du langage MSC. Le test décrit ci-dessus est formalisé dans le langage MSC (Fig. 9.3). Ici, chaque flèche intitulée DoTransaction , DoAddressTenure ou DoDataTenure représente un appel à la fonction produit correspondante transmettant des paramètres. La flèche checkTr correspond à vérifier si une transaction a bien transité par le bus avec les paramètres appropriés. Chacune des flèches du diagramme est convertie en code exécutable par le générateur de test, tandis que les flèches représentant les appels de fonction peuvent correspondre à une section de code assez simple et petite qui appelle la fonction correspondante et vérifie sa valeur de sortie pour les erreurs.

Riz. 9.3.

A noter que les flèches correspondant au contrôle des transactions peuvent, après génération, se transformer en un code assez complexe qui va attendre que la transaction apparaisse sur le bus pendant un timeout précisé lors de la génération, vérifier les phases de la transaction et comparer les valeurs de paramètres calculées avec les valeurs de référence spécifiées .Par est une construction formelle utilisée pour représenter le parallélisme dans le langage MSC. Lors de la génération de tests selon le diagramme Fig. 9.4, le générateur de tests énumère toutes les options possibles et non répétitives pour appeler les fonctions testées, tout en conservant l'ordre correct des tests, ce qui donne dans cet exemple trois tests générés. Il est facile de voir que le coût de création du diagramme Fig. 9.4 ne sont pas très différents des coûts du diagramme de la Fig. 9,3, tandis que le nombre de tests triple.

Ainsi, l'utilisation de la technique de génération de code de test à l'aide de diagrammes MSC formalisés peut augmenter considérablement la productivité des tests, ainsi que transformer la formalisation (codage) des scripts en une activité assez intelligente.

Avant de commencer à créer un test, vous devez savoir clairement à quoi il sert. Une réponse claire à cette question est une condition nécessaire au travail. La première étape serait donc formuler l’objectif du futur test. Après cela, vous devriez vous tourner vers le développement Caractéristiques prochain essai. Il est plus pratique de le faire sous la forme d'un tableau dans lequel horizontalement les zones de contenu, qui sont censés être mesurés, et verticalement - leur manifestations, ou la manière dont les zones de contenu peuvent se manifester.

Par exemple, lors de la construction du « questionnaire sur le statut du conjoint », J. Rust et S. Golombok (Rust, Golombok, 1988) se sont basés sur une enquête auprès d'experts, qui étaient des thérapeutes et conseillers familiaux, ainsi que sur des données reçues de clients de ces spécialistes. Il a été demandé aux experts de nommer les domaines de la relation entre un homme et une femme qu'ils considéraient comme les plus importants pour un mariage harmonieux. Les informations fournies par les clients ont permis d'identifier les domaines problématiques de la vie familiale dans lesquels les époux souhaiteraient apporter des changements. Sur cette base, des domaines de contenu tels que « les intérêts communs et le degré de dépendance - indépendance », « la communication verbale et non verbale », « la confiance et le respect », etc. ont été identifiés. , naturellement, facilite la construction d’une liste de ce qui doit être mesuré. Lors de la spécification des manifestations, il est important de veiller à distinguer les différentes formes de leur mise en œuvre. Ainsi, lors de la construction du questionnaire susmentionné, les « attitudes et sentiments manifestés dans les relations » ont été considérés comme des manifestations de « communications verbales et non verbales » entre époux.

Pour des raisons pratiques, 4 à 7 catégories sont généralement développées pour chaque axe. Un plus petit nombre de catégories aboutit souvent à un questionnaire trop restreint, tandis qu'un plus grand nombre peut rendre le processus de construction du questionnaire fastidieux. Le résultat est une sorte de réseau dont le nombre de cellules sera égal au nombre de paramètres prévus pour l'étude, multiplié par le nombre de leurs manifestations comportementales (tableau 3.1).

Dans la conception du questionnaire, une taille de grille de 16 à 25 mailles (par exemple, 4 x 4, 4 x 5, 5 x 4 ou 5 x 5) est généralement considérée comme idéale pour la longueur du test qu'il est possible de construire, de présenter et de traiter. .

Ensuite, vous devez déterminer combien de tâches, telles que des questions, doivent être créées pour chacune des cellules. Lors de la résolution de ce problème, il convient de se concentrer sur l'importance pour le chercheur de mesurer l'un des paramètres par rapport à un ou plusieurs autres. Dans le treillis donné dans le tableau. 3.2 (Rust, Golombok, 1989), on suppose que les zones de contenu désignées comme Ai V, devrait recevoir 40 % du poids, et AVEC Et D- dix% En même temps, chaque manifestation A, B, C Et D 25% du poids est attribué. Il faut faire attention au fait qu'en général, le pourcentage de poids de toutes les zones de contenu (horizontalement) et de toutes les manifestations (verticalement) doit être de 100 %. Cet arrangement de pourcentages de pondération vous indiquera quelle partie de toutes les tâches doit être créée pour chaque cellule. L’étape suivante consiste à décider combien d’éléments doivent être inclus dans le test. Dans ce cas, il est nécessaire de prendre en compte des facteurs tels que la taille de la grille et le temps prévu pour réaliser les tâches. Il est bien connu qu'en déterminant le nombre de tâches, le chercheur est confronté à un dilemme : assurer, d'une part, la fiabilité du test, ce qui nécessite une augmentation des tâches, et d'autre part, minimiser le nombre de tâches à effectuer. assurer le travail efficace du sujet avec eux, ce qui implique avant tout de maintenir sa concentration lors des examens. Ainsi, pour obtenir une fiabilité satisfaisante du questionnaire, au moins 20 tâches sont nécessaires, dont la réalisation ne prend généralement pas plus de 10 minutes. Enfin, les caractéristiques de la population censée être examinée jouent un rôle important dans la détermination du nombre d'éléments de test. En règle générale, dans une étude pilote menée par les développeurs, le nombre d'éléments de la version préliminaire du test doit être au moins 50 % supérieur à celui qui sera inclus dans la version finale.

Une fois que le poids en pourcentage de chaque cellule de la grille a été déterminé et que le nombre total d'éléments pour la version pilote du test a été établi, il est facile de calculer combien d'éléments doivent être développés pour chaque cellule. La grille ci-dessous (Rust, Golombok, 1989) contient le nombre de tâches pour chaque cellule nécessaires à une étude pilote utilisant un questionnaire composé de 80 questions (tableau 3.2).

Université d'État de l'imprimerie de Moscou. Détermination de la structure des tests. Développement de spécifications de test Spécification de test

Recette pas à pas pour faire des crêpes avec assaisonnement Comment faire des crêpes avec assaisonnement

Jambon de porc juteux cuit au four

Caractéristiques de la préparation d'une soupe à la purée de fromage épaisse française

Crise technologique. Classification des crises. Difficile à apprendre, facile à combattre

Comment distinguer la magie du village (5 photos) Rituels avec les forces de la magie de la nature

La magie des nombres Que signifie voir la fin du monde dans un rêve ?

Ai-je besoin d'un journal du caissier-opérateur pour une caisse enregistreuse en ligne ? La procédure de saisie dans le journal du caissier-opérateur ?