Étapes de la recherche statistique sociale. L'observation statistique est la première étape de la recherche statistique, qui est une collection scientifiquement organisée de données sur les phénomènes et processus étudiés de la vie sociale.

Étapes de la recherche statistique.

Étape 1: Observation statistique.

Étape 2: Consolidation et regroupement des résultats d'observation en groupes spécifiques.

Étape 3: Généralisation et analyse des matériaux obtenus. Révéler les relations et l'échelle des phénomènes, déterminer les modèles de leur développement, élaborer des estimations prévisionnelles. Il est important de disposer d'informations complètes et fiables sur l'objet étudié.

Au premier stade de la recherche statistique, des données statistiques primaires, ou informations statistiques initiales, sont formées, qui constituent la base du futur «bâtiment» statistique. Pour que le «bâtiment» soit solide, sain et de qualité, sa fondation doit l'être. Si, lors de la collecte des données statistiques primaires, une erreur a été commise ou si le matériel s’est avéré de mauvaise qualité, cela affectera l’exactitude et la fiabilité des conclusions tant théoriques que pratiques. Par conséquent, l'observation statistique de la phase initiale à la phase finale doit être soigneusement pensée et clairement organisée.

L'observation statistique fournit le matériel source pour la généralisation, dont le début est résumé... Si, lors de l'observation statistique, on obtient des informations sur chacune de ses unités qui la caractérisent de plusieurs côtés, alors ces résumés caractérisent l'ensemble de la population statistique et ses différentes parties. A ce stade, la population est divisée selon les caractéristiques des différences et combinée selon les caractéristiques de similitude, les indicateurs totaux sont calculés par groupes et en général. En utilisant la méthode de regroupement, les phénomènes étudiés sont divisés en types, groupes caractéristiques et sous-groupes les plus importants selon les caractéristiques essentielles. A l'aide de regroupements, les populations qualitativement homogènes sont limitées, ce qui est un préalable à la définition et à l'application d'indicateurs généralisés.

Au stade final de l'analyse, à l'aide d'indicateurs généralisants, les valeurs relatives et moyennes sont calculées, une évaluation de la variation des signes est donnée, la dynamique des phénomènes est caractérisée, des indices, des constructions d'équilibre sont utilisés, des indicateurs sont calculé qui caractérisent l'étroitesse des relations dans les signes changeants. Aux fins de la présentation la plus rationnelle et visuelle du matériel numérique, il est présenté sous forme de tableaux et de graphiques.

La valeur cognitive des statistiques la chose est:

1) les statistiques fournissent une couverture numérique et significative des phénomènes et processus à l'étude, constituent le moyen le plus fiable d'évaluer la réalité; 2) les statistiques donnent des preuves de conclusions économiques, vous permettent de vérifier divers énoncés «marchant», certaines positions théoriques; 3) les statistiques ont la capacité de révéler la relation entre les phénomènes, de montrer leur forme et leur force.

1. OBSERVATION STATISTIQUE

1.1. Concepts de base

Observation statistique - c'est la première étape de la recherche statistique, qui est une comptabilité scientifiquement organisée des faits caractérisant les phénomènes et processus de la vie sociale, et la collecte des données obtenues sur la base de cette comptabilité.

Cependant, toute collecte d'informations n'est pas une observation statistique. On ne peut parler d'observation statistique que lorsque les régularités statistiques sont étudiées, c'est-à-dire ceux qui se manifestent dans un processus de masse, dans un grand nombre d'unités d'une certaine sorte. Par conséquent, l'observation statistique doit être systématique, massif et systématique.

Planification L'observation statistique consiste en ce qu'elle est préparée et réalisée selon un plan élaboré, qui comprend des questions de méthodologie, d'organisation, de collecte d'informations, de contrôle de la qualité du matériel collecté, de sa fiabilité, de l'enregistrement des résultats finaux.

Masse la nature de l'observation statistique suppose qu'elle couvre un grand nombre de cas de manifestation de ce processus, suffisant pour obtenir des données véridiques caractérisant non seulement les unités individuelles, mais l'ensemble de la population.

Systématique l'observation statistique est déterminée par le fait qu'elle doit être effectuée soit systématiquement, soit en continu, soit régulièrement.

Les exigences suivantes sont imposées à l'observation statistique:

1) l'exhaustivité des données statistiques (exhaustivité de la couverture des unités de la population étudiée, aspects d'un phénomène particulier, ainsi que l'exhaustivité de la couverture dans le temps);

2) la fiabilité et l'exactitude des données;

3) leur uniformité et leur comparabilité.

Toute recherche statistique doit commencer par la formulation de ses buts et objectifs. Après cela, l'objet et l'unité d'observation sont déterminés, le programme est développé, le type et la méthode d'observation sont sélectionnés.

Objet d'observation - un ensemble de phénomènes et processus socio-économiques faisant l'objet de recherches, ou les limites exactes dans lesquelles les informations statistiques seront enregistrées . Par exemple, dans un recensement de la population, il est nécessaire d'établir quel type de population est soumis à l'enregistrement - en espèces, c'est-à-dire réellement situé dans une région donnée au moment du recensement, ou permanent, c'est-à-dire vivant dans une région donnée. zone en permanence. Lors de l'examen de l'industrie, il est nécessaire de déterminer quelles entreprises seront classées comme industrielles. Dans un certain nombre de cas, l'une ou l'autre qualification est utilisée pour restreindre l'objet d'observation. Cens - une caractéristique limite que toutes les unités de la population étudiée doivent satisfaire. Ainsi, par exemple, lors de la censure d'un équipement de production, il est nécessaire de déterminer ce qui doit être attribué à l'équipement de production, et à quoi les outils manuels, quel équipement est soumis au recensement - uniquement en fonctionnement ou en réparation, dans un entrepôt, réserve.

Unité d'observation est appelé une partie constitutive de l'objet d'observation, qui sert de base au récit et présente des caractéristiques susceptibles d'être enregistrées lors de l'observation.

Ainsi, par exemple, dans un recensement de la population, l'unité d'observation est chaque personne. Si la tâche consiste également à déterminer le nombre et la composition des ménages, l'unité d'observation avec une personne sera chaque ménage.

Programme d'observation est une liste de questions sur lesquelles des informations sont collectées, ou une liste de signes et d'indicateurs soumis à enregistrement . Le programme d'observation est élaboré sous la forme d'un formulaire (questionnaire, formulaire) dans lequel sont saisies les informations primaires. Un ajout nécessaire au formulaire est une instruction (ou des instructions sur les formulaires eux-mêmes), clarifiant le sens de la question. La composition et le contenu des questions du programme d'observation dépendent des objectifs de l'étude et des caractéristiques du phénomène social étudié.

Le traitement des données primaires collectées, y compris leur regroupement, généralisation et présentation sous forme de tableaux, constitue la deuxième étape de la recherche statistique, appelée résumé.

Il existe 3 formes principales de présentation des données statistiques traitées: texte, tabulaire et graphique.

Au troisième stade de l'étude statistique, sur la base des données finales du résumé, analyse scientifique des phénomènes étudiés: divers indicateurs généralisants sont calculés sous forme de valeurs moyennes et relatives, certains schémas de distribution, de dynamiques d'indicateurs, etc. sont mis en évidence sur la base des schémas révélés, des prévisions pour l'avenir sont faites.

L'observation statistique est la première étape de la recherche statistique. Presque toujours, conformément, bien entendu, aux buts et objectifs de l'étude, le travail commence par la prise en compte des faits et la collecte de matériel primaire. Le matériel primaire est le fondement de la recherche statistique. Le succès de toute l'étude dans son ensemble dépend de la qualité de l'observation statistique. Il doit être organisé de manière à obtenir des données objectives et précises sur le phénomène étudié. Des données incomplètes et inexactes qui caractérisent le processus pas assez bien, plus il est déformé, conduisent à des erreurs. Et l'analyse effectuée sur cette base sera erronée. Il s'ensuit que la comptabilité des faits et la collecte des éléments primaires doivent être soigneusement pensées et organisées.

Il faut noter une fois de plus que les observations statistiques sont toujours massives. La loi des grands nombres entre en vigueur - plus la population est grande, plus les résultats seront objectifs.

L'observation statistique comporte trois étapes: 1. Préparation de l'observation. Il s'agit de la formulation du programme d'observation, de la définition des indicateurs, regroupés dans les schémas des tableaux statistiques finaux.

Les questions qui composent le contenu du programme doivent découler de l'objet de la recherche ou de l'hypothèse, dont la confirmation est censée être consacrée à la recherche. La présentation des tableaux statistiques finaux est un élément important. Ils sont le projet pour le développement des résultats d'observation, et seulement s'ils sont disponibles, il est possible d'identifier tous les problèmes qui doivent être inclus dans le programme et d'éviter l'inclusion d'informations inutiles.

2. Collecte directe de matériel... C'est l'étape la plus longue de la recherche. Les rapports statistiques, en tant que forme spéciale d'organisation de la collecte de données, ne sont inhérents qu'aux statistiques nationales. Toutes les autres informations sont collectées via une variété d'outils statiques. Il est nécessaire de souligner deux exigences principales pour les données collectées: la fiabilité et la comparabilité. Et le plus souhaitable (dans les conditions du marché, il augmente plusieurs fois) est la rapidité.



3. Contrôle du matériau avant son analyse. Quelle que soit la précision avec laquelle les instruments d'observation sont élaborés, les interprètes sont instruits, le matériel d'observation doit toujours être contrôlé. Cela est dû à la nature massive des travaux statistiques et à la complexité de leur contenu.

L'objet de toute étude statistique est un ensemble d'unités du phénomène étudié. La cible peut être la population du recensement, les entreprises, les villes, le personnel de l'entreprise, etc. En un mot, l'objet d'observation est la population statistique étudiée. Il est également très important de définir les limites de la population étudiée, qui définissent clairement la population étudiée. Par exemple, si l'objectif est d'étudier les activités des petites entreprises dans la région, il convient de déterminer à quelle forme de propriété elle appartient (publique, privée, conjointe, etc.), selon quel critère les entreprises seront sélectionnées: caractéristiques de l'industrie, volume des ventes, temps écoulé depuis les inscriptions, état (actif, inactif, temporairement inactif), etc. L'ensemble doit être homogène, sinon des difficultés supplémentaires surgiront dans le processus d'analyse et des erreurs sont presque toujours inévitables.

Parallèlement à la définition de l'objet d'observation et des limites, il est important de définir l'unité de la population et l'unité d'observation. Une unité de population est un élément constitutif individuel d'une population statistique. Une unité d'observation est un phénomène, un objet dont les caractéristiques sont sujettes à enregistrement. L'ensemble des unités d'observation constitue l'objet d'observation. Par exemple, l'objectif est d'étudier l'influence de divers facteurs sur la productivité du travail des travailleurs des mines d'Ispat-Karmet OJSC. Dans ce cas - l'agrégat est défini par l'objectif lui-même - les mineurs travaillant dans les mines d'Ispat-Karmet, l'unité d'agrégat est le mineur, en tant que support d'information, et l'unité d'observation est la mine. En bref: l'unité de la population est ce qui est examiné, l'unité d'observation est la source d'information.
Pour réaliser une observation statistique, il est nécessaire de collecter des données selon un critère donné, à savoir: désigner une population statistique, qui est constituée d'objets matériellement existants, l'unité et la finalité d'une enquête ponctuelle de l'objet, établir un programme d'observation statistique.



Au premier stade, échantillon des données collectées selon les caractéristiques indiquées, les données sont triées par ordre croissant. Ensuite, vous devez établir un tableau de distribution de fréquence avec un remplissage séquentiel des colonnes correspondantes dans le tableau.

Dans un deuxième temps, pour traiter les données primaires collectées, il est nécessaire de regrouper et de généraliser les éléments sélectionnés selon un critère donné, pour désigner les caractéristiques numériques de l'échantillon. Cette étape de la recherche statistique s'appelle résumé... Le résumé est le traitement scientifique des données primaires afin d'obtenir des caractéristiques généralisées du phénomène à l'étude pour un certain nombre de caractéristiques essentielles, c'est-à-dire que les matériaux primaires sont rassemblés, forment des agrégats statistiques, qui sont caractérisés par les indicateurs de généralisation absolus finaux. Au stade du résumé, nous passons des caractéristiques des différentes caractéristiques individuelles des unités de la population - aux caractéristiques de la population entière dans son ensemble ou aux caractéristiques de leur manifestation générale dans la masse.

Devrait être trouvé balayerselon la formule:

R \u003d x (max) - x (min);

mode M (0), qui montre la valeur la plus courante, médian M (e), qui caractérise la valeur moyenne (elle ne dépasse pas la moitié des membres de la série) correspond à la variante se situant au milieu de la série de variations classées. La position de la médiane est déterminée par son nombre: Nme \u003d (n + 1) / 2, où n est le nombre d'unités dans l'agrégat et moyenne arithmétique pour le groupe désigné, qui est calculé par la formule:

Les résultats des travaux peuvent être présentés graphiquement sous la forme d'un histogramme et d'un polygone de distribution de fréquence.

Les données obtenues reflètent ce qui est commun à toutes les unités de la population étudiée. À la suite de l'observation statistique, des informations objectives, comparables et complètes devraient être obtenues, permettant aux étapes ultérieures de la recherche de fournir des conclusions scientifiquement fondées sur la nature et les modes de développement du phénomène étudié.

Tâche pratique

Réaliser une étude statistique pour connaître les informations environ hauteur 25 étudiants sélectionnés au hasard de l'Université polytechnique de Tomsk.

Faites un tableau de distribution de fréquence, trouvez la gamme, le mode, la médiane et la moyenne arithmétique de la taille (en cm) pour les garçons désignés.

2.1 Schéma de l'étude statistique

Les systèmes d'analyse de données statistiques sont un outil moderne et efficace pour la recherche statistique. Des systèmes d'analyse statistique spéciaux, ainsi que des outils universels - Excel, Matlab, Mathcad, etc. offrent de nombreuses possibilités de traitement des données statistiques.

Mais même l'outil le plus parfait ne peut remplacer un chercheur qui doit formuler le but de l'étude, collecter des données, choisir des méthodes, des approches, des modèles et des outils de traitement et d'analyse des données, et également interpréter les résultats obtenus.

La figure 2.1 montre un diagramme d'une étude statistique.

Figure 2.1 - Diagramme schématique d'une étude statistique

Le point de départ de la recherche statistique est la formulation du problème. Lors de sa détermination, l'objectif de l'étude est pris en compte, il est déterminé quelles informations sont nécessaires et comment elles seront utilisées lors de la prise de décision.

L'étude statistique proprement dite commence par une étape préparatoire. Pendant la phase préparatoire, les analystes examinent tâche technique - un document rédigé par le client de la recherche. Les termes de référence doivent clairement formuler les objectifs de la recherche:

    l'objet de la recherche a été déterminé;

    énumère les hypothèses et hypothèses qui devraient être confirmées ou réfutées au cours de l'étude;

    décrit comment les résultats de la recherche seront utilisés;

    le calendrier dans lequel l'étude doit être menée et le budget de l'étude.

Sur la base des termes de référence, un structure du rapport analytique - alors de n'importe quelle forme les résultats de l'étude doivent être présentés, et programme d'observation statistique... Le programme est une liste de caractéristiques qui sont sujettes à enregistrement dans le processus d'observation (ou des questions auxquelles des réponses fiables doivent être obtenues pour chaque unité d'observation enquêtée). Le contenu du programme est déterminé à la fois par les caractéristiques de l'objet observé et les objectifs de l'étude, et par les méthodes choisies par les analystes pour un traitement ultérieur des informations collectées.

L'étape principale de la recherche statistique comprend la collecte des données nécessaires et leur analyse.

La dernière étape de la recherche est la préparation d'un rapport d'analyse et sa mise à disposition du client.

En figue. 2.2 montre un diagramme d'analyse statistique des données.

Figure 2.2 - Les principales étapes de l'analyse statistique

2.2 Collecte d'informations statistiques

La collecte de matériel implique l'analyse de la tâche technique de l'étude, l'identification des sources des informations nécessaires et (si nécessaire) l'élaboration de questionnaires. Lors de la recherche de sources d'informations, toutes les données requises sont divisées en primaire(données qui ne sont pas disponibles et qui doivent être collectées directement pour cette étude), et secondaire (précédemment collectées à d'autres fins).

La collecte de données secondaires est souvent appelée recherche «documentaire» ou «bibliothèque».

Exemples de collecte de données primaires: observation des visiteurs du magasin, interrogation des patients hospitalisés, discussion d'un problème lors d'une réunion.

Les données secondaires sont divisées en données internes et externes.

Exemples de sources de données secondaires internes:

    système d'information d'une organisation (y compris un sous-système comptable, un sous-système de gestion des ventes, CRM (système CRM, abréviation de Customer Relationship Management) - logiciel d'application pour les organisations conçu pour automatiser les stratégies d'interaction avec les clients) et autres);

    études précédentes;

    rapports écrits des employés.

Exemples de sources de données secondaires externes:

    rapports des organismes statistiques et autres institutions publiques;

    rapports d'agences de marketing, d'associations professionnelles, etc.

    bases de données électroniques (répertoires d'adresses, SIG, etc.);

    bibliothèques;

    médias.

Les principaux extrants au stade de la collecte des données sont:

    taille d'échantillon prévue;

    structure de l'échantillon (disponibilité et taille des quotas);

    type d'observation statistique (collecte de données, enquête, interrogation, mesure, expérience, examen, etc.);

    des informations sur les paramètres de l'enquête (par exemple, la possibilité du fait de falsifier les questionnaires);

    schéma de codage des variables dans la base de données du programme sélectionné pour le traitement;

    plan de transformation des données;

    un diagramme schématique des procédures statistiques utilisées.

La même étape comprend la procédure du questionnaire elle-même. Bien entendu, les questionnaires ne sont développés que pour obtenir des informations primaires.

Les données reçues doivent être correctement éditées et préparées. Chaque questionnaire ou formulaire d'observation est vérifié et, si nécessaire, corrigé. Chaque réponse se voit attribuer des codes numériques ou alphabétiques - les informations sont codées. La préparation des données comprend l'édition, le décryptage et la validation des données, leur codage et leur conversion si nécessaire.

2.3 Détermination des caractéristiques de l'échantillon

En règle générale, les données recueillies à la suite de l'observation statistique pour l'analyse statistique sont un échantillon de population. La séquence de transformation des données en processus de recherche statistique peut être représentée schématiquement comme suit (Fig. 2.3)

Fig 2.3 Schéma de transformation des données statistiques

En analysant l'échantillon, on peut tirer des conclusions sur la population générale représentée par l'échantillon.

Détermination finale des paramètres généraux d'échantillonnage produit lorsque tous les questionnaires sont collectés. Il comprend:

    détermination du nombre réel de répondants,

    détermination de la structure de l'échantillon,

    répartition par lieu d'enquête,

    établir le niveau de confiance de la fiabilité statistique de l'échantillon,

    calcul de l'erreur statistique et détermination de la représentativité de l'échantillon.

Nombre réel les répondants peuvent être plus ou moins que prévu. La première option est meilleure pour l'analyse, mais pas rentable pour le client de l'étude. Le second peut affecter négativement la qualité de la recherche et, par conséquent, est désavantageux pour les analystes et les clients.

Exemple de structure peut être aléatoire ou non (les répondants ont été sélectionnés sur la base d'un critère prédéterminé, par exemple en citant). Les échantillons aléatoires sont a priori représentatifs. Les échantillons non aléatoires peuvent être intentionnellement non représentatifs de la population générale, mais fournissent des informations importantes pour la recherche. Dans ce cas, vous devez également examiner attentivement les questions de filtrage du questionnaire, qui sont spécifiquement conçues pour éliminer les répondants qui ne répondent pas aux exigences.

Pour déterminer la précision de l'estimationtout d'abord, il est nécessaire d'établir le niveau de confiance (95% ou 99%). Puis le maximum erreur statistique l'échantillon est calculé comme

ou
,

- taille de l'échantillon, - la probabilité de survenue de l'événement à l'étude (le répondant est inclus dans l'échantillon), - la probabilité d'un événement inverse (non-inclusion du répondant dans l'échantillon), - coefficient de confiance,
- variance de la fonction.

Le tableau 2.4 présente les valeurs de confiance et les coefficients de confiance les plus couramment utilisés.

Tableau 2.4

2.5 Traitement des données sur un ordinateur

L'analyse des données assistée par ordinateur implique un certain nombre d'étapes nécessaires.

1. Détermination de la structure des données sources.

2. Saisie des données dans un ordinateur conformément à leur structure et aux exigences du programme. Edition et transformation des données.

3. Définition de la méthode de traitement des données conformément aux objectifs de la recherche.

4. Obtention du résultat du traitement des données. Son édition et sa sauvegarde au format souhaité.

5. Interprétation du résultat du traitement.

Les étapes 1 (préparatoire) et 5 (finale) ne peuvent être exécutées par aucun programme informatique - le chercheur les fait lui-même. Les étapes 2 à 4 sont effectuées par le chercheur utilisant le programme, mais c'est le chercheur qui détermine les procédures nécessaires pour l'édition et la transformation des données, les méthodes de traitement des données, ainsi que le format de présentation des résultats du traitement. L'ordinateur aide (étapes 2 à 4) à passer d'une longue séquence de nombres à une plus compacte. A «l'entrée» de l'ordinateur, le chercheur soumet un tableau de données initiales, inaccessibles à la compréhension, mais adaptées au traitement informatique (étape 2). Ensuite, le chercheur donne au programme une commande pour traiter les données conformément à la tâche et à la structure des données (étape 3). À la "sortie", il reçoit le résultat du traitement (étape 4) - également un tableau de données, seulement plus petit, accessible à la compréhension et à l'interprétation significative. Dans le même temps, une analyse exhaustive des données nécessite généralement des traitements multiples utilisant différentes méthodes.

2.6 Choix d'une stratégie d'analyse des données

Le choix d'une stratégie d'analyse des données collectées est basé sur la connaissance des aspects théoriques et pratiques du domaine étudié, les spécificités et caractéristiques connues de l'information, les propriétés de méthodes statistiques spécifiques, ainsi que l'expérience et les points de vue du chercheur.

Il ne faut pas oublier que l'analyse des données n'est pas le but ultime de la recherche. Son but est d'obtenir des informations qui aideront à résoudre un problème spécifique et à prendre des décisions de gestion adéquates. Le choix d'une stratégie d'analyse doit commencer par examiner les résultats des étapes précédentes du processus: définir le problème et élaborer un plan de recherche. Un plan d'analyse préliminaire des données est utilisé comme «ébauche», développé comme l'un des éléments du plan d'étude. Ensuite, à mesure que des informations supplémentaires arrivent à des étapes ultérieures du processus de recherche, il peut être nécessaire d'apporter certains changements.

Les méthodes statistiques sont divisées en une et plusieurs dimensions. Les méthodes unidimensionnelles (univariatetechniques) sont utilisées lorsque tous les éléments de l'échantillon sont évalués par un indicateur, ou s'il existe plusieurs indicateurs pour chaque élément, mais que chaque variable est analysée séparément de toutes les autres.

Les techniques multivariées sont idéales pour l'analyse des données lorsque deux ou plusieurs mesures sont utilisées pour estimer chaque élément de l'échantillon et que ces variables sont analysées simultanément. De telles méthodes sont utilisées pour déterminer les dépendances entre les phénomènes.

Les méthodes multivariées diffèrent des méthodes univariées principalement en ce que, lorsqu'elles sont utilisées, l'attention se déplace des niveaux (moyennes) et des distributions (variances) des phénomènes et se concentre sur le degré de relation (corrélation ou covariance) entre ces phénomènes.

Les méthodes unidimensionnelles peuvent être classées selon que les données sont analysées métriques ou non métriques (Figure 3). Les données métriques sont mesurées sur une échelle d'intervalle ou une échelle relative. Les données non métriques sont évaluées sur une échelle nominale ou ordinale

De plus, ces méthodes sont divisées en classes en fonction du nombre d'échantillons - un, deux ou plus - analysés au cours de la recherche.

La classification des méthodes statistiques unidimensionnelles est illustrée à la figure 2.4.

Chiffre: 2.4 Classification des méthodes statistiques univariées en fonction des données analysées

Le nombre d'échantillons est déterminé par la manière dont les données sont traitées pour une analyse particulière, et non par la manière dont les données ont été collectées. Par exemple, les données pour les hommes et les femmes peuvent être obtenues dans le même échantillon, mais si l'analyse vise à identifier des différences de perception basées sur la différence entre les sexes, le chercheur devra opérer sur deux échantillons différents. Les échantillons sont considérés comme indépendants s'ils ne sont pas liés expérimentalement. Les mesures effectuées dans un échantillon n'affectent pas les valeurs des variables dans un autre. Aux fins d'analyse, les données relatives à différents groupes de répondants, comme celles recueillies auprès d'hommes et de femmes, sont généralement traitées comme des échantillons indépendants.

En revanche, si les données de deux échantillons se réfèrent au même groupe de répondants, les échantillons sont considérés comme combinés par paires - en fonction.

S'il n'y a qu'un seul échantillon de données métriques, les tests z et t peuvent être utilisés. S'il y a deux échantillons indépendants ou plus, dans le premier cas, vous pouvez utiliser les tests z et t pour deux échantillons, dans le second - la méthode d'analyse unidirectionnelle de la variance. Le test t apparié est utilisé pour deux échantillons liés. Lorsqu'il s'agit de données non métriques pour un échantillon, le chercheur peut utiliser les critères de distribution de fréquence, chi-carré, test de Kolmogorov-Smirnov (K ~ S), test en série et test binomial. Pour deux échantillons indépendants avec des données non métriques, vous pouvez recourir aux méthodes d'analyse suivantes: chi-carré, Mann-Whitney, médiane, K-S, ANOVA unidirectionnelle de Kruskal-Wallis (K-Y). En revanche, s'il y a deux ou plusieurs échantillons interdépendants, les tests de signe de McNemar et Wilcoxon doivent être utilisés.

Les méthodes statistiques multivariées visent à identifier des modèles existants: l'interdépendance des variables, la relation ou la séquence d'événements, la similitude interobjets.

Plutôt conditionnellement, on peut distinguer cinq types standards de modèles, dont l'étude présente un intérêt significatif: association, séquence, classification, clustering et prévision.

Une association se produit lorsque plusieurs événements sont liés les uns aux autres. Par exemple, une étude dans un supermarché pourrait montrer que 65% de ceux qui achètent des chips de maïs achètent également du Coca-Cola, et 85% du temps ils obtiennent un Coca s'il y a une réduction. Avec la connaissance d'une telle association, il est facile pour les gestionnaires d'évaluer l'efficacité de la remise offerte.

S'il y a une chaîne d'événements liés dans le temps, alors on parle d'une séquence. Par exemple, après l'achat d'une maison, dans 45% des cas, un nouveau poêle est acheté dans un délai d'un mois, et dans les deux semaines, 60% des nouveaux colons acquièrent un réfrigérateur.

A l'aide de la classification, on identifie des signes qui caractérisent le groupe auquel appartient tel ou tel objet. Cela se fait en analysant des objets déjà classifiés et en formulant un ensemble de règles.

Le regroupement diffère de la classification en ce que les groupes eux-mêmes ne sont pas prédéfinis. À l'aide du regroupement, divers groupes homogènes de données sont distingués.

Tous les types de systèmes de prévision reposent sur des informations historiques stockées sous forme de séries chronologiques. S'il est possible de trouver des modèles qui reflètent adéquatement la dynamique du comportement des indicateurs cibles, il est probable qu'ils puissent être utilisés pour prédire le comportement du système à l'avenir.

Les méthodes statistiques multivariées peuvent être classées en analyse de relations et analyse de classification (figure 2.5).

Figure 2.5 - Classification des méthodes statistiques multivariées

Recherche statistique est une collecte, un résumé et une analyse scientifiquement organisés de données (faits) sur les phénomènes et processus socio-économiques, démographiques et autres de la vie publique dans l'État, organisés selon un programme unique, avec l'enregistrement de leurs caractéristiques les plus significatives dans la comptabilité Documentation.

Les caractéristiques distinctives (spécificité) de la recherche statistique sont: la finalité, l'organisation, le caractère de masse, la cohérence (complexité), la comparabilité, la documentation, la contrôlabilité, l'aspect pratique.

La recherche statistique comprend trois étapes principales:

1) Collecte d'informations statistiques primaires (observation statistique) - observation, collecte de données sur les valeurs de l'attribut étudié des unités du conseil d'état, kt est le fondement de la future analyse statistique. Si, lors de la collecte de données statistiques primaires, une erreur a été commise ou si le matériel s'est avéré de mauvaise qualité, cela affectera l'exactitude et la fiabilité des conclusions tant théoriques que pratiques.

2) synthèse statistique et traitement des informations primaires - les données sont systématisées et regroupées. Les résultats du regroupement statistique et des résumés sont présentés sous forme de tableaux stat-x, qui est la forme la plus rationnelle, systématique, compacte et visuelle de présentation de données de masse.

3) généralisation et interprétation des informations statistiques - analyse des informations statistiques.

Toutes ces étapes sont interconnectées, l'absence de l'une d'entre elles entraîne une rupture de l'intégrité de l'étude statistique.

Étapes de la recherche statistique

1 fixation d'objectifs

2.Définir l'objet d'observation

3.Définir les unités d'observation

4. Élaboration d'un programme de recherche

5. Rédaction des instructions pour remplir le formulaire

6. Résumé et regroupement des données (brève analyse)

Concepts et catégories de base de la science statistique.

1. Population statistique Est un ensemble de phénomènes qui ont une ou plusieurs caractéristiques communes et diffèrent les uns des autres par les valeurs des autres caractéristiques. Tels sont, par exemple, un ensemble de ménages, un ensemble de familles, un ensemble d'entreprises, d'entreprises, d'associations, etc.

2. Signe - cette propriété, caractéristique du phénomène, faisant l'objet d'une étude statistique

3. Indicateur statistique - Il s'agit d'une caractéristique quantitative généralisante des phénomènes et processus socio-économiques dans leur détermination qualitative dans un lieu et un temps spécifiques. Les indicateurs statistiques peuvent être divisés en deux types principaux: les indicateurs comptables et estimés (tailles, volumes, niveaux du phénomène étudié) et les indicateurs analytiques (valeurs relatives et moyennes, indicateurs de variation, etc.).

4. Unité de sov-ti- c'est chacun sujet à une étude statistique.

5. Variation - C'est la variabilité de la valeur de l'attribut en unités individuelles du même phénomène.

6. Régularité - appelé la fréquence et l'ordre de changement des phénomènes.

Les principales étapes de l'observation statistique.

Observation de St-quelque chose Est une collection scientifiquement fondée de données sur le phénomène socio-économique de la vie publique.

Étapes CH:

1. Préparation à l'observation statistique - implique l'utilisation de la méthode d'observation de masse, qui n'est rien de plus que la collecte d'informations statistiques primaires. (solution de problèmes scientifiques, méthodologiques, organisationnels et techniques).

2. Résumé et regroupement des statistiques de données primaires - les informations collectées sont généralisées et diffusées en utilisant la méthode des groupements statistiques d'une certaine manière. travail inclus, commence par l'envoi des questionnaires, questionnaires, formulaires, formulaires de rapport statistique et se termine par leur soumission après avoir rempli les autorités chargées de l'observation.

3. Analyse des informations statistiques - en utilisant la méthode de généralisation des indicateurs, l'analyse des statistiques est effectuée.

4. Élaboration de propositions pour améliorer le SN - les raisons qui ont conduit au remplissage incorrect des formulaires statistiques sont analysées et des propositions d'amélioration de l'observation sont développées.

Obtenir des informations au cours de CT SN nécessite beaucoup de temps et de travail financier. (sondages d'opinion)

Regroupement de données statistiques.

En groupant - C'est la division de Sov-ti en groupes selon des caractéristiques essentielles.

Raisons du regroupement: l'originalité de l'objet de l'étude statistique.

En utilisant la méthode de regroupement, le problème suivant est résolu: répartition des types et phénomènes d'économie sociale; étudier la structure du phénomène et les changements structurels qui s'y produisent; identifier les connexions et les relations entre les phénomènes.

Ces tâches sont en cours de résolution à l'aide de groupements typologiques, structurels et analytiques.

Groupe typologique - identification des types de phénomènes socio-économiques (groupe d'entreprises industrielles par propriété)

Groupe structurel - étude de la structure et des changements structurels. Avec l'aide de ces groupes, on peut étudier les éléments suivants: notre composition par sexe, âge, lieu de résidence, etc.

Groupe analytique - identification de la relation entre les signes.

Étapes de construction du SG:

1. sélection d'un attribut de regroupement

2. détermination du nombre requis de groupes dans lesquels il est nécessaire de briser la constellation étudiée

3. définir les limites des intervalles gr-ki

4. L'établissement de chaque groupe d'indicateurs ou de leur système, kt doit être caractérisé par les groupes sélectionnés.

Systèmes de regroupement.

Système de regroupement est une série de regroupements statistiques interconnectés selon les caractéristiques les plus essentielles, reflétant globalement les aspects les plus importants du phénomène étudié.

Groupe typologique - c'est la division de la communauté qualitativement hétérogène étudiée en classes, types socio-économiques (groupe d'entreprises industrielles par propriété)

Groupe structurel - caractérise la composition d'un conseil homogène selon certaines caractéristiques. Avec l'aide de ces groupes, on peut étudier les éléments suivants: notre composition par sexe, âge, lieu de résidence, etc.

Groupe analytique - utilisé dans l'étude des relations entre signes, l'un des TC est factoriel (affecte le changement de performance), l'autre est efficace (signes qui changent sous l'influence de facteurs).

Construction et types de séries de distribution.

Plage de distribution statistique - Il s'agit d'une distribution ordonnée des unités de scoop en groupes selon une certaine caractéristique variable.

Distinguer: rad attributif et variationnel de distribution.

Attributif- ce sont des r.r., construits selon des caractéristiques qualitatives. R. R. il est d'usage de les dresser sous forme de tableaux. Elles caractérisent la composition des Soviets selon des caractéristiques existantes, prises sur plusieurs périodes, ces données nous permettent d'étudier le changement de structure.

Variationnel - ce sont r.r., construits sur une base quantitative. Toute série de variations se compose de 2 éléments: les options et les fréquences.

Variantes les valeurs individuelles de l'attribut sont considérées, qu'il prend dans la série de variations, c'est-à-dire la signification spécifique de l'attribut variable.

Les fréquences - il s'agit du nombre d'options individuelles ou de chaque groupe de la série de variations, c'est-à-dire ce sont des chiffres indiquant la fréquence à laquelle certaines options se trouvent dans la rivière.

Gamme variationnelle:

1. discret - caractérise la répartition des unités sociales selon une base discrète (répartition des familles par le nombre de pièces dans les appartements individuels).

2. intervalle - le signe est présenté comme un intervalle; il est conseillé, tout d'abord, avec une variation continue de la fonction.

La rivière la plus pratique est la rivière. analyser à l'aide de leur image graphique, ce qui permet de juger de la forme de la distribution. Le polygone et l'histogramme donnent une idée claire du caractère du changement des fréquences de la série de variations, il y a une ogive et un cumulatif.

Tableaux statistiques.

ST Est une forme rationnelle et répandue de présentation des données statistiques.

Le tableau est la forme la plus rationnelle, visuelle et compacte de présentation du matériel statistique.

Techniques de base qui déterminent la technique de formation d'un tracé CT:

1. T doit être compact et ne contenir que les données initiales qui reflètent directement le phénomène socio-économique étudié dans le st-ke.

2. L'en-tête du tableau et les noms des colonnes et des lignes doivent être clairs et concis.

3. les informations se trouvent dans les colonnes (colonnes) du tableau, complétées par une ligne de résumé.

5. Il est utile de numéroter les cases et les lignes, etc.

Selon le contenu logique, les ST sont une "phrase statistique", basée sur les éléments du sujet et du prédicat.

Sujet nom de l'objet, caractérisé par des nombres. ce mb un ou plusieurs hiboux, issus d'unités de hiboux.

Prédicat ST sont des indicateurs qui caractérisent l'objet d'étude, c'est-à-dire sujet du tableau. Les prévisions sont les en-têtes supérieurs et l'état du contenu du graphique de gauche à droite.

9 Le concept de valeur absolue en statistique .

Stat Pock-li Est une variable qualitativement définie qui caractérise quantitativement l'objet de recherche ou ses propriétés.

UN V. - Il s'agit d'un indicateur généralisant caractérisant la taille, l'échelle ou le volume d'un phénomène dans des conditions de lieu et de temps spécifiques.

Méthodes d'expression: unités naturelles (c.-à-d. pièces, quantité); mesure du travail (travail. Bp, laborieux); expression de valeur

Méthodes d'obtention: enregistrement des faits, synthèse et regroupement, calcul selon une méthodologie spécifique (PIB, notations, etc.)

Types AB: 1. AB individuel - caractériser les éléments individuels des phénomènes généraux 2. AB total - indicateurs har-t pour une combinaison d'objets.

Le changement absolu (/ _ \\) est la différence entre 2 AB.

Pour se faire une idée d'un phénomène particulier, pour tirer des conclusions, il est nécessaire de mener une étude statistique. Le sujet de la recherche statistique en soins de santé et en médecine peut être la santé de la population, l'organisation des soins médicaux, diverses sections des activités des institutions médicales et préventives, les facteurs environnementaux qui affectent l'état de santé.

La séquence méthodologique de réalisation d'une étude statistique comprend certaines étapes.

Étape 1. Élaboration d'un plan et d'un programme de recherche.

Étape 2. Collecte de matériel (observation statistique).

Étape 3. Développement de matériel, regroupement statistique et résumé

Étape 4. Analyse statistique du phénomène étudié, formulation de conclusions.

Étape 5. Traitement littéraire et présentation des résultats obtenus.

Une fois l'étude statistique terminée, des recommandations et des décisions de gestion sont élaborées, les résultats de l'étude sont mis en pratique et l'efficacité est évaluée.

Lors de la réalisation d'une étude statistique, l'élément le plus important est le respect d'une séquence stricte dans la mise en œuvre de ces étapes.

Premier pas la recherche statistique - l'élaboration d'un plan et d'un programme - est préparatoire, elle détermine le but et les objectifs de la recherche, élabore un plan et un programme de recherche, élabore un programme de synthèse du matériel statistique et résout les problèmes d'organisation.

Lorsqu'on entreprend une étude statistique, il faut formuler avec précision et clarté le but et les objectifs de l'étude et étudier la littérature sur ce sujet.

L'objectif détermine la direction principale de la recherche et est, en règle générale, non seulement théorique, mais aussi pratique. Le but est formulé clairement, clairement, sans ambiguïté.

Pour révéler l'objectif fixé, des tâches de recherche sont déterminées.

Un point important de la phase préparatoire est l'élaboration d'un plan d'organisation. Le plan d'organisation de la recherche prévoit la détermination du lieu (limites administratives-territoriales d'observation), du temps (termes spécifiques d'observation, de développement et d'analyse du matériel) et du sujet de la recherche (organisateurs, interprètes, méthodologiques et leadership organisationnel, sources de financement de la recherche).

PLet n rechercheovet niyacomprend:

Détermination de l'objet de recherche (population statistique);

Volume d'étude (continu, non continu);

Types (actuels, uniques);

Méthodes de collecte d'informations statistiques. Programme de recherchecomprend:

Définition de l'unité d'observation;

La liste des questions (signes comptables) à enregistrer par rapport à chaque unité d'observation *

Développement d'un formulaire individuel de comptabilité (enregistrement) avec une liste de problèmes et signes à prendre en compte;

Développement de mises en page de tableaux, dans lesquels les résultats de la recherche sont ensuite saisis.

Pour chaque unité d'observation, un formulaire séparé est rempli, il contient la partie passeport, des questions de programme clairement formulées posées dans un certain ordre et la date de remplissage du document.

Les formulaires d'inscription utilisés dans la pratique des institutions médicales peuvent être utilisés comme formulaires d'inscription.

Les sources d'information peuvent être d'autres documents médicaux (antécédents de cas et fiches individuelles d'un patient ambulatoire, antécédents de développement de l'enfant, antécédents de naissance), formulaires de déclaration des établissements médicaux, etc.

Pour garantir la possibilité de développement statistique des données à partir de ces documents, les informations sont copiées sur des formulaires comptables spécialement développés, dont le contenu est déterminé dans chaque cas individuel en fonction des objectifs de la recherche.

Actuellement, dans le cadre du traitement informatique des résultats d'observation à l'aide d'un ordinateur, les questions de programme peuvent être formalisées , lorsque des questions dans le document comptable sont posées en alternative (oui, non) , ou des réponses toutes faites sont proposées, parmi lesquelles vous devez choisir une réponse spécifique.

Lors de la première étape de l'étude statistique, parallèlement au programme d'observation, des programmes * sont compilés pour un résumé des données obtenues, qui comprend l'établissement de principes de regroupement, l'attribution de signes de regroupement , détermination des combinaisons de ces caractéristiques, préparation de mises en page de tableaux statistiques.

Seconde phase - collecte de matériel statistique (observation statistique) - consiste en l'enregistrement des cas individuels du phénomène à l'étude et des caractéristiques d'enregistrement les caractérisant dans les formulaires d'enregistrement. Avant et pendant l'exécution de ces travaux, des instructions (orales ou écrites) sont données aux observateurs, leur fournissant des formulaires d'inscription.

Avec le temps, l'observation statistique peut être courante et ponctuelle.

Lorsque obs courantyu deniale phénomène est étudié pendant un certain temps (semaine, trimestre , année, etc.) par enregistrement quotidien du phénomène au fur et à mesure de chaque cas. Le nombre de naissances est un exemple de suivi permanent , mort, malade , sortie de l'hôpital, etc. Cela prend en compte des phénomènes en évolution rapide.

Lorsque obs uniqueyu deniales statistiques sont collectées à un certain moment (critique). Les observations ponctuelles sont: recensement de la population, étude du développement physique des enfants, enregistrement des lits d'hôpitaux pour chevaux de l'année, certification des institutions médicales, etc. Ce type comprend les examens préventifs de la population. Un enregistrement unique reflète l'état du phénomène au moment de l'étude. Ce type d'observation permet d'étudier des phénomènes à évolution lente.

Le choix du type d'observation dans le temps est déterminé par le but et les objectifs de l'étude. Par exemple, les caractéristiques des patients hospitalisés peuvent être obtenues à la suite de l'enregistrement actuel de ceux qui ont quitté l'hôpital (observation actuelle) ou au moyen d'un recensement d'une journée des patients hospitalisés (observation ponctuelle).

En fonction de l'exhaustivité de la couverture du phénomène étudié, une distinction est faite entre recherche continue et non continue.

Lorsque continul'étude examine toutes les unités d'observation incluses dans la population, c'est-à-dire population générale. Une étude continue est menée afin d'établir la taille absolue du phénomène, par exemple, la population totale, le nombre total de naissances ou de décès, le nombre total de patients atteints de telle ou telle maladie, etc. La méthode continue est aussi utilisé dans les cas où des informations sont nécessaires pour le travail opérationnel (comptabilisation des maladies infectieuses, charge de médecins, etc.)

Lorsque discontinul'étude n'examine qu'une partie de la population générale. Il se subdivise en plusieurs types: questionnaire, monographique, tableau principal, sélectif. La méthode la plus courante dans la recherche médicale est la méthode sélective.

Méthode monographique - donne une description détaillée des unités individuelles de la caractéristique globale à tous égards et une description approfondie et complète des objets.

Méthode du tableau principal - implique l'étude des objets dans lesquels se concentre la grande majorité des unités d'observation. L'inconvénient de cette méthode est qu'une partie de la population reste découverte par l'étude, bien qu'elle soit de petite taille, mais qui peut différer considérablement du tableau principal.

Méthode du questionnaire est la collecte de données statistiques à l'aide de questionnaires spécialement conçus adressés à un cercle spécifique de personnes. Cette recherche est basée sur le principe du volontariat, donc le retour des questionnaires est souvent incomplet. Souvent, les réponses aux questions posées portent l'empreinte de la subjectivité et du hasard. Cette méthode permet d'obtenir une description approximative du phénomène étudié.

Méthode sélective - se résume à l'étude d'une partie spécialement sélectionnée des unités d'observation pour caractériser l'ensemble de la population générale. L'avantage de cette méthode est que les résultats sont obtenus avec un haut degré de fiabilité, ainsi qu'un coût nettement inférieur. L'étude emploie moins d'interprètes , de plus, cela prend moins de temps.

Dans les statistiques médicales, le rôle et la place de la méthode d'échantillonnage sont particulièrement importants, car le personnel médical ne s'occupe généralement que d'une partie du phénomène étudié: ils étudient un groupe de patients atteints d'une maladie particulière, analysent le travail de chaque service et institutions , évaluer la qualité de certains événements, etc.

Selon le mode d'obtention des informations au cours de l'observation statistique et la nature de sa mise en œuvre, on distingue plusieurs types:

1) observation directe(examen clinique des patients , laboratoire , recherche instrumentale , mesures anthropométriques, etc.)

2) méthodes sociologiques: méthode d'entretien (enquête en face à face), interrogation (enquête par correspondance - anonyme ou non), etc.

3) recherche documentaireet nia(copie d'informations issues de la comptabilité et des rapports médicaux, informations issues des statistiques officielles des institutions et organisations.)

Troisième étape - regroupement et résumé du matériel - commence par vérifier et clarifier le nombre d'observations , l'exhaustivité et l'exactitude des informations reçues , identification et élimination des erreurs, des enregistrements en double, etc.

Pour le bon développement du matériel, le cryptage des documents comptables primaires est utilisé , celles. désignation de chaque élément et de son groupe par un signe - alphabétique ou numérique. Le cryptage est une technique , faciliter et accélérer le développement des matériaux , augmenter la qualité, la précision du développement. Les chiffrements - désignations conventionnelles - sont générés de manière arbitraire. Lors du cryptage des diagnostics, il est recommandé d'utiliser la nomenclature internationale et la classification des maladies; lors du cryptage des professions - un vocabulaire des professions.

L'avantage du chiffrement est que, si nécessaire, après la fin du développement principal, vous pouvez revenir au matériel pour le développement afin de découvrir de nouvelles relations et dépendances. Les identifiants cryptés facilitent et accélèrent les choses , que non chiffré. Après vérification, les caractéristiques sont regroupées.

Regroupement- démembrement de l'ensemble des données étudiées en homogène , groupes typiques selon les caractéristiques les plus essentielles. Le regroupement peut être effectué selon des critères qualitatifs et quantitatifs. Le choix d'un attribut de regroupement dépend de la nature de la population étudiée et des objectifs de l'étude.

Le regroupement typologique est fait selon des caractéristiques qualitatives (descriptives, attributives), par exemple par sexe , profession, groupes de la maladie, gravité de l'évolution de la maladie, complications postopératoires, etc.

Le regroupement par caractéristiques quantitatives (de variation) est effectué sur la base des dimensions numériques de la caractéristique , par exemple , par âge , la durée de la maladie, la durée du traitement, etc. Le regroupement quantitatif nécessite une solution au problème de la taille de l'intervalle de regroupement: l'intervalle peut être égal, et dans certains cas - inégal, même inclure les groupes dits ouverts.

par exemple , lorsqu'ils sont regroupés par âge, des groupes ouverts peuvent être définis: jusqu'à 1 an . 50 ans et plus.

Lors de la détermination du nombre de groupes, on part du but et des objectifs de l'étude. Il est nécessaire que les groupements puissent révéler les schémas du phénomène étudié. Un grand nombre de groupes peut entraîner un écrasement excessif du matériau, des détails inutiles. Un petit nombre de groupes a tendance à brouiller les caractéristiques.

Après avoir terminé le regroupement du matériel, ils procèdent au résumé.

DE vodka- généralisation de cas isolés , obtenus à la suite de recherches statistiques, dans certains groupes, leur comptage et leur entrée dans des mises en page de tableaux.

Un résumé du matériel statistique est réalisé à l'aide de tableaux statistiques. Table , pas rempli de chiffres , appelé une mise en page.

Les tableaux statistiques sont bruns , chronologique, territorial.

Une table a un sujet et un prédicat. Le sujet statistique est généralement placé dans des lignes horizontales sur le côté gauche du tableau et reflète la caractéristique principale principale. Le prédicat statistique est placé de gauche à droite dans des colonnes verticales et reflète des signes comptables supplémentaires.

Les tableaux statistiques sont divisés en simples , groupe et combinaison.

DANS tableaux simplesla distribution numérique du matériau selon une caractéristique est présentée , ses éléments constitutifs (tableau 1). Un tableau simple contient généralement une simple liste ou un résumé de l'ensemble du phénomène étudié.

Tableau 1

Répartition des décès à l'hôpital N. par âge

DANS tables de groupeprésente une combinaison de deux caractéristiques en relation l'une avec l'autre (tableau 2).

Tableau 2

Répartition des décès à l'hôpital de N. par sexe et âge

DANS combineuret qià propos de ces tableauxla répartition du matériau selon au moins trois signes interdépendants est donnée (tableau 3).

Tableau 3

Répartition des décès à l'hôpital de N. avec différentes maladies par âge et sexe

Diagnostic de la maladie sous-jacente Âge
0-14 15-19 20-39 40-59 60 et\u003e Total
m F m F m F m F m F m F m + f
Maladies du système circulatoire. - - - -
Blessures et empoisonnements - - -
Malignités. néoplasmes. - - - - - -
D'autres zab. - - - -
Tous malades. - -

Lors de la compilation de tableaux, certaines conditions doivent être remplies:

Chaque tableau doit avoir un titre qui reflète son contenu;

Dans le tableau, toutes les colonnes doivent également avoir des noms courts clairs;

Lors du remplissage du tableau, toutes les cellules du tableau doivent contenir les données numériques correspondantes. Les cellules du tableau qui restent vides en raison de l'absence de cette combinaison sont barrées ("-"), et en l'absence d'informations dans la cellule, "n.s." ou "...";

Après avoir rempli le tableau dans la ligne horizontale inférieure et dans la dernière colonne verticale à droite, les colonnes verticales et les lignes horizontales sont additionnées.

Les tableaux doivent avoir une seule numérotation séquentielle.

Pour les études avec un petit nombre d'observations, le résumé est fait manuellement. Tous les documents comptables sont divisés en groupes conformément au chiffrement de l'attribut. En outre, le calcul et l'enregistrement des données sont effectués dans la cellule correspondante du tableau.

À l'heure actuelle, les ordinateurs sont largement utilisés pour trier et résumer le matériel. . qui permettent non seulement de trier le matériau selon les caractéristiques étudiées , mais effectuer des calculs d'indicateurs.

Quatrième étape - l'analyse statistique - est une étape cruciale de l'étude. A ce stade, des indicateurs statistiques sont calculés (fréquences , les structures , tailles moyennes du phénomène étudié), leur représentation graphique est donnée , la dynamique de , tendances, des liens sont établis entre les phénomènes . des prévisions sont données, etc. L'analyse implique l'interprétation des données obtenues, l'évaluation de la fiabilité des résultats de la recherche. En conclusion, des conclusions sont tirées.

Cinquième étape - le traitement littéraire est définitif. Il s'agit de la finalisation des résultats d'une étude statistique. Les résultats peuvent être présentés sous forme d'article, rapport, rapport , dissertations, etc. Pour chaque type d'inscription, certaines exigences , ce qui doit être observé dans le traitement littéraire des résultats d'une étude statistique.

Les résultats de la recherche médicale et statistique sont introduits dans la pratique des soins de santé. Diverses options d'utilisation des résultats de la recherche sont possibles: familiarisation avec les résultats d'un large public de travailleurs médicaux et scientifiques; préparation de documents pédagogiques et méthodologiques; enregistrement des propositions de rationalisation et autres.

VALEURS STATISTIQUES

Pour l'analyse comparative des données statistiques, des valeurs statistiques sont utilisées: absolues , relatif , moyen.

Valeurs absolues

Les valeurs absolues obtenues dans les tableaux de synthèse au cours d'une étude statistique reflètent la taille absolue du phénomène (le nombre d'établissements médicaux, le nombre de lits d'hôpitaux, la population , nombre de décès, de naissances, de maladies, etc.). Un certain nombre d'études statistiques sont complétées par l'obtention de valeurs absolues. Dans certains cas, ils peuvent être utilisés pour analyser le phénomène étudié. , par exemple , lors de l'étude de phénomènes rares , si nécessaire, connaître la taille absolue exacte du phénomène , si nécessaire, prêter attention aux cas individuels du phénomène étudié, etc. Avec un petit nombre d'observations , dans le cas où il n'est pas nécessaire de déterminer le modèle , des nombres absolus peuvent également être utilisés.

Dans la plupart des cas, les valeurs absolues ne peuvent pas être utilisées pour la comparaison avec les données d'autres études. Pour cela, les valeurs relatives et moyennes sont utilisées.

Valeurs relatives

Valeurs relatives (indicateurs , coefficients) sont obtenus en raison du rapport d'une valeur absolue à une autre. Les indicateurs les plus couramment utilisés sont: intensifs , étendue, ratios , clarté.

Intensif - indicateurs de fréquence , intensité, prévalence du phénomène dans l'environnement , produisant ce phénomène. Dans les soins de santé, la morbidité est étudiée , mortalité , handicap, fécondité et autres indicateurs de santé publique. Mercredi , dans lequel les processus ont lieu, est la population dans son ensemble ou ses groupes individuels (âge, sexe, social , professionnel, etc.). Dans la recherche médicale et statistique, un phénomène est, pour ainsi dire, un produit de l'environnement. par exemple , population (environnement) et malade (phénomène); malade (mercredi) et décédé (phénomène), etc.

La taille de la base est sélectionnée en fonction de la valeur de l'indicateur - pour 100, 1000, 10000, 100000, en fonction de cela, l'indicateur est exprimé en pourcentage , ppm , prodecimille, prosantimille.

L'indicateur intensif est calculé comme suit: par exemple, en Iran en 1995. 67283 mille habitants ont vécu, au cours de l'année 380200 personnes sont mortes.

Les indicateurs intensifs peuvent être généraux et spécifiques.

Des indicateurs intensifs généraux caractérisent le phénomène dans son ensemble . par exemple , taux de fécondité généraux , mortalité, morbidité, calculées pour l'ensemble de la population du territoire administratif.

Des indicateurs intensifs spéciaux (groupe par groupe) sont utilisés pour caractériser la fréquence du phénomène dans différents groupes (incidence par sexe, âge , mortalité des enfants de moins de 1 an , létalité pour les formes nosologiques individuelles, etc.).

Des indicateurs intensifs sont utilisés: pour déterminer le niveau . la fréquence , la prévalence du phénomène; comparer la fréquence d'un événement dans deux populations différentes; enseigner les changements de fréquence du phénomène en dynamique.

Extensif- des indicateurs du poids spécifique, de la structure, caractérisent la répartition du phénomène en ses éléments constitutifs, sa structure interne. Les indicateurs extensifs sont calculés par le rapport de la partie du phénomène à l'ensemble et sont exprimés en pourcentage ou en fraction d'unité.

Le calcul de l'indicateur extensif se fait comme suit: par exemple, en Grèce, en 1997, il y avait 719 hôpitaux, dont 214 hôpitaux généraux.

Des indicateurs étendus sont utilisés pour déterminer la structure d'un phénomène et évaluer comparativement le rapport de ses éléments constitutifs. Les indicateurs extensifs sont toujours interconnectés, car leur somme est toujours égale à 100 pour cent: par exemple, lors de l'étude de la structure de la morbidité, le poids spécifique d'une maladie individuelle peut augmenter avec sa croissance réelle; au même niveau, si le nombre d'autres maladies a diminué; avec une diminution du nombre de cette maladie , si la diminution du nombre d'autres maladies se produit à un rythme plus rapide.

La relation- représentent le rapport de deux indépendants, indépendants l'un de l'autre , quantités qualitativement différentes. Les indicateurs du ratio comprennent des indicateurs de mise à disposition de la population en médecins, paramédicaux, lits d'hôpitaux, etc.

Le ratio est calculé comme suit: par exemple, au Liban, avec une population de 3 789 000 habitants, 3 941 médecins travaillaient dans des établissements médicaux en 1996.

Visibilité- sont utilisés dans le but d'une comparaison plus visuelle et accessible des valeurs statistiques. Les indicateurs de visibilité constituent un moyen pratique de convertir des valeurs absolues, relatives ou moyennes en un formulaire facile à comparer. Lors du calcul de ces indicateurs, l'une des valeurs comparées est égale à 100 (ou 1), et les valeurs restantes sont recalculées en fonction de ce nombre.

Le calcul des indicateurs de visibilité est le suivant: par exemple, la population de Jordanie était: en 1994. - 4275 mille personnes, en 1995. - 4440 mille personnes , en 1996 - 5439 mille personnes.

Indicateur de visibilité: 1994 -100%;

1995 = 4460 *100 = 103.9%;
1996 = 5439*100 = 127.2%

Les indicateurs de visibilité indiquent de combien de pour cent ou combien de fois il y a eu augmentation ou diminution des valeurs comparées. Les indicateurs de visibilité sont le plus souvent utilisés pour comparer les données dans le temps. , présenter les schémas du phénomène étudié sous une forme plus visuelle.

Certaines erreurs peuvent être commises lors de l'utilisation de valeurs relatives. Voici les plus courants:

1. Parfois, il est jugé sur le changement de la fréquence du phénomène sur la base d'indicateurs extensifs qui caractérisent la structure du phénomène, et non son intensité.

3. Lors du calcul des indicateurs spéciaux, le dénominateur doit être choisi correctement pour le calcul de l'indicateur: par exemple , le taux de mortalité postopératoire doit être calculé par rapport à la , pas tous les malades.

4. Lors de l'analyse des indicateurs, le facteur temps doit être pris en compte:

il est impossible de comparer des indicateurs calculés pour différentes périodes de temps: par exemple, le taux d'incidence pour un an et pour un semestre , ce qui peut conduire à des jugements erronés. 5. Il est impossible de comparer entre eux les indicateurs intensifs généraux, calculés à partir de populations de composition hétérogène, car l'hétérogénéité de la composition de l'environnement peut affecter la valeur de l'indicateur.

Valeurs moyennes

Les valeurs moyennes donnent une caractéristique généralisante de la population statistique pour une certaine caractéristique quantitative changeante.

La valeur moyenne caractérise l'ensemble de la série d'observations avec un nombre, qui exprime la mesure générale du trait étudié. Il nivelle les écarts aléatoires des observations individuelles et donne une caractéristique typique d'un trait quantitatif.

L'une des exigences lorsque l'on travaille avec des moyennes est l'homogénéité qualitative de la population pour laquelle la moyenne est calculée. Ce n'est qu'alors qu'il reflètera objectivement les traits caractéristiques du phénomène étudié. La deuxième exigence est que la valeur moyenne n'exprime la taille typique du trait que lorsqu'elle est basée sur une généralisation de masse du trait à l'étude, c'est-à-dire calculé sur un nombre suffisant d'observations.

Les valeurs moyennes sont obtenues à partir de séries de distribution (séries de variations).

Série de variation- un certain nombre de grandeurs statistiques homogènes caractérisant le même élément comptable quantitatif, différant les unes des autres en taille et disposées dans un certain ordre (décroissant ou croissant).

Les éléments de la série de variations sont:

Option- v est la valeur numérique du trait quantitatif changeant étudié.

La fréquence - p (pars) ou f (fréquence) - la répétabilité d'une variante dans une série de variations, indiquant la fréquence à laquelle l'une ou l'autre variante apparaît dans une série donnée.

Nombre total d'observations- n (numerus) - la somme de toutes les fréquences: n \u003d ΣΡ. Si le nombre total d'observations est supérieur à 30, l'échantillon statistique est considéré comme grand, si n est inférieur ou égal à 30, il est considéré comme petit.

Les séries variationnelles sont discontinues (discrètes), constituées d'entiers, et continues, lorsque les valeurs de la variante sont exprimées en nombres fractionnaires. Dans les lignes discontinues, les options adjacentes diffèrent les unes des autres par un entier, par exemple: le nombre de battements cardiaques, le nombre de respirations par minute, le nombre de jours de traitement, etc. Dans les séries continues, les variantes peuvent différer de toutes les valeurs unitaires fractionnaires. Les séries variationnelles sont de trois types. Plaine- une ligne dans laquelle chaque option apparaît une fois, c'est-à-dire les fréquences sont égales à un.

À PROPOS DE haussier- une ligne dans laquelle les variantes se produisent plus d'une fois.

Sgruppirovet nny- rangée. dans lequel les variantes sont combinées en groupes en fonction de leur valeur dans un certain intervalle, indiquant la fréquence de répétition de toutes les variantes incluses dans le groupe.

La série de variations groupées est utilisée avec un grand nombre d'observations et une gamme malade de valeurs extrêmes de la variante.

Le traitement de la série de variations consiste à obtenir les paramètres de la série de variations (valeur moyenne, écart type et erreur moyenne de la valeur moyenne).

Types de moyennes.

Dans la pratique médicale, les valeurs moyennes suivantes sont le plus souvent utilisées: mode, médiane, moyenne arithmétique. D'autres moyennes sont moins utilisées: moyenne géométrique (lors du traitement des résultats de titrage des anticorps, des toxines, des vaccins); racine carrée moyenne (lors de la détermination du diamètre moyen d'une section de cellules, les résultats des tests immunologiques cutanés); cubique moyen (pour déterminer le volume moyen des tumeurs) et autres.

Mode(Mo) - la valeur du trait, qui se trouve plus souvent dans l'agrégat. Le mode est considéré comme la variante, qui correspond au plus grand nombre de fréquences de la série de variations.

Médian(Me) - la valeur de l'entité qui occupe la valeur médiane dans la série de variations. Il divise la série de variations en deux parties égales.

L'amplitude du mode et de la médiane n'est pas influencée par les valeurs numériques des variantes extrêmes disponibles dans la série de variations. Ils ne caractérisent pas toujours avec précision la série de variations et sont relativement rarement utilisés dans les statistiques médicales. La moyenne arithmétique caractérise plus précisément la série de variations.

DE arithmétique moyenne(M, ou) - est calculé sur la base de toutes les valeurs numériques du trait étudié.

Dans une série de variations simples, où les options ne sont trouvées qu'une seule fois, la moyenne arithmétique simple est calculée à l'aide de la formule:

Où V est les valeurs numériques de l'option,

n est le nombre d'observations,

Σ - signe somme

Dans les séries de variations habituelles, la moyenne arithmétique pondérée est calculée par la formule:

Où V est les valeurs numériques de la variante.

Ρ - option de fréquence d'occurrence.

n est le nombre d'observations.

S - signe somme

Un exemple de calcul de la moyenne arithmétique pondérée est présenté dans le tableau 4.

Tableau 4

Détermination de la durée moyenne de traitement des patients dans un service spécialisé de l'hôpital

Dans cet exemple, le mod est la variante de 20 jours, car il est répété plus souvent que d'autres - 29 fois. Mo \u003d 20. Le nombre ordinal de la médiane est déterminé par la formule:

La place de la médiane tombe sur la 48e option, dont la valeur numérique est 20. La moyenne arithmétique, calculée par la formule, est également 20.

Les moyennes sont des caractéristiques généralisantes importantes d'une population. Cependant, ils masquent les valeurs des caractéristiques individuelles. Les valeurs moyennes ne montrent pas la variabilité, la variabilité du trait.

Si la série de variations est plus compacte, moins dispersée et que toutes les valeurs individuelles sont situées autour de la moyenne, alors la moyenne donne une caractérisation plus précise de la population donnée. Si la série de variations est étirée, les valeurs individuelles s'écartent considérablement de la moyenne, c'est-à-dire il y a une grande variabilité du trait quantitatif, alors la moyenne est moins typique, pire reflète toute la série en général.

Des moyennes de même ampleur peuvent être obtenues à partir de séries avec des degrés de diffusion variables. Par exemple, la durée moyenne de traitement des patients dans un service spécialisé d'un hôpital sera également de 20 si les 95 patients étaient hospitalisés pendant 20 jours. Les deux moyennes calculées sont égales l'une à l'autre, mais obtenues à partir de séries avec divers degrés de variation de variabilité.

Par conséquent, pour caractériser la série de variations, en plus de la valeur moyenne, une autre caractéristique est nécessaire , permettant d'évaluer le degré de ses fluctuations.


© 2015-2019 site
Tous les droits appartiennent à leurs auteurs. Ce site ne revendique pas la paternité, mais fournit une utilisation gratuite.
Date de création de la page: 13/02/2016