Στατιστική Ανάλυση: Τύποι Δεδομένων

Δείτε επίσης:Κατανόηση των συσχετισμών

Η σελίδα μας στοΠαρατηρητική έρευνα και δευτερεύοντα δεδομέναπεριέγραψε δύο κύριες πηγές δεδομένων (τη δική σας έρευνα και δεδομένα που έχουν ήδη δημοσιευτεί). Ωστόσο, υπάρχουν επίσης πολλοί διαφορετικοί τύποι δεδομένων - και τα δεδομένα μπορούν να ταξινομηθούν με πολλούς διαφορετικούς τρόπους. Ο τύπος δεδομένων θα επηρεάσει τους τρόπους με τους οποίους μπορείτε να τα χρησιμοποιήσετε και ποια στατιστική ανάλυση είναι δυνατή. Θα επηρεάσει επίσης συμπεράσματα και συμπεράσματα που μπορείτε να εξαγάγετε.

Η επιλογή του τύπου δεδομένων είναι επομένως πολύ σημαντική. Αυτή η σελίδα περιγράφει μερικές από τις διακρίσεις στους τύπους δεδομένων και τις συνέπειες για τις ερευνητικές μεθόδους και ευρήματα.

Ποσοτικά έναντι ποιοτικών δεδομένων

Η πρώτη και πιο προφανής διάκριση είναι μεταξύ ποσοτικών και ποιοτικών δεδομένων:

  • Ποσοτικά δεδομέναείναι αριθμητικά: μπορούν να συλλεχθούν και να παρουσιαστούν ως αριθμοί. και

  • Ποιοτικα δεδομεναδεν είναι αριθμητικά.

Η σελίδα μας στοποιοτική και ποσοτική έρευναεξηγεί λεπτομερέστερα αυτήν τη διάκριση και παρουσιάζει τα πλεονεκτήματα και τα μειονεκτήματα και των δύο.

Αντικειμενικά και υποκειμενικά δεδομένα

Τα δεδομένα μπορούν επίσης να χωριστούν σεαντικειμενικό και υποκειμενικό.

  • Τα αντικειμενικά δεδομένα είναι παρατηρήσιμα και μετρήσιμα. Περιλαμβάνουν πράγματα όπως ύψος, βάρος ή αριθμό στοιχείων. Συλλέγονται συνήθως μέσω παρατηρήσεων ή άμεσων μετρήσεων.

  • Τα υποκειμενικά δεδομένα συλλέγονται από προσωπικές επικοινωνίες από άτομα. Αυτό μπορεί να είναι προφορικό ή γραπτό, αλλά μπορεί επίσης να λάβει άλλες μορφές. Για παράδειγμα, η γλώσσα του σώματος μπορεί να παρέχει υποκειμενικές πληροφορίες (“Ξαπλώνει ακίνητη, με τα μάτια της κλειστά και το στόμα της σφιχτό [αντικειμενικό], σαν να ήταν στον πόνο').

Τόσο τα αντικειμενικά όσο και τα υποκειμενικά δεδομένα μπορούν να είναι ποιοτικά και ποσοτικά. Για παράδειγμα, μπορείτε να παρατηρήσετε (αντικειμενικά) μια αλλαγή χρώματος (ποιοτική) και μπορείτε να ζητήσετε από τους ανθρώπους να εκφράσουν τις απόψεις τους για ένα θέμα (υποκειμενικό) χρησιμοποιώντας μια αριθμητική κλίμακα (ποσοτική).

Και οι δύο τύποι έχουν πλεονεκτήματα και μειονεκτήματα. Για παράδειγμα, τα υποκειμενικά δεδομένα μπορούν να παρέχουν ένα πολύ ευρύτερο φάσμα πληροφοριών, επειδή πολλά πράγματα είναι απλά μετρήσιμα. Αυτές περιλαμβάνουν μεταβλητές όπως το επίπεδο του πόνου, όπου ο καθένας έχει τη δική του ερμηνεία. Ακόμη και η χρήση μιας κλίμακας από 1 έως 10, που καθιστά τα δεδομένα ποσοτικά, δεν σημαίνει ότι θα είναι άμεσα συγκρίσιμα μεταξύ των ατόμων.

Ωστόσο, τα υποκειμενικά δεδομένα εξαρτώνται επίσης από τους ανθρώπους που θυμούνται και αξιολογούν τα πράγματα με ακρίβεια. Τα υποκειμενικά δεδομένα είναι επομένως πιθανό να είναι πιο αναξιόπιστα όταν οι άνθρωποι πρέπει να θυμούνται τα γεγονότα από πολύ καιρό πριν.

Όπου είναι δυνατόν, επομένως, προτιμώνται αντικειμενικά δεδομένα, αλλά υπάρχει μια γενική κατανόηση ότι μερικές φορές υπάρχουν μόνο υποκειμενικά δεδομένα.



Διαμήκη δεδομένα έναντι διατομεακών δεδομένων

Η διάκριση μεταξύ διαμήκων και διατομής δεδομένων είναι στην πραγματικότητα περισσότερο μια διάκριση στοσχεδιασμός μελέτηςαπό τον τύπο δεδομένων.

  • Διαχρονικές μελέτεςνα δουλεύεις με την ίδια ομάδα με την πάροδο του χρόνου. Μπορούν επομένως να δείξουν αλλαγές με την πάροδο του χρόνου και να προσδιορίσουν την αιτιώδη συνάφεια.

  • Μελέτες διατομήςμπορεί να συλλέγει δεδομένα σε διαφορετικά χρονικά σημεία, αλλά από διαφορετικές ομάδες. Επομένως, μπορούν να εμφανίσουν μόνο ένα στιγμιότυπο ή μια σειρά στιγμιότυπων εγκαίρως.

Η κρίσιμη διάκριση μεταξύ των δύο τύπων μελέτης, και επομένως των δεδομένων, είναι ότι τα διαμήκη δεδομένα μπορούν να αποδείξουν την αιτιώδη συνάφεια.

Γενικά θεωρείται αδύνατο να αποδειχθεί η αιτιότητα από δεδομένα διατομής, επειδή έχετε μόνο πληροφορίες για μια στιγμή στο χρόνο. Επομένως, δεν είναι δυνατόν να αλλάξουμε κάτι και να δούμε τι αποτέλεσμα έχει (δηλαδή, εάν υπάρχειαιτιώδης σχέση).

Ωστόσο, οι μελέτες διατομής είναι πολύ πιο βολικές. Πρέπει να πραγματοποιήσετε μόνο μία έρευνα ή μια έρευνα, αντί να ακολουθήσετε μια κοόρτη με την πάροδο του χρόνου. Οι διαχρονικές μελέτες μπορούν να παρέχουν πολύ υψηλής ποιότητας δεδομένα και να δείχνουν αιτίες, αλλά υποφέρουν από προβλήματα όπως η εγκατάλειψη της κοόρτης. Είναι επίσης δύσκολο να λάβουμε χρηματοδότηση για μακροχρόνιες, υψηλής ποιότητας διαχρονικές μελέτες.

Παράδειγμα: Συνδυασμός Διατομεακής και Διαχρονικής Έρευνας


οSurrey Επικοινωνία και Γλώσσα στην Εκπαιδευτική Μελέτη (ΚΛΙΜΑΚΕΣ)) είναι ένα καλό παράδειγμα μιας μακροχρόνιας διαχρονικής μελέτης, η οποία περιελάμβανε επίσης ορισμένα στοιχεία διατομής.

Το πρώτο στοιχείο της μελέτης ήταν μια μεγάλης κλίμακας έρευνα των παιδιών κατά το έτος υποδοχής σε 180 δημοτικά σχολεία στο Surrey. Όλα τα παιδιά του πληθυσμού ελέγχθηκαν για γλωσσικές ικανότητες κατά την είσοδο στο σχολείο, μέσω μιας έρευνας που ολοκληρώθηκε από καθηγητές τάξης για κάθε παιδί. Τους ρωτήθηκαν για τη συμπεριφορά, τη γλώσσα και τις κοινωνικές δεξιότητες. Αυτό έδωσε ένα στιγμιότυπο των γλωσσικών ικανοτήτων κατά την είσοδο στο σχολείο και επέτρεψε στους ερευνητές να αξιολογήσουν εάν το πρόγραμμα σπουδών ταιριάζει με την ικανότητα και να αποδείξει ότι τα μικρότερα παιδιά είχαν περισσότερες πιθανότητες να έχουν γλωσσικά προβλήματα.

Το επόμενο στάδιο επέλεξε ένα δείγμα 590 παιδιών από αυτά που εξετάστηκαν, στρωματοποιήθηκαν χρησιμοποιώντας τα ευρήματα από το πρώτο στάδιο για να δώσουν μια σειρά γλωσσικών ικανοτήτων. Εξετάστηκαν από έναν ερευνητή στο Έτος 1, και πάλι στο Έτος 3, και αξιολογήθηκαν οι γλωσσικές τους δεξιότητες. Ζητήθηκε επίσης από τους γονείς να παρέχουν πληροφορίες σχετικά με τη γλώσσα και τη συμπεριφορά και στα δύο σημεία.

Το επόμενο στάδιο ακολούθησε την αρχική κοόρτη SCALES στα Έτη 6 και 8, για να αξιολογήσει τα κοινωνικά, συναισθηματικά και ψυχικά τους αποτελέσματα.

Οι ερευνητές ενδιαφέρθηκαν για τη σχέση μεταξύ της γλωσσικής ανάπτυξης στην παιδική ηλικία και της κοινωνικής και συναισθηματικής ανάπτυξης στην εφηβεία. Αυτό το είδος πληροφοριών απλά δεν μπορεί να συγκεντρωθεί από μια μελέτη διατομής ή από δύο ξεχωριστές μελέτες σε διαφορετικές ηλικίες. Θα μπορούσατε να ζητήσετε από τους συμμετέχοντες και τους γονείς να ξανασκεφτούν, αλλά το χρονικό κενό είναι τέτοιο που η ανάμνηση είναι απίθανο να είναι αξιόπιστη.

Κατηγοριακά, συνεχή, διακριτά και ταξινομημένα δεδομένα

Μια άλλη διάκριση είναι κατηγορηματικά, συνεχή, διακριτά ή ταξινομημένα δεδομένα:

  • Τα κατηγοριακά δεδομένα χωρίζονται σε ξεχωριστές ομάδες ή κατηγορίες.

    Επομένως, περιλαμβάνουν, για παράδειγμα, το φύλο, αν σας αρέσει το παγωτό και αν έχετε επισκεφθεί ποτέ μια συγκεκριμένη χώρα. Μπορούν επίσης να περιλαμβάνουν ηλικία εάν ομαδοποιούνται σε δέκα ή πέντε χρόνια κομμάτια.

  • Τα συνεχή δεδομένα ορίζονται ως εκείνα που μπορούν να πάρουν έναν άπειρο αριθμό τιμών μεταξύ οποιωνδήποτε δύο τιμών.

    Αυτό ακούγεται περίπλοκο, αλλά είναι πραγματικά απλό. Πρόκειται για δεδομένα όπως το βάρος ή το ύψος, τα οποία μπορεί να είναι οποιεσδήποτε τιμές εντός του εύρους των πιθανών βαρών και υψών, όχι σταθερών τιμών ή ποσοστό μιας κατηγορίας που αρέσει το παγωτό (οποιαδήποτε τιμή κυμαίνεται από 0-100%). Κάθε σημείο δεδομένων είναι ένας ξεχωριστός και ξεχωριστός αριθμός και δεν εμπίπτει σε μια ομάδα. Η ηλικία, για παράδειγμα, θα συμπεριλαμβανόταν αν τη μετράτε με ακρίβεια σε ημέρες ή κλάσματα ενός έτους, αντί για ολόκληρα χρόνια.

  • Τα συγκεκριμένα δεδομένα ορίζονται ως εκείνα που έχουν καθορισμένο αριθμό πιθανών τιμών μεταξύ των δύο τιμών

    Συνεπώς, τα συγκεκριμένα δεδομένα περιλαμβάνουν τον αριθμό των παραπόνων των πελατών ή τον αριθμό των ατόμων που τους αρέσουν τα παγωτά, δηλαδή δεν μπορείτε να έχετε μισή καταγγελία ή το ένα τρίτο ενός ατόμου. Ένα άλλο παράδειγμα θα ήταν η ηλικία σε ολόκληρα χρόνια. Για τους σκοπούς της ανάλυσης, τα διακριτά δεδομένα θεωρούνται πολύ παρόμοια με τα συνεχή δεδομένα.

  • Τα δεδομένα κατάταξης ταξινομήθηκαν και ταξινομήθηκαν και στη συνέχεια αριθμήθηκαν με βάση τη σειρά κατάταξής τους

    Για παράδειγμα, εάν είχατε τέσσερα bits δεδομένων με τιμές 4, 6, 3 και 7, θα μπορούσατε να τα ταξινομήσετε σε αύξουσα σειρά ως 3, 4, 6 και 7. Θα έπαιρναν τότε τη σειρά κατάταξής τους, οπότε 3 θα ήταν 1 (1ο), 4 θα ήταν 2 (2ο) και ούτω καθεξής. Τα δεδομένα κατατάσσονται γενικά όταν όλα όσα σας ενδιαφέρουν είναι η σειρά και όχι οι απόλυτες τιμές. Αυτό συμβαίνει συνήθως όταν δύο μεταβλητές αλλάζουν μαζί, αλλά δεν έχουν ευθεία σχέση (δηλαδή, αλλάζουν με διαφορετικούς ρυθμούς). Για παράδειγμα, το παρακάτω γράφημα δείχνει αυτόν τον τύπο σχέσης (σε αυτήν την περίπτωση, εκθετική).

    Γράφημα που δείχνει την εκθετική σχέση μεταξύ δύο μεταβλητών.

    Προειδοποίηση!


    Είναι σημαντικό να θυμάστε ότι όταν βαθμολογείτε δεδομένα, χάνετε πληροφορίες.

    Αυτό πρέπει επομένως να γίνει μόνο όταν πρέπει πραγματικά να το κάνετε.


Αυτοί οι τέσσερις τύποι δεδομένων είναι κατάλληλοι για διαφορετικούς τύπους ανάλυσης - και θα πρέπει να χρησιμοποιήσετε διαφορετικούς στατιστικούς ελέγχους και μορφές ανάλυσης για τον καθένα.

Για περισσότερα σχετικά με τη χρήση διαφορετικών τύπων δεδομένων για ανάλυση, μπορείτε να δείτε τη σελίδα μαςΣυσχέτιση.

συμπέρασμα

Υπάρχουν πολλοί διαφορετικοί τύποι δεδομένων που μπορείτε να συλλέξετε στο πλαίσιο της έρευνάς σας. Η επιλογή του τύπου δεδομένων εξαρτάται συνήθως από τις ερευνητικές σας μεθόδους, οι οποίες με τη σειρά τους καθοδηγούνται από το ερευνητικό σας ερώτημα και τη γενική προσέγγιση της έρευνας. Ωστόσο, η επιλογή του τύπου δεδομένων έχει επίσης επιπτώσεις στον τύπο ανάλυσης και στα συμπεράσματα που μπορείτε να εξαγάγετε.


Συνέχισε να:
Κατανόηση των συσχετισμών
Απλή στατιστική ανάλυση