# Κεφάλαιο 5 # Δημιουργία πίνακα συχνοτήτων και διαγραμμάτων για ποιοτικά δεδομένα στο R # Φορτώνουμε το ακόλουθο πακέτο library(foreign) # Απόδοση των δεδομένων του Πίνακα 5.1 από το αρχείο chapter5_1.sav στο πλαίσιο δεδομένων ch5a ch5a<-read.spss('chapter5_1.sav', to.data.frame=T) # Περιληπτική αναφορά των δεδομένων- καταμέτρηση ανά κατηγορία summary(ch5a) # Μέτρηση του πλήθους των στοιχείων (=αριθμός ατόμων) length(ch5a$education) # Απόλυτες συχνότητες ανά κατηγορία table(ch5a$education) # Απλό ραβδόγραμμα συχνοτήτων plot(ch5a) # Η παραπάνω απλή μορφή λειτουργεί επειδή υπάρχει μόνο μία στήλη δεδομένων, κανονικά έπρεπε να προσδιορίσουμε: plot(ch5a$education) # Καλλωπισμένη και συμπληρωμένη εκδοχή plot(ch5a, xlab="Μόρφωση", ylab="f", cex.names=0.85, las=1, col="dark red") # ΔΗΜΙΟΥΡΓΙΑ ΠΙΝΑΚΑ ΣΥΧΝΟΤΗΤΩΝ f=table(ch5a) # Υπολογισμός απόλυτων συχνοτήτων cf=cumsum(table(ch5a)) # Υπολογισμός αθροιστικών απόλυτων συχνοτήτων rf=prop.table(table(ch5a)) # Υπολογισμός σχετικών συχνοτήτων rf100=round((rf/sum(rf)*100),2) # Υπολογισμός σχετικών συχνοτήτων ως ποσοστά %, στρογγυλοποιημένος σε 2 δεκαδικά crf=cumsum(table(ch5a))/sum(table(ch5a)) # Υπολογισμός αθροιστικών σχετικών συχνοτήτων crf100=round(crf*100, 2) # Υπολογισμός αθροιστικών σχετικών συχνοτήτων ως ποσοστά %, στρογγυλοποιημένος σε 2 δεκαδικά cbind(f, cf, rf100, crf100) # Δημιουργία πίνακα # Κυκλικό διάγραμμα των απόλυτων συχνοτήτων pie(f) # Καλλωπισμένο κυκλικό διάγραμμα των απόλυτων συχνοτήτων colors=c("orange","dark red","blue","pink","dark green") # Ορισμός των χρωμάτων pie(f, labels=paste(names(f),":",f), clockwise=T, border="white", col=colors) # Κυκλικό διάγραμμα με τα ποσοστά αντί για τα μορφωτικά επίπεδα pie(rf100, labels=rf100) # Κυκλικό διάγραμμα με τα ποσοστά και τα αντίστοιχα μορφωτικά επίπεδα pie(rf100, labels=paste(names(rf100), rf100, "%"), clockwise=T) # Ραβδόγραμμα συχνοτήτων barplot(f) # Καλλωπισμένη εκδοχή ραβδογράμματος σχετικών συχνοτήτων barplot(rf100, cex.names=0.85, las=1, ylim=c(0,50), col=rainbow(5), ylab="Ποσοστό (%)") # Ακιδωτό διάγραμμα συχνοτήτων plot(f) # Ακιδωτό διάγραμμα σχετικών συχνοτήτων plot(rf100) # Πολύγωνο σχετικών συχνοτήτων plot(rf100,type="l") # Καλλωπισμένο πολύγωνο σχετικών συχνοτήτων plot(rf100, type="l", xlab="Μορφωτικό επίπεδο", ylab="Ποσοστό ατόμων", las=1, ylim=c(0,50)) # Δημιουργία ομαδοποιημένης κατανομής συχνότητας και διαγραμμάτων για ποσοτικά δεδομένα στο R # Απόδοση των δεδομένων του Πίνακα 5.3 από το αρχείο chapter5_2.sav στο πλαίσιο δεδομένων ch5b ch5b<-read.spss('chapter5_2.sav', to.data.frame=T) # Περιληπτική αναφορά των δεδομένων - μέτρα κεντρικής τάσης και τεταρτημόρια summary(ch5b) # Κατασκευή ομαδοποιημένης κατανομής συχνότητας age<-ch5b$age h5b<-hist(age, breaks=1:14*5+12.5, plot=F) f<-h5b$counts mids<-h5b$mids cf<-cumsum(f) rf<-100*f/sum(f) crf<-cumsum(rf) agegroup<-paste(mids-2,mids+2,sep="-") data.frame(cbind(agegroup,mids,f,cf,rf=round(rf,1), crf=round(crf,1)))->grouped5b grouped5b # Φυλλογράφημα stem(ch5b$age) # Ιστόγραμμα συχνότητας f<-table(age) plot(f) # Καλλωπισμένο ιστόγραμμα συχνότητας age<-ch5b$age hist(age, breaks=7, xlab="Ηλικία (έτη)", ylab="Αριθμός ατόμων", main="Ιστόγραμμα ηλικιών", las=1, col=rainbow(7)) # Πολύγωνο συχνότητας plot(f,type="l",las=1,ylim=c(1,6),xlab="Ηλικία", ylab="Απόλυτη Συχνότητα")