Επανακωδικοποίηση μεταβλητών που περιέχουν κείμενο στο R
To R έχει ισχυρές συναρτήσεις για την επανακωδικοποίηση μεταβλητών που περιέχουν κείμενο, συχνό πρόβλημα στις ιατρικές έρευνες.
Για παράδειγμα, έχουμε μια βάση δεδομένων retrospective.cohort με ιστολογικά (στη μεταβλητή TNM7) από καρκίνους με το σύστημα ΤΝΜ (σε μορφή pT1a pN1) και θέλουμε να δημιουργήσουμε άλλες μεταβλητές για χωριστά T/N και ομαδοποίηση όλες τις κατηγορίες. Αυτό γίνεται με τη συνάρτηση grepl ως εξής:
attach(retrospective.cohort) retrospective.cohort$sizecat[grepl("T1", TNM7) ] <- "T1" retrospective.cohort$sizecat[grepl("T2", TNM7) ] <- "T2" retrospective.cohort$sizecat[grepl("T3", TNM7) ] <- "T3" retrospective.cohort$sizecat[grepl("T4", TNM7) ] <- "T4" retrospective.cohort$lncat[grepl("N0", TNM7) ] <- "0" retrospective.cohort$lncat[grepl("N1", TNM7) ] <- "1" retrospective.cohort$lncat[grepl("N2", TNM7) ] <- "1" retrospective.cohort$lncat[grepl("N3", TNM7) ] <- "1" detach(retrospective.cohort)
0 Comments
Recommended Comments
There are no comments to display.