Sign in to follow this  
Followers 0
  • entries
    6
  • comments
    0
  • views
    1.558

Επανακωδικοποίηση μεταβλητών που περιέχουν κείμενο στο R

bromptonista

824 views

To R έχει ισχυρές συναρτήσεις  για την επανακωδικοποίηση μεταβλητών που περιέχουν κείμενο, συχνό πρόβλημα στις ιατρικές έρευνες.

Για παράδειγμα, έχουμε μια βάση δεδομένων retrospective.cohort με ιστολογικά (στη μεταβλητή TNM7) από καρκίνους με το σύστημα ΤΝΜ (σε μορφή pT1a pN1) και θέλουμε να δημιουργήσουμε άλλες μεταβλητές για χωριστά T/N και ομαδοποίηση όλες τις κατηγορίες. Αυτό γίνεται με τη συνάρτηση grepl ως εξής:

attach(retrospective.cohort)
retrospective.cohort$sizecat[grepl("T1", TNM7) ] <- "T1"
retrospective.cohort$sizecat[grepl("T2", TNM7) ] <- "T2"
retrospective.cohort$sizecat[grepl("T3", TNM7)  ] <- "T3"
retrospective.cohort$sizecat[grepl("T4", TNM7)  ] <- "T4"

retrospective.cohort$lncat[grepl("N0", TNM7) ] <- "0"
retrospective.cohort$lncat[grepl("N1", TNM7) ] <- "1"
retrospective.cohort$lncat[grepl("N2", TNM7) ] <- "1"
retrospective.cohort$lncat[grepl("N3", TNM7) ] <- "1"
detach(retrospective.cohort)

emtoilet




0 Comments


There are no comments to display.

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!


Register a new account

Sign in

Already have an account? Sign in here.


Sign In Now