var ve her satır ayrı alanı belirtir zaman Ar içine bir metin dosyası okuyoruz nasıl. komplikasyon bazı kayıtlar 4 satır ve bazı alanların sayısındaki farklılık 1 ama iki yaşındayken hepsi ayrı düştü ne zaman 6. @DWin sorularımı çivilenmiş olması. Bir look at his answer here olabilir.her kayıt bir paragraf ve bazı kayıtlar 4 alanlara sahip ve diğerleri tek her kayıt bir paragraf olduğu bir metin dosyasında okuyabilirsiniz nasıl 6
Yani burada başlangıç metni İşte
TheInstitute 5467
telephone line 4125526987 x 4567
datetime 2011110516 12:56
blay blay blah who knows what, but anyway it may have a comma
TheInstitute 5467
telephone line 4125526987 x 4567
datetime 2011110516 12:58
blay blay blah who knows what
TheInstitute 5467
telephone line 412552999 x 4999
bump phone line 4125527777
bump pony pony oops 4125527777
datetime 2011110516 12:59
blay blay blah who knows what
TheInstitute 5467
telephone line 4125526987 x 4567
bump phone line 4125527777
bump pony pony oops 4125527777
datetime 2011110516 13:51
blay blay blah who knows what, but anyway it may have a comma
TheInstitute 5467
telephone line 4125526987 x 4567
datetime 2011110516 14:56
blay blay blah who knows what
çıkışı gibi görünmelidir ne benim son simülasyonudur. Aslında bu ihtiyacım olan şeylerden bir adım kaldırıldı. Aşağıda bir R data.frame'in ASCII metin gösterimini yerleştiriyorum. Her şeyin bir veri çerçevesinde olduğunu göreceksiniz, ancak bazı kayıtların iki ekstra alanı olduğundan, alan değerleri iki sütunla kaydırılır.
structure(list(institution = structure(c(1L, 1L, 1L, 1L, 1L), .Label = "TheInstitute 5467", class = "factor"),
telephoneline = structure(c(1L, 1L, 2L, 1L, 1L), .Label = c("telephone line 4125526987 x 4567",
"telephone line 412552999 x 4999"), class = "factor"), date.or.bump = structure(c(2L,
3L, 1L, 1L, 4L), .Label = c("bump phone line 4125527777",
"datetime 2011110516 12:56", "datetime 2011110516 12:58",
"datetime 2011110516 14:56"), class = "factor"), field4 = structure(c(2L,
1L, 3L, 3L, 1L), .Label = c("blay blay blah who knows what",
"blay blay blah who knows what, but anyway it may have a comma",
"bump pony pony oops 4125527777"), class = "factor"), field5 = structure(c(1L,
1L, 2L, 3L, 1L), .Label = c("", "datetime 2011110516 12:59",
"datetime 2011110516 13:51"), class = "factor"), field6 = structure(c(1L,
1L, 2L, 3L, 1L), .Label = c("", "blay blay blah who knows what",
"blay blay blah who knows what, but anyway it may have a comma"
), class = "factor")), .Names = c("institution", "telephoneline",
"date.or.bump", "field4", "field5", "field6"), class = "data.frame", row.names = c(NA,
-5L))
PS: Ben inanmak haklı mıyım bu bir mesaj dput kullanarak veya bir bir .Rdata direclty burada dosyasını kaydedebilir bir veri çerçevesi.
Eğer '[[1]]' ilk satırda ne yaptığını açıklayabilir misiniz? – Farrel
strsplit, karakter vektörünün her elemanı için vektörlerin listesini döndürür (bir uzunluğun karakter vektörü için bile). Bu listede ilk elemana ihtiyacımız var, bu yüzden [[1]] bunu almak için kullanılıyor. Aynı işlev ikinci satırda kullanılır. –
Oh, bu sadece ilk elementi istediği sürece bir listeyi vektör etmenin bir yolu olabilir mi? – Farrel