Arils

2015-10-07 7 views
7

için sepete veri işleme nasıl hazır Tamam, bu yüzden çok fazla araştırma yaptım ve satış verileri üzerinde arules çalıştırmak istiyorum. Verileri doğru biçimde düzgün bir şekilde almam ve doğru "faktörler" veya "değişkenler" ile ve sepet formunda ayarlamam gerekiyor.Arils

Şu anda Sipariş Numarasıyla ve daha sonra içindeki öğelerle satış verilerine sahibim. Her sipariş benzersizdir (her yeni sipariş, yeni bir # oluşturulur ve parça # içerir), ancak aynı öğeler açıkça birçok siparişte görünebilir.

Şu verilerim böyle kurulur:

Order# Part# PartDescription
 
1   A  PartA 
1   B  PartB 
1   G  PartG 
2   R  PartR 
3   A  PartA 
3   B  PartB 
4   E  PartE 
5   Y  PartY 
6   A  PartA 
6   B  PartB 
6   F  PartF 
6   V  PartV 

Yani, R bu formda hiç sevmez, ben formda almak zorunda arules ve veri analizi kabul edecek.

Evet Bir metin dosyası olarak kaydettim ve bir .csv dosyası denedim, ancak nasıl hazırlayacağımı veya RStudio'da nasıl işlem yapacağınıza dair adım adım talimatlar bulabilirsem harika olur.

bunun gibi bir sepet biçiminde varsayalım ki okuyun ..

1 (A, B, G)
2 (R)
3 (A, B)
4 (E)
5 (Y)
6 (A, B, K, V)

o doğru değilse beni düzeltin lütfen. Bu fikri anladım ama sadece bir yere bulamadığım adım adım talimatlara ihtiyacım var. Dplyr ve tidyr kullanarak denedim. Veri analizini iyi anlamış olmakla birlikte, RStudio hakkında daha fazla doğrudan yardıma ihtiyacım var. Bu adımı atlatabilirsem, bunu daha fazla anlayacağım. daha sonra as kullanın Sipariş yaparak, split istediğiniz türü için

library(arules) 
?transactions 

:

+0

Transactions<- read.transactions("Data with tx ids, item names, in single format.csv", rm.duplicates= TRUE, sep=",", format = "single", cols = c(7,9)); 

(sütunda 7'de tx kimliği sütun 9 öğe adları) Orada herhangi bir hazırlık bana haber ver. Teşekkür ederim. – V1k1

+0

En azından verilerin bir data.frame olarak r'ye yüklendiğini varsayar mıyım? Değilse, 'data <- read.csv (" myfile.csv "), comment.char =" ")' – jeremycg

+0

"Import Dataset'i İçe Aktar" ı tıklıyorum ve şu ana kadar verdiğim yanıt veriyi doğru sepet formatına koyuyor. Daha fazla sorundan kaçınmak için onu bir data.frame olarak r'ye yüklemem gerekir mi? Tam olarak hangi yolu r'ye yüklemeliyim? Excel'den bir metin dosyası, bu .csv olmalı? Babam doğru sütunlarda/satırlarda görünür.Hangi ithalat ayarlarını seçmeliyim? Teşekkür ederim! Aşağıdaki kod çalışıyorsa, – V1k1

cevap

6

verilerinizi almak için nasıl örnekler için "işlemler" veri türü için yardım sayfasına bir göz atın bir işlemler listesinin içine almak:

trans <- as(split(data[,"Part"], data[,"Order"]), "transactions") 
inspect(trans) 
    items  transactionID 
1 {A,B,G} 1    
2 {R}  2    
3 {A,B}  3    
4 {E}  4    
5 {Y}  5    
6 {A,B,F,V} 6 
+0

Teşekkür ederiz! Test kukla verileriyle çalıştı. Şimdi onu gerçek veriler üzerinde çalıştırıyorum (282,292 giriş). Hazırlık konusunda başka sorularım varsa, bulamadım ve eğer bulamadım eğer buraya geri döneceğim. Ama asıl soru, anlatabileceğim bir şeyden cevaplandı. Şimdilik daha büyük veri setinde çalışmasına izin vereceğim. Teşekkür ederim! Gerçekten hiçbir yerde bulamadığım için şaşırdım. Çok basit! – V1k1

+0

Yani, bu forumda yaptığım test dummy verileri üzerinde çalışıyor. Neden alamadım: Ama " çoğaltılamaz öğeleri ile yapılan işlemlere listeyi zorlamak olamaz asMethod (nesne) Hata içinde" bu hatayı alıyorum, tıpkı gerçek verileri kullanarak, bunu aynı şekilde yapıyor, benim gerçek verileri kullanarak? Sahte verilerde tekrarlanan öğeler var ve bunu benim için bir sepete koyar, o zaman neden benim verilerim için aynı şeyi yapmıyor? Çoğaltılmış Sipariş Numarası'na dayalı olarak sepetleri düşünmüştüm ve Part # lerin sepetine koydum, aynen benim kukla verilerim gibi. Kukla verilerle tam anlamıyla aynı şekilde düzenlenmiştir. – V1k1

+0

Bekleyin, Parça # 'lardan birinin Sipariş # lerden biri olduğunu öğrendim, böylece orada çoğalıyorlar. Sipariş # ve PartDescription üzerinde trans komutunu çalıştırdım ve daha uzun süre çalışıyor ancak aynı hatayla bitiyor. Bölüm # 'nin Sipariş #' e eşit olduğunu ve # siparişini benzersiz bir değere değiştirdiğini görmek için Excel'de kontrol ettim. Hala önceki yorumumda belirtilen hatayı alıyorum .. – V1k1

1

I (DataName, "işlemlerin" ..) gibi', örneğin zorlama (ile çok problem yaşadım

Ben yanıltmak. ve bunun, yinelenen kayıtlara sahip olmasından kaynaklandığı (diğer bir deyişle, aynı madde, "tek" formatta olduğu zaman, aynı geçişte birden fazla kez satın alınmış olmasıdır).

Bu nihayet benim için çalıştı budur: Yapabileceğim eğer öyleyse ben de, Excel için veri madenciliği eklentisi de