2014-12-17 16 views
5

Merhaba bir Vowpal Wabbit iki ad dosyası oluşturduktan tutmak, doğrusal terimleri görmezden: Vowpal Wabbit sadece örneğin etkileşim terimleri

1.0 |A snow |B ski:10 
0.0 |A snow |B walk:10 
1.0 |A clear |B walk:10 
0.0 |A clear |B walk:5 
1.0 |A clear |B walk:100 
1.0 |A clear |B walk:15 

AB -q kullanarak, etkileşim terimleri alabilirsiniz. Sadece etkileşim koşullarını tutmam ve doğrusal terimleri görmezden gelmenin bir yolu var mı? Başka bir deyişle

, vw sample.vw -q AB --invert_hash sample.model sonucu şu anda şudur:

Ben böyle bir şey olmak istiyorum
.... 
A^clear:24861:0.153737 
A^clear^B^walk:140680:0.015292 
A^snow:117127:0.126087 
A^snow^B^ski:21312:0.015803 
A^snow^B^walk:28234:-0.010592 
B^ski:107733:0.015803 
B^walk:114655:0.007655 
Constant:116060:0.234153 

:

.... 
A^clear^B^walk:140680:0.015292 
A^snow^B^ski:21312:0.015803 
A^snow^B^walk:28234:-0.010592 
Constant:116060:0.234153 

--keep ve --ignore seçenekleri İstenen etkiyi yaratmazlar çünkü ikinci dereceden terimler üretilmeden önce göz önünde bulundurulmaktadırlar. Bunu vw ile yapmak mümkün mü yoksa tüm kombinasyonları oluşturan özel bir ön işlem adımına ihtiyacım var mı?

+0

var mı:

orijinal mesajları görüyor musunuz? –

+0

@MartinPopel "Saf" bir matris faktorizasyon modeli oluşturmak için VW kullanmak istiyorsanız, doğrusal terimleri hariç tutmak ve sadece tahminleri yapmak için düşük rank kuadratik özellikleri kullanmak istersiniz. – Zach

cevap

3

John Langford (VW'nin ana yazarı) şöyle yazdı: Şimdi bunu yapmak için iyi bir yol yoktur. 'un en kolay yaklaşımı, --ignore'un kaynak kodundaki foreach_feature<> şablonuna uygulanmasıdır.

1 |first:1 foo bar gah |second:1 loo too rah 
-1 |first:1 foo bar gah |second:-1 loo too rah 
1 |first:-1 foo bar gah |second:-1 loo too rah 
-1 |first:-1 foo bar gah |second:1 loo too rah 

Bunların hepsi mükemmel etiketle ilişkilendirilebilir kuadratik özellikleri yapar, ama doğrusal özellikler etiketle sıfır korelasyon vardır:

Sen dört yeni örneklerle içine her orijinal örneği dönüştüren bir hile kullanabilirsiniz . Bu nedenle, hafif bir l1 düzenli hale getirme doğrusal özellikleri öldürmelidir.

Bunun bakım için yeterli performansı (dolayısıyla tasarımı) geliştireceğinden şüpheliyim, ancak yararlı olduğunu düşünüyorsanız, lütfen bize bildirin. alt düzen özelliklerini görmezden için iyi bir motive edici bir neden

https://groups.yahoo.com/neo/groups/vowpal_wabbit/conversations/topics/2964 https://groups.yahoo.com/neo/groups/vowpal_wabbit/conversations/topics/4346