2016-02-19 21 views
7

üzerinde python'a nasıl yüklerim? XGBoost paketini python'a yüklemeyi denedim. Windows os, 64 bit kullanıyorum. Takip ettim.XGBoost paketini Windows

Paket dizini, xgboost'un pencereler için dengesiz olduğunu ve devre dışı olduğunu belirtir: Pencerelerde pip yüklemesi şu anda daha fazla çalıştırma için devre dışı bırakılmıştır, lütfen github'dan yükleyin. https://pypi.python.org/pypi/xgboost/

Visual Studio'da XGBoost oluşturma sorunuyla karşılaşma konusunda bilgili değilim. Veri biliminde xgboost paketini kullanma fırsatını kaçırdım.

Lütfen XGBoost paketini python'a içe aktarabilirim. (Yalnızca Python kullanmak ise) Önce "make" aracılığıyla kütüphane kurmaya gerek

Teşekkür

cevap

2

, o zaman (siz Kobrayla üzerine istiyorsanız) anaconda istemini kullanarak yüklemek veya git bash olabilir.

git clone --recursive https://github.com/dmlc/xgboost 
git submodule init 
git submodule update 

sonra install TDM-GCC here ve Git Bash aşağıdakileri yapın:

alias make='mingw32-make' 
cp make/mingw64.mk config.mk; make -j4 

Son aşağıdaki kullanarak anaconda istemini yapmak (Windows Git Bash) aşağıdaki prosedüre

İlk follow the official guide ya da Git Bash:

cd xgboost\python-package 
python setup.py install 
Ayrıca bkz. se büyük kaynaklar: Şimdi pip içinde dek kullanılamaz yukarıdaki kaynaklarda aşağıdaki pencere os içinde

Official Guide

Installing Xgboost on Windows

Installing XGBoost For Anaconda on Windows

+0

Çok teşekkürler. Sivri kaynaklarınızı takip ettim ve windows'ta xgboost'u kurdum. Ancak, cv parametreleri almak için aşağıdaki satırları çalıştırdığımda bir sorunla karşılaşıyorum: – shan

+0

WindowsError alırsınız: [Hata 193]% 1 xgboost –

0

Ben yüklemiş xgboost. Ancak, ev ayarlanmasını elde etmek için, aşağıdaki işlev kodu ile çalıştı:

#Import libraries: 
import pandas as pd 
import numpy as np 
import xgboost as xgb 
from xgboost.sklearn import XGBClassifier 
from sklearn import cross_validation, metrics #Additional sklearn functions 
from sklearn.grid_search import GridSearchCV #Perforing grid search 

import matplotlib.pylab as plt 
%matplotlib inline 
from matplotlib.pylab import rcParams 
rcParams['figure.figsize'] = 12, 4 

train = pd.read_csv('train_data.csv') 
target = 'target_value' 
IDcol = 'ID' 

bir fonksiyonu en iyi parametreleri almak ve görsel biçimde görüntü çıkışı için oluşturulur.

def modelfit(alg, dtrain, predictors,useTrainCV=True, cv_folds=5, early_stopping_rounds=50): 

if useTrainCV: 
    xgb_param = alg.get_xgb_params() 
    xgtrain = xgb.DMatrix(dtrain[predictors].values, label=dtrain[target].values) 
    cvresult = xgb.cv(xgb_param, xgtrain, num_boost_round=alg.get_params()['n_estimators'], nfold=cv_folds, 
     metrics='auc', early_stopping_rounds=early_stopping_rounds, show_progress=False) 
    alg.set_params(n_estimators=cvresult.shape[0]) 

#Fit the algorithm on the data 
alg.fit(dtrain[predictors], dtrain[target_label],eval_metric='auc') 

#Predict training set: 
dtrain_predictions = alg.predict(dtrain[predictors]) 
dtrain_predprob = alg.predict_proba(dtrain[predictors])[:,1] 

#Print model report: 
print "\nModel Report" 
print "Accuracy : %.4g" % metrics.accuracy_score(dtrain[target_label].values, dtrain_predictions) 
print "AUC Score (Train): %f" % metrics.roc_auc_score(dtrain[target_label], dtrain_predprob) 

feat_imp = pd.Series(alg.booster().get_fscore()).sort_values(ascending=False) 
feat_imp.plot(kind='bar', title='Feature Importances') 
plt.ylabel('Feature Importance Score') 
fonksiyonu optimum parametreleri almak için çağrılır Şimdi

: özellik önem grafik görüntülenmesine rağmen

#Choose all predictors except target & IDcols 
    predictors = [x for x in train.columns if x not in [target]] 
    xgb = XGBClassifier(
    learning_rate =0.1, 
    n_estimators=1000, 
    max_depth=5, 
    min_child_weight=1, 
    gamma=0, 
    subsample=0.7, 
    colsample_bytree=0.7, 
    objective= 'binary:logistic', 
    nthread=4, 
    scale_pos_weight=1, 
    seed=198) 
modelfit(xgb, train, predictors) 

ancak grafiğin üstündeki kırmızı kutuda parametreler bilgi eksik: enter image description here Linux/mac işletim sistemini kullanan ve kurulu xgboost'u kullanan kişilere başvurunuz. Yukarıdaki bilgileri alıyorlar. Bunun belirli bir uygulamadan kaynaklanıp kaynaklanmadığını merak ettim, pencereler inşa ettim ve yükledim. Ve grafiğin üstünde görüntülenen parametre bilgilerini nasıl alabilirim. Şu andaki tabloyu alıyorum ve içindeki kırmızı kutu ve bilgi değil. Teşekkürler.

1

buradan kurmak:

  • indirme xgboost whl dosyasını here den (yapmak için piton versiyonunu ve sistem mimarisini, maç için emin örn piton 3.5 için "xgboost-0,6-CP35-cp35m-win_amd64.whl" İndirilenler klasöründen (64-bit makine)
  • açık komut istemi
  • cd üzerinde veya xgboost-0,6-CP35-cp35m-win_amd64.whl yüklemek pip) whl dosyayı kaydettiğiniz (veya whl dosya ne olursa olsun her yerde adi)
4

siz şu kullanabilirsiniz anaconda (veya miniconda) kullanıyorsanız:

  • conda install py-xgboost
+0

almaya çalıştığınızda geçerli bir Win32 uygulaması değil Sadece hızlı bir ipucu: Sorun Anaconda Promt'ta, Yönetici olarak çalışan komut. Aksi halde benim için çalışmadı. – CGFoX

+0

Anaconda ile yükleme başarılı olurken, xgboost hala "pip list" içinde görünmüyor ve içe aktarmaya çalışırken bir hatayla karşılaşıyorum. – CGFoX

0

Sen catboost yüklemek pip olabilir. Çoğu zaman XGBoost'tan daha doğru ve daha hızlı olan, yakın zamanda açık kaynaklı bir gradient artırma kütüphanesidir ve kategorik özellikler desteğine sahiptir. Kitaplığın yeri: https://catboost.yandex

İlgili konular