Ben yüklemiş xgboost. Ancak, ev ayarlanmasını elde etmek için, aşağıdaki işlev kodu ile çalıştı:
#Import libraries:
import pandas as pd
import numpy as np
import xgboost as xgb
from xgboost.sklearn import XGBClassifier
from sklearn import cross_validation, metrics #Additional sklearn functions
from sklearn.grid_search import GridSearchCV #Perforing grid search
import matplotlib.pylab as plt
%matplotlib inline
from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 12, 4
train = pd.read_csv('train_data.csv')
target = 'target_value'
IDcol = 'ID'
bir fonksiyonu en iyi parametreleri almak ve görsel biçimde görüntü çıkışı için oluşturulur.
def modelfit(alg, dtrain, predictors,useTrainCV=True, cv_folds=5, early_stopping_rounds=50):
if useTrainCV:
xgb_param = alg.get_xgb_params()
xgtrain = xgb.DMatrix(dtrain[predictors].values, label=dtrain[target].values)
cvresult = xgb.cv(xgb_param, xgtrain, num_boost_round=alg.get_params()['n_estimators'], nfold=cv_folds,
metrics='auc', early_stopping_rounds=early_stopping_rounds, show_progress=False)
alg.set_params(n_estimators=cvresult.shape[0])
#Fit the algorithm on the data
alg.fit(dtrain[predictors], dtrain[target_label],eval_metric='auc')
#Predict training set:
dtrain_predictions = alg.predict(dtrain[predictors])
dtrain_predprob = alg.predict_proba(dtrain[predictors])[:,1]
#Print model report:
print "\nModel Report"
print "Accuracy : %.4g" % metrics.accuracy_score(dtrain[target_label].values, dtrain_predictions)
print "AUC Score (Train): %f" % metrics.roc_auc_score(dtrain[target_label], dtrain_predprob)
feat_imp = pd.Series(alg.booster().get_fscore()).sort_values(ascending=False)
feat_imp.plot(kind='bar', title='Feature Importances')
plt.ylabel('Feature Importance Score')
fonksiyonu optimum parametreleri almak için çağrılır Şimdi
: özellik önem grafik görüntülenmesine rağmen
#Choose all predictors except target & IDcols
predictors = [x for x in train.columns if x not in [target]]
xgb = XGBClassifier(
learning_rate =0.1,
n_estimators=1000,
max_depth=5,
min_child_weight=1,
gamma=0,
subsample=0.7,
colsample_bytree=0.7,
objective= 'binary:logistic',
nthread=4,
scale_pos_weight=1,
seed=198)
modelfit(xgb, train, predictors)
ancak grafiğin üstündeki kırmızı kutuda parametreler bilgi eksik: Linux/mac işletim sistemini kullanan ve kurulu xgboost'u kullanan kişilere başvurunuz. Yukarıdaki bilgileri alıyorlar. Bunun belirli bir uygulamadan kaynaklanıp kaynaklanmadığını merak ettim, pencereler inşa ettim ve yükledim. Ve grafiğin üstünde görüntülenen parametre bilgilerini nasıl alabilirim. Şu andaki tabloyu alıyorum ve içindeki kırmızı kutu ve bilgi değil. Teşekkürler.
Çok teşekkürler. Sivri kaynaklarınızı takip ettim ve windows'ta xgboost'u kurdum. Ancak, cv parametreleri almak için aşağıdaki satırları çalıştırdığımda bir sorunla karşılaşıyorum: – shan
WindowsError alırsınız: [Hata 193]% 1 xgboost –