Belirli bir koşulu karşılamayan satırların yerini tutam matrisler için sıfırlarla değiştirmenin en iyi yolunun ne olduğunu merak ediyorum. Örneğin, (I düz gösterim için diziler kullanılır):Belirli koşullara uyan scipy.sparse matris satırlarını sıfırlar olarak ayarlayın
a = np.array([[0,0,0,1,1],
[1,2,0,0,0],
[6,7,4,1,0], # sum > 10
[0,1,1,0,1],
[7,3,2,2,8], # sum > 10
[0,1,0,1,2]])
I değiştirmek isteyen bir miktarı toplamı sıfır bir sıra ile daha büyük 10 her satır değiştirmek isteyen
bir [2] ve [ 4] sıfırlarla, yani benim çıkış aşağıdaki gibi görünmelidir:
row_sum = a.sum(axis=1)
to_keep = row_sum >= 10
a[to_keep] = np.zeros(a.shape[1])
:
array([[0, 0, 0, 1, 1],
[1, 2, 0, 0, 0],
[0, 0, 0, 0, 0],
[0, 1, 1, 0, 1],
[0, 0, 0, 0, 0],
[0, 1, 0, 1, 2]])
Bu yoğun matrisler için yalındır oldukça olduğunu Ancak 0
, ben çalıştığınızda:
s = sparse.csr_matrix(a)
s[to_keep, :] = np.zeros(a.shape[1])
bu hatayı alıyorum:
raise NotImplementedError("Fancy indexing in assignment not "
NotImplementedError: Fancy indexing in assignment not supported for csr matrices.
Dolayısıyla, ben seyrek matrisler için farklı bir çözüm gerekir. Ben bu geldi:
Bu bizim sıfıra kimlik matrisi içinde diyagonal 2. ve 4. unsurları kurarsanız, önceden çoğaltılmış matrisin satırları sıfıra ayarlanır gerçeğine dayanırdef zero_out_unfit_rows(s_mat, limit_row_sum):
row_sum = s_mat.sum(axis=1).T.A[0]
to_keep = row_sum <= limit_row_sum
to_keep = to_keep.astype('int8')
temp_diag = get_sparse_diag_mat(to_keep)
return temp_diag * s_mat
def get_sparse_diag_mat(my_diag):
N = len(my_diag)
my_diags = my_diag[np.newaxis, :]
return sparse.dia_matrix((my_diags, [0]), shape=(N,N))
. Bununla birlikte, daha iyi, daha scipinic bir çözüm olduğunu hissediyorum. Daha iyi bir çözüm var mı?