> 1M veri satırı ve 20'den fazla sütun içeren bir tablom var.Bir BigQuery tablosundan yinelenen satırları sil
Masamın içinde (tabloX) Belirli bir sütunda (troubleColumn) yinelenen kayıtları (~ 80k) belirledim.
Mümkünse, orijinal tablo adını saklamak ve yinelenen kayıtları sorunlu sütümümden kaldırmak istiyorum, aksi takdirde aynı şemaya sahip ancak yinelenenler olmadan yeni bir tablo (tableXfinal) oluşturabilirim.
SQL veya başka bir programlama dilinde yetkin değilim, bu yüzden lütfen cehaletimi bağışlayın.
delete from Accidents.CleanedFilledCombined
where Fixed_Accident_Index
in(select Fixed_Accident_Index from Accidents.CleanedFilledCombined
group by Fixed_Accident_Index
having count(Fixed_Accident_Index) >1);
: sürüm (yerine yeni birinin herhangi bir satır alır)! – TheGoat