2016-03-20 27 views
3

Akış tabloları tablo meta verilerini hemen güncellemediğinden. Bir tablonun geçerli Meta Verilere sahip olmaması (özellikle daha küçük tablolarda). Bu, sırayla, tablo joker fonksiyonlarını kullanırken (tablo meta verileriyle ilgili olarak) sorunlara neden olur. Bunu aşmak için, tablo meta verilerini güncellemeye zorlamak için bir yol arıyorum. Bunu yapmak için başlatabileceğim herhangi bir iş var mı? TeşekkürlerGüncelleme tabloları meta verilerini zorlamak için bir yol var mı?

+0

Karşılaştığınız sorunun belirli bir örneğini verebilir misiniz? Sorunun ne olduğundan emin değilim ... Bazı özel sorular: tabloları önceden oluşturuyorsunuz veya şablon tabloları kullanıyorsunuz (https://cloud.google.com/bigquery/streaming-data-into-bigquery#template-tables)? Ne tür geçersiz meta veriler görüyorsunuz? Bunu ne zaman görüyorsun? –

+0

Bir tablo oluşturup içine veri akıtıyorum. Her neyse, tablo meta verilerini güncellemeyi zorlamak için bir belirsizlik arıyorum ve belirsiz bir programa ulaşmak için bazı arka plan işlemlerinin beklemesini beklemiyorum. –

+0

Şablon tablolarına akış oluşturmaya ve ilişkili tablonun oluşturulmasına mı atıf yapıyorsunuz? Yoksa bunun yerine, tablo meta verilerindeki tablo istatistikleri (bayt, satır vb.) Hakkında konuşuyor musunuz? –

cevap

3

Kısa cevap no. Akış sistemi, verileri normal olarak depolandığından farklı bir depolama biçiminde/sistemde akıtılan verileri arabelleğe alır. Tamponlanan verileri geleneksel depolama sistemine düzenli olarak akıtıyoruz, bu noktada ilgilendiğiniz tablo meta verileri, temizlenen veriler.

Bu davranışın nedeni, aktif olarak akışlı bir sistemde, bu istatistiklerin potansiyel olarak sürekli değişmesidir ve bu nedenle yanlış olacaktır. Akış besleme hizmeti dağıtılmış bir sistem olduğundan, arabelleğe alınmış veriler hakkında doğru istatistikleri elde etmenin tek yolu, tarama arabelleği arabelleğidir ve güncelleme istatistiklerini hesaplar (bu, yanıtın döndürülmesiyle yanlış/eskidir) ayrıca çok pahalı olabilirler. Bu istatistiklerin meta veri değerlerini sabit tutmak için "temizlenen" verilere bağlı kalmasını ve pahalı bir arabellek taraması yapılmasını gerektirmediğinden veri döndürülmesini bekledik.

Tabloda "streamingBuffer" adlı meta verilerde, satır/bayt üzerinde tahminler ve bazı zamanlama istatistikleri sağlayan bir bölüm var.

Sorgunuzdan tablo jokerlerinden bilgi kullandığınızı görüyorum (TABLE_QUERY kastediyorsunuz?). Tahmin edilen verileri, tablo sorgusu için kullanılabilen alanlarda streamingBuffer bölümünden içerecek şekilde bir hatayı dosyalayacağım.

+0

Teşekkür ederiz. Tamponu yıkamayı zorlamak için bir sebep var mı? –

+0

Şu anda maksimum süre ~ 90 dakikadır. Veri hacminize bağlı olarak daha hızlı akıtacağız. –

+0

Arabelleği akış frekansına göre de temizlemeyi önerebilirim (örneğin: x saniye boyunca akış için veri akışı yoksa, o zaman flush) –

İlgili konular