Aşağıdaki örnekte, son satır yüklenmez. Bir hata alıyorum:Alıntılar ve alan ayırıcı arasındaki veriler
Data between close double quote (") and field separator:
Bu boru sembolü arasındaki tüm veriler tek bir alan olarak ele alınmalıdır çünkü bir hata gibi görünüyor.
Şema: biri: dize, iki: string, üç: dize, dört: string
yükle dosyası: Birinci ve ikinci satır yukarıda işlenir
This | is | test only | to check quotes
second | line | "with quotes" | no text
third line | with | "start quote" and | a word after quotes
. Ama üçüncü değil.
Güncelleme:
bazı lütfen açıklayabilir niçin üçüncü satırda haricinde aşağıdaki çalışma ?
This | is | test only | to check quotes
second | line | "with quotes" | no text
third line | with | "start quote" and | a word after quotes
forth line | enclosed | {"GPRS","MCC_DETECTED":false,"MNC_DETECTED":false} | how does this work?
fifth line | with | {"start quote"} and | a word after quotes
Bunun için biraz açıklayıcı bir açıklama olabilir. Son kullanıcı bakış açısından bu saçmadır.
Sadece Güncellemenizi çalıştıysanız ve verdi örneği aslında çalışmıyor mu Çoğu CSV ayrıştırma uygulaması gibi, BigQuery varsayılan olarak çift tırnak işaretleri (") alanı kapsayan bir karakter olarak kabul eder. 3. satır düzgün bir şekilde kaçmadı (aşağıya bakın) ve yutmaya bir hata atılacak. Seçenekleriniz şunlardır: 1. Yutma isteklerinizdeki "configuration.admin.quote" parametresini, çift tırnak işareti dışında başka bir şeye (verilerinizde görünmeyen bir karaktere) değiştirin. 2. Verilerinizi aşağıda önerildiği şekilde çıkarınız ... örneğin, Python'un csv sınıfı bunu otomatik olarak yapar. –
NULL için "Configuration.load.quote" gibi şeyler yapabilmeyi düşünerek haklı olabileceği düşünülürken, büyük miktarlarda CSV verileriyle çalışırken sınırlayıcılar ve alan çevreleyen karakterlerle çok açık olmanın önemli olduğunu düşünüyorum.Temel verilerdeki hataları yakalamaya ve aldığınız verilerin geçerli olduğundan emin olmanıza yardımcı olur. –