2015-08-15 12 views
12

aşağıdaki örneklerde TEKRARLI alanın benim anlayış kontrol edin:Google Bigquery'deki REPEATED alanı ne anlama geliyor?

[ 
    { 
     "name": "title", 
     "type": "STRING" 
    }, 
    { 
     "name": "author", 
     "type": "RECORD", 
     "fields": [ 
      { 
       "name": "name", 
       "type": "STRING" 
      } 
     ] 
    } 
] 

Ama

{ 
    "title": "History of Alphabet", 
    "author": ["Larry", "Steve", "Eric"] 
} 

şema vardır aşağıdaki JSON:

{ 
    "title": "History of Alphabet", 
    "author": [ 
     { 
      "name": "Larry" 
     }, 
    ] 
} 

Bu JSON şema vardır

[ 
    { 
     "name": "title", 
     "type": "STRING" 
    }, 
    { 
     "name": "author", 
     "type": "STRING", 
     "mode": "REPEATED" 
    } 
] 

Bu doğru mu?

nb: documentation'dan geçmeye çalıştım, ancak bu konuda herhangi bir açıklama bulamıyor.

cevap

14

Close. İlk örneğinizde, author, BQ'da tekrarlanan bir kayda karşılık gelen bir dizi nesnedir.

[ 
    { 
     "name": "title", 
     "type": "STRING" 
    }, 
    { 
     "name": "author", 
     "type": "RECORD", 
     "mode": "REPEATED", <--- NOTE! 
     "fields": [ 
      { 
       "name": "name", 
       "type": "STRING" 
      } 
     ] 
    } 
] 

Kişisel ikinci veri/şema çifti iyi görünüyor (ama genel şema bir dizi değil, bir nesne olduğuna dikkat ve elemanları arasında virgül ihtiyacı): Yani şema olacaktır. Burada iç içe ve tekrarlanan alanların bazıları tartışma vardır

: https://cloud.google.com/bigquery/docs/data?hl=en#nested

Orada da bazı örnek JSON verileri burada nesneleri şunlardır: https://cloud.google.com/bigquery/preparing-data-for-bigquery#dataformats

Ama biz açıklayan iyi bir iş yapmıyoruz katılıyorum Bu nesnelerin BQ şemalarını nasıl eşleştirdiğini. Bunun için üzgünüm!

+0

Bir şemanın bir dizi olduğunu belirtdiğiniz için teşekkür ederiz. –

+0

İyi açıkladı! – Harinder