XML dosyalarını ayrıştırırken SAXParseException'dan kaçınmakta zorluk çekiyorum.Scala'da SAXParseException'ı Önleme
Bunun nedeni, binlerce binlerce XML dosyasını ayrıştırdığım ve bazen XML dosyasının içinde hatalar içerdiği.
Bu XML dosyalarını atlamanın ve doğru şekilde oluşturulmuş olanlarla devam etmenin bir yolu olup olmadığını merak ediyorum.
Şerefe! Bir RDD [dize] varsa ve
rdd.flatMap{ s =>
try {
parse(s) // here you convert the string into your XML
} catch {
case SAXParseException() =>
logError(...)
None
}
}
XML
olarak dizeyi ayrıştırmak Eğer
hakkında çok öğretici bir göz atabilirsiniz. Ancak, herhangi bir karar için ortak fikir “Dene (...). Recover {case err: SAXParseException => ...}' – Zernike