0
ben aşağıdakileri yapmanız gerekir:Bul max [dize, Set [MyStuff]]
- grupta çok büyük
- atma grupları
- almak bazı dize özelliğiyle kayıtlarım kalan gruplar İşte
her birinde en fazla eleman şimdiye kadar ne var:
val records: TypedPipe[MyStuff] = ...
records
.groupBy(_.getThatStringProperty)
.toSet
.filter(_._2.size < 10)
....
UnsortedGrouped[String, Set[MyStuff]]
ile sona ererim. Her grup için 'max' MyStuff'u zarif, paralelleştirilebilir ve minimum bellek gereksinimleriyle nasıl bulabilirim?