Bir derste kullandığımız bazı dosya biçimleri (ARFF) için elle tekrarlanan salt bir python ayrıştırıcısı yazdım. Şimdi alıştırma sunumumu yürütmek çok yavaş. Çok fazla zaman ayrıştırıcımda harcanıyor. Çok fazla CPU zamanı tüketiyor, HD darboğaz değil.python'da hızlı bir ayrıştırıcı yazma
Python'da ayrıştırıcı yazmak için hangi performans yollarının olduğunu merak ediyorum. Onu tekrar yazmamayı tercih ederim. Jython'u kullanmaya çalıştım ama bu performansı çok düşürdü! Ayrıştırdığım dosyalar çok uzun satırlarla kısmen devasa (> 150 MB).
Şu anki ayrıştırıcımın yalnızca bir karakterden ileriye bakması gerekiyor. Kaynağı buraya gönderiyorum ama bunun iyi bir fikir olup olmadığını bilmiyorum. Son başvuru tarihinden sonra henüz bitmedi. Fakat sonra, bu alıştırmadaki odak ayrıştırıcı değildir. Kullanmak istediğiniz dili seçebilir ve zaten Java için bir ayrıştırıcı var.
Not: Ben bir x86_64 sistemi çok psyco (ve aynı zamanda PyPy gibi görünüyor) bir seçenek yok.
Güncelleme: Şimdi çözümleyicimi/yazıcımı bitbucket'a yükledim.
Ayrıştırıcınızı geliştirdiniz mi? Şanslar, herşeyi tutan tek bir darboğaz. –
Bir kod örneği olmadan, iyi bir tavsiye vermek imkansızdır. Bir büyük kusurlu bir ses tekniği kullanıyor olabilirsiniz ya da tüm yaklaşımınızın yeniden işlenmesi gerekebilir, bilmemizin bir yolu yoktur. – mikerobi
Onunla psyco kullanmayı denediniz mi? –