Python'un Airflow kütüphanesini kullanmaya çalışıyorum. Bir web sayfasını periyodik olarak taramak istiyorum.Python'un Hava Akışı'nda, belirli bir süre sonra bir görevin çalışmasını nasıl durdurabilirim?
Yapmakta olduğum sorun, günlüğüm start_date
ise birkaç gün önce, zamanlayıcıyı başlattığımda, bugün start_date
'dan yedeklenecektir. Örneğin,
Bugünün ayın 20'si olduğunu varsayalım.
start_date
bu ayın 15. olduğunu varsayalım. Ben 20'sinde zamanlayıcı başlatırsanız
, bu 20'sinde sayfa 5 kez kazımak olacak. Bir DAG örneğinin 15'inde çalışacağını ve 20'de DAG örneğini (15'inci sırada) çalıştıracağını görecektir. Ve sonra Kısacası vb
, 20'sinde 16 için DAG örneğini çalışacak, Hava akışı "yakalamak" için çalışacağız, ama bu web kazıma için bir anlam ifade etmiyor.
Hava akışı belirli bir süre sonra başarısız bir DAG örneğini düşünün yapmak için herhangi bir yolu var mı?
Görünüşe göre bu (http://stackoverflow.com/a/40578704/596167 bulunur) yeni 'LatestOnlyOperator' gibi birkaç ay önce Hava Akışı eklendi. –