Çok dilli bir dizeyi, Regex kullanarak tek dilli simgelere bölmek istiyorum. bu İngilizce Arapça dize için örneğin Tekdüzenli tokenlere Regex kullanarak çok dilli dizeyi bölme
: 'Adının محمد oldu ve annesi adını آمنه oldu.'sonuç olarak altında olmalıdır:
- 'محمد,'
- 've annesi adıydı'
- 'onun adı' 'آمنه.' Mükemmel değil
Ne denediniz? Nerede kaldın? Her zaman İngilizce-Arapça mı, yoksa en azından dizelerinizde hangi yazıların olacağını biliyor musunuz? –
@TimPietzcker Evet, her zaman İngilizce-Arapça. – ARZ