2016-03-29 9 views
0

PDF'de PDF ile PDF dosyasında bir pdf dosyasını ayrıştırdım. Bu "mermi noktasını eşleşebilir eğer istiyorum Yakut PDF :: Regex ile okunan mermi noktası Okuyucusu

__ 
|F0| 
|B7| 

bilmek: pdf dosyasının madde işareti içi şöyle (Ben de bir baskı ekranı ekli) F0B7 ile garip bir küp olarak benim çözümlenen metin olarak görünüyor "regex ile ve eğer öyleyse, bunu yapmak için uygun yolu ne olurdu? Bu sorunun üstesinden gelmek için kesinlikle hiçbir fikrim yok, çünkü bunun ilk başta dizenin bir parçası olduğundan bile emin değilim. Teşekkürler. enter image description here

cevap

0

Bu, codepoint F0B7 numaralı bir unicode sembolüdür.

Maalesef Ubuntu kurulum o glif kaçırırsa bir varsayılan yazı tipini vardır ve glif yazı tanımında eksik olduğunda, yaygın yaklaşım bir meydanda codepoint oluyor çekmektir.

regexp'in olurdu maç için:

/\uF0B7/ 

enter image description here