2012-11-13 18 views
5

Boost :: spirit kullanmayı öğreniyorum. Bunu yapmak için basit bir sözcü yaratmayı, birleştirmeyi ve ardından ruhu kullanarak ayrıştırma yapmayı istedim. Örneği değiştirmeyi denedim, ancak beklendiği gibi çalışmıyor (sonuç r doğru değil).Destekle ilgili sorunlar :: spirit :: lex & whitespace

İşte lexer var:

#include <boost/spirit/include/lex_lexertl.hpp> 

namespace lex = boost::spirit::lex; 

template <typename Lexer> 
struct lexer_identifier : lex::lexer<Lexer> 
{ 
    lexer_identifier() 
     : identifier("[a-zA-Z_][a-zA-Z0-9_]*") 
     , white_space("[ \\t\\n]+") 
    { 
     using boost::spirit::lex::_start; 
     using boost::spirit::lex::_end; 

     this->self = identifier; 
     this->self("WS") = white_space; 
    } 
    lex::token_def<> identifier; 
    lex::token_def<> white_space; 
    std::string identifier_name; 
}; 

Ve bu yönetmeye çalışıyorum örnektir: dize içinde tek belirteç olarak orada

#include "stdafx.h" 

#include <boost/spirit/include/lex_lexertl.hpp> 
#include "my_Lexer.h" 

namespace lex = boost::spirit::lex; 

int _tmain(int argc, _TCHAR* argv[]) 
{ 
    typedef lex::lexertl::token<char const*,lex::omit, boost::mpl::false_> token_type; 
    typedef lex::lexertl::lexer<token_type> lexer_type; 

    typedef lexer_identifier<lexer_type>::iterator_type iterator_type; 

    lexer_identifier<lexer_type> my_lexer; 

    std::string test("adedvied das934adf dfklj_03245"); 

    char const* first = test.c_str(); 
    char const* last = &first[test.size()]; 

    lexer_type::iterator_type iter = my_lexer.begin(first, last); 
    lexer_type::iterator_type end = my_lexer.end(); 

    while (iter != end && token_is_valid(*iter)) 
    { 
     ++iter; 
    } 

    bool r = (iter == end); 

    return 0; 
} 

r sürece geçerlidir. Bu neden böyle?

Selamlar Tobias

cevap

10

İkinci bir lexer devlet yarattığını ancak bunu çağrılan hiç.

basitleştirin ve kar:

this->self += identifier 
       | white_space [ lex::_pass = lex::pass_flags::pass_ignore ]; 
:


Çoğu durumda, istenen etkiye sahip en kolay yolu atlanabilir jeton bir pass_ignore bayrağıyla tek devlet Lexing kullanmak olacaktır Bu bir actor_lexer gerektirir

Not semantik eylem için izin vermek:

typedef lex::lexertl::actor_lexer<token_type> lexer_type; 

Tam örnek:

#include <boost/spirit/include/lex_lexertl.hpp> 
#include <boost/spirit/include/lex_lexertl.hpp> 
namespace lex = boost::spirit::lex; 

template <typename Lexer> 
struct lexer_identifier : lex::lexer<Lexer> 
{ 
    lexer_identifier() 
     : identifier("[a-zA-Z_][a-zA-Z0-9_]*") 
     , white_space("[ \\t\\n]+") 
    { 
     using boost::spirit::lex::_start; 
     using boost::spirit::lex::_end; 

     this->self += identifier 
        | white_space [ lex::_pass = lex::pass_flags::pass_ignore ]; 
    } 
    lex::token_def<> identifier; 
    lex::token_def<> white_space; 
    std::string identifier_name; 
}; 

int main(int argc, const char *argv[]) 
{ 
    typedef lex::lexertl::token<char const*,lex::omit, boost::mpl::false_> token_type; 
    typedef lex::lexertl::actor_lexer<token_type> lexer_type; 

    typedef lexer_identifier<lexer_type>::iterator_type iterator_type; 

    lexer_identifier<lexer_type> my_lexer; 

    std::string test("adedvied das934adf dfklj_03245"); 

    char const* first = test.c_str(); 
    char const* last = &first[test.size()]; 

    lexer_type::iterator_type iter = my_lexer.begin(first, last); 
    lexer_type::iterator_type end = my_lexer.end(); 

    while (iter != end && token_is_valid(*iter)) 
    { 
     ++iter; 
    } 

    bool r = (iter == end); 
    std::cout << std::boolalpha << r << "\n"; 
} 

Baskılar bir Skipper devlet olarak

true 

"WS"


Bu ikinci ayrıştırıcı durumunu kullanan bir numunede rastladım mümkün de Kaptan (lex::tokenize_and_phrase_parse). Bunun için bir çalışma örneği oluşturmak için bir dakika ya da 10 almama izin verin.

#include <boost/spirit/include/qi.hpp> 
#include <boost/spirit/include/lex_lexertl.hpp> 
namespace lex = boost::spirit::lex; 
namespace qi = boost::spirit::qi; 

template <typename Lexer> 
struct lexer_identifier : lex::lexer<Lexer> 
{ 
    lexer_identifier() 
     : identifier("[a-zA-Z_][a-zA-Z0-9_]*") 
     , white_space("[ \\t\\n]+") 
    { 
     this->self  = identifier; 
     this->self("WS") = white_space; 
    } 
    lex::token_def<> identifier; 
    lex::token_def<lex::omit> white_space; 
}; 

int main() 
{ 
    typedef lex::lexertl::token<char const*, lex::omit, boost::mpl::true_> token_type; 
    typedef lex::lexertl::lexer<token_type> lexer_type; 

    typedef lexer_identifier<lexer_type>::iterator_type iterator_type; 

    lexer_identifier<lexer_type> my_lexer; 

    std::string test("adedvied das934adf dfklj_03245"); 

    { 
     char const* first = test.c_str(); 
     char const* last = &first[test.size()]; 

     // cannot lex in just default WS state: 
     bool ok = lex::tokenize(first, last, my_lexer, "WS"); 
     std::cout << "Starting state WS:\t" << std::boolalpha << ok << "\n"; 
    } 

    { 
     char const* first = test.c_str(); 
     char const* last = &first[test.size()]; 

     // cannot lex in just default state either: 
     bool ok = lex::tokenize(first, last, my_lexer, "INITIAL"); 
     std::cout << "Starting state INITIAL:\t" << std::boolalpha << ok << "\n"; 
    } 

    { 
     char const* first = test.c_str(); 
     char const* last = &first[test.size()]; 

     bool ok = lex::tokenize_and_phrase_parse(first, last, my_lexer, *my_lexer.self, qi::in_state("WS")[my_lexer.self]); 
     ok = ok && (first == last); // verify full input consumed 
     std::cout << std::boolalpha << ok << "\n"; 
    } 
} 
:

Güncelleme beni biraz fazla 10 dakika (waaaah) :) İşte bir karşılaştırmalı test lexer devletler nasıl etkileşimde gösteren, ve nasıl ikinci ayrıştırıcı durumunu çağırmak için Ruh Skipper ayrıştırmayı kullanmaya aldı

çıkış

Starting state WS: false 
Starting state INITIAL: false 
true 
+0

Eklenen ** bir kaptan state' olarak ** ' "WS" altında demo "WS" durum yaklaşımdır. Alkışlar – sehe

+0

Oops. Yanlış token_type bildirimini kopyaladım. ['HasState'] için' mpl :: true_' gerekir (http://www.boost.org/doc/libs/1_49_0/libs/spirit/doc/html/spirit/lex/abstracts/lexer_primitives/lexer_token_values.html Durum bilgisi olan lexer'larla uğraşırken - elbette # spirit.lex.abstracts.lexer_primitives.lexer_token_values.the_anatomy_of_a_token)! *** İlk başta sabit – sehe

+0

- geniş kapsamlı örneğiniz için teşekkür ederiz. Yine de bazı sorularım var: Lex :: omit ne yapıyor? Ve tokenize_and_parse çağrısı ile ilgili: my_lexer.self & qi :: in_state ("WS") [my_lexer.self] nedir? –