class Ripper
Ripper 是一个 Ruby 脚本解析器。
你可以通过基于事件的风格从解析器获取信息。例如,抽象语法树或 Ruby 程序的简单词法分析信息。
用法¶ ↑
Ripper 提供了一个简单的接口,可以将你的程序解析为符号表达式树(或 S-表达式)。
理解解析器的输出可能是一个挑战,建议你使用 PP 来格式化输出以提高可读性。
require 'ripper'
require 'pp'
pp Ripper.sexp('def hello(world) "Hello, #{world}!"; end')
#=> [:program,
[[:def,
[:@ident, "hello", [1, 4]],
[:paren,
[:params, [[:@ident, "world", [1, 10]]], nil, nil, nil, nil, nil, nil]],
[:bodystmt,
[[:string_literal,
[:string_content,
[:@tstring_content, "Hello, ", [1, 18]],
[:string_embexpr, [[:var_ref, [:@ident, "world", [1, 27]]]]],
[:@tstring_content, "!", [1, 33]]]]],
nil,
nil,
nil]]]]
你可以在上面的示例中看到,表达式以 :program 开头。
从这里开始,在 :def 处有一个方法定义,后跟该方法的标识符 :@ident。方法标识符之后是括号 :paren 和 :params 下的方法参数。
接下来是方法体,从 :bodystmt (stmt 表示语句)开始,其中包含方法的完整定义。
在我们的例子中,我们只是简单地返回一个字符串,所以接下来我们有 :string_literal 表达式。
在我们的 :string_literal 中,你会注意到两个 @tstring_content,这是 Hello, 和 ! 的字面部分。在两个 @tstring_content 语句之间是一个 :string_embexpr,其中 *embexpr* 是一个嵌入式表达式。我们的表达式包含一个局部变量,或 var_ref,其标识符 (@ident) 为 world。
资源¶ ↑
要求¶ ↑
-
ruby 1.9 (仅支持 CVS HEAD)
-
bison 1.28 或更高版本(其他 yacc 不工作)
许可证¶ ↑
Ruby 许可证。
-
Minero Aoki
-
aamine@loveruby.net
常量
- EVENTS
此数组包含所有 ripper 事件的名称。
- EXPR_ARG
换行符有意义,+/- 是一个运算符。
- EXPR_ARG_ANY
等于
(EXPR_ARG | EXPR_CMDARG)- EXPR_BEG
忽略换行符,+/- 是一个符号。
- EXPR_BEG_ANY
等于
(EXPR_BEG | EXPR_MID | EXPR_CLASS)- EXPR_CLASS
紧跟在 'class' 之后,没有 here document。
- EXPR_CMDARG
换行符有意义,+/- 是一个运算符。
- EXPR_DOT
‘, 没有保留字。
- EXPR_END
换行符有意义,+/- 是一个运算符。
- EXPR_ENDARG
同上,以及未绑定的花括号。
- EXPR_ENDFN
同上,以及未绑定的花括号。
- EXPR_END_ANY
等于
(EXPR_END | EXPR_ENDARG | EXPR_ENDFN)- EXPR_FITEM
作为 FNAME 的符号字面量。
- EXPR_FNAME
忽略换行符,没有保留字。
- EXPR_LABEL
标志位,允许标签。
- EXPR_LABELED
标志位,紧跟在一个标签之后。
- EXPR_MID
换行符有意义,+/- 是一个运算符。
- EXPR_NONE
等于
0- EXPR_VALUE
等于
EXPR_BEG- PARSER_EVENTS
此数组包含解析器事件的名称。
- SCANNER_EVENTS
此数组包含扫描器事件的名称。
- 版本
Ripper的版本
公共类方法
static VALUE
parser_dedent_string(VALUE self, VALUE input, VALUE width)
{
struct parser_params *p;
struct dedent_string_arg args;
p = rb_parser_params_new();
args.p = p;
args.input = input;
args.width = width;
return rb_ensure(parser_dedent_string0, (VALUE)&args, parser_free, (VALUE)p);
}
将 Ruby 程序标记化,并返回一个数组的数组,格式为 [[lineno, column], type, token, state]。filename 参数通常被忽略。默认情况下,此方法不处理 src 中的语法错误,使用 raise_errors 关键字可以在 src 中出现错误时引发 SyntaxError。
require 'ripper'
require 'pp'
pp Ripper.lex("def m(a) nil end")
#=> [[[1, 0], :on_kw, "def", FNAME ],
[[1, 3], :on_sp, " ", FNAME ],
[[1, 4], :on_ident, "m", ENDFN ],
[[1, 5], :on_lparen, "(", BEG|LABEL],
[[1, 6], :on_ident, "a", ARG ],
[[1, 7], :on_rparen, ")", ENDFN ],
[[1, 8], :on_sp, " ", BEG ],
[[1, 9], :on_kw, "nil", END ],
[[1, 12], :on_sp, " ", END ],
[[1, 13], :on_kw, "end", END ]]
# File ripper/lib/ripper/lexer.rb, line 51 def Ripper.lex(src, filename = '-', lineno = 1, **kw) Lexer.new(src, filename, lineno).lex(**kw) end
static VALUE
ripper_lex_state_name(VALUE self, VALUE state)
{
struct parser_params *p;
struct lex_state_name_arg args;
p = rb_parser_params_new();
args.p = p;
args.state = state;
return rb_ensure(lex_state_name0, (VALUE)&args, parser_free, (VALUE)p);
}
创建一个新的 Ripper 对象。src 必须是字符串、IO 或具有 gets 方法的 Object。
此方法不会启动解析。另请参阅 Ripper#parse 和 Ripper.parse。
static VALUE
ripper_initialize(int argc, VALUE *argv, VALUE self)
{
struct ripper *r;
struct parser_params *p;
VALUE src, fname, lineno;
rb_parser_lex_gets_func *gets;
VALUE sourcefile_string;
const char *sourcefile;
int sourceline;
rb_parser_input_data input;
p = ripper_parser_params(self, false);
TypedData_Get_Struct(self, struct ripper, &parser_data_type, r);
rb_scan_args(argc, argv, "12", &src, &fname, &lineno);
if (RB_TYPE_P(src, T_FILE)) {
gets = ripper_lex_io_get;
r->type = lex_type_io;
r->data.val = src;
input = (rb_parser_input_data)src;
}
else if (rb_respond_to(src, id_gets)) {
gets = ripper_lex_get_generic;
r->type = lex_type_generic;
r->data.val = src;
input = (rb_parser_input_data)src;
}
else {
StringValue(src);
gets = ripper_lex_get_str;
r->type = lex_type_str;
r->data.ptr_str.str = src;
r->data.ptr_str.ptr = 0;
input = (rb_parser_input_data)&r->data.ptr_str;
}
if (NIL_P(fname)) {
fname = STR_NEW2("(ripper)");
OBJ_FREEZE(fname);
}
else {
StringValueCStr(fname);
fname = rb_str_new_frozen(fname);
}
rb_ruby_ripper_parser_initialize(p);
sourcefile_string = fname;
sourcefile = RSTRING_PTR(fname);
sourceline = NIL_P(lineno) ? 0 : NUM2INT(lineno) - 1;
rb_ruby_parser_ripper_initialize(p, gets, input, sourcefile_string, sourcefile, sourceline);
return Qnil;
}
解析从 src 读取的给定 Ruby 程序。src 必须是字符串、IO 或具有 gets 方法的对象。
# File ripper/lib/ripper/core.rb, line 18 def Ripper.parse(src, filename = '(ripper)', lineno = 1) new(src, filename, lineno).parse end
- 实验性功能
-
解析
src并创建 S-exp 树。返回比Ripper.sexp_raw更具可读性的树。此方法主要供开发人员使用。filename参数通常被忽略。默认情况下,此方法不处理src中的语法错误,在这种情况下返回nil。使用raise_errors关键字可以在src中出现错误时引发 SyntaxError。require 'ripper' require 'pp' pp Ripper.sexp("def m(a) nil end") #=> [:program, [[:def, [:@ident, "m", [1, 4]], [:paren, [:params, [[:@ident, "a", [1, 6]]], nil, nil, nil, nil, nil, nil]], [:bodystmt, [[:var_ref, [:@kw, "nil", [1, 9]]]], nil, nil, nil]]]]
# File ripper/lib/ripper/sexp.rb, line 35 def Ripper.sexp(src, filename = '-', lineno = 1, raise_errors: false) builder = SexpBuilderPP.new(src, filename, lineno) sexp = builder.parse if builder.error? if raise_errors raise SyntaxError, builder.error end else sexp end end
- 实验性功能
-
解析
src并创建 S-exp 树。此方法主要供开发人员使用。filename参数通常被忽略。默认情况下,此方法不处理src中的语法错误,在这种情况下返回nil。使用raise_errors关键字可以在src中出现错误时引发 SyntaxError。require 'ripper' require 'pp' pp Ripper.sexp_raw("def m(a) nil end") #=> [:program, [:stmts_add, [:stmts_new], [:def, [:@ident, "m", [1, 4]], [:paren, [:params, [[:@ident, "a", [1, 6]]], nil, nil, nil]], [:bodystmt, [:stmts_add, [:stmts_new], [:var_ref, [:@kw, "nil", [1, 9]]]], nil, nil, nil]]]]
# File ripper/lib/ripper/sexp.rb, line 71 def Ripper.sexp_raw(src, filename = '-', lineno = 1, raise_errors: false) builder = SexpBuilder.new(src, filename, lineno) sexp = builder.parse if builder.error? if raise_errors raise SyntaxError, builder.error end else sexp end end
- 实验性功能
-
解析
src并返回与pattern匹配的字符串。pattern应该被描述为正则表达式。require 'ripper' p Ripper.slice('def m(a) nil end', 'ident') #=> "m" p Ripper.slice('def m(a) nil end', '[ident lparen rparen]+') #=> "m(a)" p Ripper.slice("<<EOS\nstring\nEOS", 'heredoc_beg nl $(tstring_content*) heredoc_end', 1) #=> "string\n"
# File ripper/lib/ripper/lexer.rb, line 277 def Ripper.slice(src, pattern, n = 0) if m = token_match(src, pattern) then m.string(n) else nil end end
将 Ruby 程序标记化,并返回一个字符串数组。filename 和 lineno 参数通常被忽略,因为返回值只是标记化的输入。默认情况下,此方法不处理 src 中的语法错误,使用 raise_errors 关键字可以在 src 中出现错误时引发 SyntaxError。
p Ripper.tokenize("def m(a) nil end") # => ["def", " ", "m", "(", "a", ")", " ", "nil", " ", "end"]
# File ripper/lib/ripper/lexer.rb, line 25 def Ripper.tokenize(src, filename = '-', lineno = 1, **kw) Lexer.new(src, filename, lineno).tokenize(**kw) end
公共实例方法
返回当前解析行的列号。此数字从 0 开始。
static VALUE
ripper_column(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, true);
long col;
if (NIL_P(rb_ruby_parser_parsing_thread(p))) return Qnil;
col = rb_ruby_ripper_column(p);
return LONG2NUM(col);
}
获取调试输出。
static VALUE
ripper_parser_get_debug_output(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, false);
return rb_ruby_parser_debug_output(p);
}
设置调试输出。
static VALUE
ripper_parser_set_debug_output(VALUE self, VALUE output)
{
struct parser_params *p = ripper_parser_params(self, false);
rb_ruby_parser_set_debug_output(p, output);
return output;
}
返回源的编码。
static VALUE
ripper_parser_encoding(VALUE vparser)
{
struct parser_params *p = ripper_parser_params(vparser, false);
return rb_enc_from_encoding(rb_ruby_parser_encoding(p));
}
如果解析的源以 +_END_+ 结束,则返回 true。
static VALUE
ripper_parser_end_seen_p(VALUE vparser)
{
struct parser_params *p = ripper_parser_params(vparser, false);
return RBOOL(rb_ruby_parser_end_seen_p(p));
}
如果解析的源有错误,则返回 true。
static VALUE
ripper_error_p(VALUE vparser)
{
struct parser_params *p = ripper_parser_params(vparser, false);
return RBOOL(rb_ruby_parser_error_p(p));
}
返回当前解析的文件名。
static VALUE
ripper_filename(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, true);
return rb_ruby_parser_ruby_sourcefile_string(p);
}
返回当前解析行的行号。此数字从 1 开始。
static VALUE
ripper_lineno(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, true);
if (NIL_P(rb_ruby_parser_parsing_thread(p))) return Qnil;
return INT2NUM(rb_ruby_parser_ruby_sourceline(p));
}
开始解析并返回根操作的值。
static VALUE
ripper_parse(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, true);
VALUE result;
if (!NIL_P(rb_ruby_parser_parsing_thread(p))) {
if (rb_ruby_parser_parsing_thread(p) == rb_thread_current())
rb_raise(rb_eArgError, "Ripper#parse is not reentrant");
else
rb_raise(rb_eArgError, "Ripper#parse is not multithread-safe");
}
rb_ruby_parser_set_parsing_thread(p, rb_thread_current());
result = rb_ensure(ripper_parse0, self, ripper_ensure, self);
RB_GC_GUARD(self);
return result;
}
返回当前标记的扫描器状态。
static VALUE
ripper_state(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, true);
if (NIL_P(rb_ruby_parser_parsing_thread(p))) return Qnil;
return INT2NUM(rb_ruby_parser_lex_state(p));
}
返回当前标记字符串。
static VALUE
ripper_token(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, true);
long pos, len;
VALUE str;
if (NIL_P(rb_ruby_parser_parsing_thread(p))) return Qnil;
pos = rb_ruby_ripper_column(p);
len = rb_ruby_ripper_token_len(p);
str = rb_str_new_parser_string(rb_ruby_ripper_lex_lastline(p));
return rb_str_subseq(str, pos, len);
}
获取 yydebug。
static VALUE
ripper_parser_get_yydebug(VALUE self)
{
struct parser_params *p = ripper_parser_params(self, false);
return RBOOL(rb_ruby_parser_get_yydebug(p));
}
设置 yydebug。
static VALUE
ripper_parser_set_yydebug(VALUE self, VALUE flag)
{
struct parser_params *p = ripper_parser_params(self, false);
rb_ruby_parser_set_yydebug(p, RTEST(flag));
return flag;
}
私有实例方法
当解析器发现语法错误时调用此方法。
# File ripper/lib/ripper/core.rb, line 63 def compile_error(msg) end
static VALUE
parser_dedent_string(VALUE self, VALUE input, VALUE width)
{
struct parser_params *p;
struct dedent_string_arg args;
p = rb_parser_params_new();
args.p = p;
args.input = input;
args.width = width;
return rb_ensure(parser_dedent_string0, (VALUE)&args, parser_free, (VALUE)p);
}
当解析器产生弱警告时调用此方法。fmt 和 args 是 printf 风格的。
# File ripper/lib/ripper/core.rb, line 54 def warn(fmt, *args) end
当解析器产生强警告时调用此方法。fmt 和 args 是 printf 风格的。
# File ripper/lib/ripper/core.rb, line 59 def warning(fmt, *args) end