RubygemsResearch

Sha256: d7fb7760544dc36e99f6b114c73a68ee01b4e41abcae5bab2771260661195186

Contents?: true

Size: 1.5 KB

Versions: 33

Compression:

Stored size: 1.5 KB

# encoding: UTF-8

# Copyright 2012 Twitter, Inc
# http://www.apache.org/licenses/LICENSE-2.0

module TwitterCldr
  module Tokenizers
    class RbnfTokenizer

      def tokenize(pattern)
        PatternTokenizer.new(nil, tokenizer).tokenize(pattern)
      end

      private

      def tokenizer
        @tokenizer ||= begin
          recognizers = [
            # special rule descriptors
            TokenRecognizer.new(:negative, /-x/),
            TokenRecognizer.new(:improper_fraction, /x\.x/),
            TokenRecognizer.new(:proper_fraction, /0\.x/),
            TokenRecognizer.new(:master, /x\.0/),

            # normal rule descriptors
            TokenRecognizer.new(:equals, /=/),
            TokenRecognizer.new(:rule, /%%?[[:word:]-]+/),  # i.e. %spellout-numbering, %%2d-year
            TokenRecognizer.new(:right_arrow, />/),
            TokenRecognizer.new(:left_arrow, /</),
            TokenRecognizer.new(:open_bracket, /\[/),
            TokenRecognizer.new(:close_bracket, /\]/),
            TokenRecognizer.new(:decimal, /[0#][0#,\.]*/),
            TokenRecognizer.new(:plural, /\$\(.*\)\$/),

            # ending
            TokenRecognizer.new(:semicolon, /;/),
          ]

          splitter_source = recognizers.map { |r| r.regex.source }.join("|")
          splitter = Regexp.new("(#{splitter_source})")

          Tokenizer.new(
            recognizers + [
              TokenRecognizer.new(:plaintext, //)  # catch-all
            ], splitter
          )
        end
      end

    end
  end
end

Version data entries

33 entries across 33 versions & 2 rubygems

Version	Path
twitter_cldr-6.14.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.13.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.12.1	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.12.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.11.5	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.11.4	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.11.3	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.11.2	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.11.1	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.11.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.10.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.9.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.8.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.7.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.6.2	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.6.1	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.6.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.5.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.4.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb
twitter_cldr-6.3.0	lib/twitter_cldr/tokenizers/numbers/rbnf_tokenizer.rb