RubygemsResearch

Sha256: fc66c04f8ffdace8b25f5204a79fdde0e3a65e5767db7902259ff220264d5170

Contents?: true

Size: 1.49 KB

Versions: 4

Compression:

Stored size: 1.49 KB

# encoding: UTF-8

# Copyright 2012 Twitter, Inc
# http://www.apache.org/licenses/LICENSE-2.0

require 'spec_helper'

include TwitterCldr::Tokenizers

describe TimeTokenizer do
  describe "#tokens" do
    it "should tokenize a time string correctly (i.e. German)" do
      data_reader = TimeDataReader.new(:de, :type => :full)
      got = data_reader.tokenizer.tokenize(data_reader.pattern)
      expected  = [
        { :value => "HH", :type => :pattern },
        { :value => ":", :type => :plaintext },
        { :value => "mm", :type => :pattern },
        { :value => ":", :type => :plaintext },
        { :value => "ss", :type => :pattern },
        { :value => " ", :type => :plaintext },
        { :value => "zzzz", :type => :pattern }
      ]
      check_token_list(got, expected)
    end

    it "should tokenize patterns with non-latin characters correctly (i.e. Korean)" do
      data_reader = TimeDataReader.new(:ko, :type => :full)
      got = data_reader.tokenizer.tokenize(data_reader.pattern)
      expected  = [
        { :value => "a", :type => :pattern },
        { :value => " ", :type => :plaintext },
        { :value => "h", :type => :pattern },
        { :value => "시 ", :type => :plaintext },
        { :value => "m", :type => :pattern },
        { :value => "분 ", :type => :plaintext },
        { :value => "s", :type => :pattern },
        { :value => "초 ", :type => :plaintext },
        { :value => "zzzz", :type => :pattern }
      ]
      check_token_list(got, expected)
    end
  end
end

Version data entries

4 entries across 4 versions & 1 rubygems

Version	Path
twitter_cldr-3.0.3	spec/tokenizers/calendars/time_tokenizer_spec.rb
twitter_cldr-3.0.2	spec/tokenizers/calendars/time_tokenizer_spec.rb
twitter_cldr-3.0.1	spec/tokenizers/calendars/time_tokenizer_spec.rb
twitter_cldr-3.0.0	spec/tokenizers/calendars/time_tokenizer_spec.rb