Sha256: 405d06a6241bce071c9ec5c5793cd27601ec932da9506253aed84cc25c4b7834

Contents?: true

Size: 1.17 KB

Versions: 4

Compression:

Stored size: 1.17 KB

Contents

# coding: utf-8
require 'minitest/autorun'
require 'minitest/spec'
require 'tokenizer'

class TestTokenizer < Minitest::Test

  def setup
    @t = Tokenizer::Tokenizer.new(:de)
  end

  def test_constants
    assert(Tokenizer::VERSION.is_a?(String) && !Tokenizer::VERSION.empty?)
  end

  def test_output_type
    output = @t.tokenize('ich gehe in die Schule')
    assert(output.is_a?(Array))
  end

  def test_tokenization_001
    input = 'Ich ging in die Schule!'
    etalon = %w(Ich ging in die Schule !)
    output = @t.tokenize(input)
    assert_equal(etalon, output)
  end

  def test_tokenization_002
    input = '" Es ist wirklich schwer zu sagen , welche Positionen er einnimmt , da er sich noch nicht konkret geäußert hat " , beklagen Volkswirte .'
    etalon = %w(" Es ist wirklich schwer zu sagen , welche Positionen er einnimmt , da er sich noch nicht konkret geäußert hat " , beklagen Volkswirte .)
    output = @t.tokenize(input)
    assert_equal(etalon, output)
  end
end

describe Tokenizer do
  describe 'empty input' do
    it 'should return an Array with an empty string' do
      tokens = Tokenizer::Tokenizer.new.tokenize('')
      tokens.must_equal([''])
    end
  end
end

Version data entries

4 entries across 4 versions & 2 rubygems

Version Path
metanorma-cli-1.3.4 gems/ruby/2.6.0/gems/tokenizer-0.3.0/test/regression_tests/test_de_tokenizer.rb
metanorma-cli-1.3.3.1 gems/ruby/2.6.0/gems/tokenizer-0.3.0/test/regression_tests/test_de_tokenizer.rb
tokenizer-0.3.0 test/regression_tests/test_de_tokenizer.rb
tokenizer-0.2.0 test/regression_tests/test_de_tokenizer.rb