Sha256: 46235d9ffcf2533a99ecae3e34549d1607330859f6f5017f23f4926e3a64f068

Contents?: true

Size: 1.64 KB

Versions: 10

Compression:

Stored size: 1.64 KB

Contents

module PragmaticTokenizer
  module Languages
    module Latvian
      include Languages::Common
      ABBREVIATIONS = [].freeze
      STOP_WORDS = ["aiz", "ap", "ar", "apakš", "ārpus", "augšpus", "bez", "caur", "dēļ", "gar", "iekš", "iz", "kopš", "labad", "lejpus", "līdz", "no", "otrpus", "pa", "par", "pār", "pēc", "pie", "pirms", "pret", "priekš", "starp", "šaipus", "uz", "viņpus", "virs", "virspus", "zem", "apakšpus", "un", "bet", "jo", "ja", "ka", "lai", "tomēr", "tikko", "turpretī", "arī", "kaut", "gan", "tādēļ", "tā", "ne", "tikvien", "vien", "kā", "ir", "te", "vai", "kamēr", "diezin", "droši", "diemžēl", "nebūt", "ik", "it", "taču", "nu", "pat", "tiklab", "iekšpus", "nedz", "tik", "nevis", "turpretim", "jeb", "iekam", "iekām", "iekāms", "kolīdz", "līdzko", "tiklīdz", "jebšu", "tālab", "tāpēc", "nekā", "itin", "jā", "jau", "jel", "nē", "nezin", "tad", "tikai", "vis", "tak", "iekams", "būt", "biju", "biji", "bija", "bijām", "bijāt", "esmu", "esi", "esam", "esat", "būšu   ", "būsi", "būs", "būsim", "būsiet", "tikt", "tiku", "tiki", "tika", "tikām", "tikāt", "tieku", "tiec", "tiek", "tiekam", "tiekat", "tikšu", "tiks", "tiksim", "tiksiet", "tapt", "tapi", "tapāt", "topat", "tapšu", "tapsi", "taps", "tapsim", "tapsiet", "kļūt", "kļuvu", "kļuvi", "kļuva", "kļuvām", "kļuvāt", "kļūstu", "kļūsti", "kļūst", "kļūstam", "kļūstat", "kļūšu", "kļūsi", "kļūs", "kļūsim", "kļūsiet", "varēt", "varēju", "varējām", "varēšu", "varēsim", "var", "varēji", "varējāt", "varēsi", "varēsiet", "varat", "varēja", "varēs"].freeze
      CONTRACTIONS = {}.freeze
    end
  end
end

Version data entries

10 entries across 10 versions & 1 rubygems

Version Path
pragmatic_tokenizer-1.4.0 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.3.1 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.3.0 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.2.0 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.1.2 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.1.1 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.1.0 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.0.2 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.0.1 lib/pragmatic_tokenizer/languages/latvian.rb
pragmatic_tokenizer-1.0.0 lib/pragmatic_tokenizer/languages/latvian.rb