RubygemsResearch

Sha256: 3e8b97b2e3f478468abf1af409d15bb359e9a4a5b74c31e711e1932f475c3d1e

Contents?: true

Size: 1.69 KB

Versions: 11

Compression:

Stored size: 1.69 KB

#!/usr/bin/env ruby
require 'rubygems'
require 'rmmseg'
require 'rmmseg/ferret'

# dictionaries needed to be explicitly loaded
RMMSeg::Dictionary.load_dictionaries
  
analyzer = RMMSeg::Ferret::Analyzer.new { |tokenizer|
  Ferret::Analysis::LowerCaseFilter.new(tokenizer)
}

$index = Ferret::Index::Index.new(:analyzer => analyzer)

$index << {
  :title => "分词",
  :content => "中文分词比较困难，不像英文那样，直接在空格和标点符号的地方断开就可以了。"
}
$index << {
  :title => "RMMSeg",
  :content => "RMMSeg 我近日做的一个 Ruby 中文分词实现，下一步是和 Ferret 进行集成。"
}
$index << {
  :title => "Ruby 1.9",
  :content => "Ruby 1.9.0 已经发布了，1.9 的一个重大改进就是对 Unicode 的支持。"
}
$index << {
  :title => "Ferret",
  :content => <<END
Ferret is a high-performance, full-featured text search engine library
written for Ruby. It is inspired by Apache Lucene Java project. With
the introduction of Ferret, Ruby users now have one of the fastest and
most flexible search libraries available. And it is surprisingly easy
to use.
END
}

def highlight_search(key)
  $index.search_each(%Q!content:"#{key}"!) do |id, score|
    puts "*** Document \"#{$index[id][:title]}\" found with a score of #{score}"
    puts "-"*40
    highlights = $index.highlight("content:#{key}", id,
                                  :field => :content,
                                  :pre_tag => "\033[36m",
                                  :post_tag => "\033[m")
    puts "#{highlights}"
    puts ""
  end
end

ARGV.each { |key|
  puts "\033[33mSearching for #{key}...\033[m"
  puts ""
  highlight_search(key)
}

# Local Variables:
# coding: utf-8
# End:

Version data entries

11 entries across 11 versions & 3 rubygems

Version	Path
lijia-rmmseg-cpp-10.2.9.2	misc/ferret_example.rb
rmmseg-cpp-traditional-2.0.4	misc/ferret_example.rb
rmmseg-cpp-traditional-2.0.2	misc/ferret_example.rb
rmmseg-cpp-traditional-2.0.0	misc/ferret_example.rb
rmmseg-cpp-traditional-1.0.1	misc/ferret_example.rb
rmmseg-cpp-traditional-1.0.0	misc/ferret_example.rb
rmmseg-cpp-traditional-0.0.2	misc/ferret_example.rb
rmmseg-cpp-0.2.9	misc/ferret_example.rb
rmmseg-cpp-0.2.6	misc/ferret_example.rb
rmmseg-cpp-0.2.7	misc/ferret_example.rb
rmmseg-cpp-0.2.5	misc/ferret_example.rb