RubygemsResearch

Sha256: d0bb0f199fd0419171e51121ec3fa740d3fbf4c4af7e9edfdc599acb065d9991

Contents?: true

Size: 1.57 KB

Versions: 54

Compression:

Stored size: 1.57 KB

# Modified from: https://github.com/severinh/nanoc-lunr-js-search/blob/master/lib/nanoc/filters/lunr_js_search.rb
require 'json'
require 'nokogiri'

class SearchFilter < Nanoc::Filter
  identifier :search

  def run(content, params={})
    doc = Nokogiri::HTML(content)
    url = assigns[:item_rep].path
    #first_image = doc.xpath('//img/@src').to_a[0]
    document = {
      title: extract_first(doc, '//article//*[self::h1 or self::h2]/text()'),
      subtitle: extract_first(doc, '//article//*[self::h3]/text()'),
      body: extract_all(doc, '//article//*/text()'),
      #img: (first_image.nil?) ? '' : first_image.value(),
      #alt: extract_values(doc, '//article//img/@alt')
    }

    if File.exist?(search_file)
      documents = JSON.parse(File.read(search_file))
    else
      documents = {}
    end

    documents[url] = document

    File.open(search_file, 'w') do |file|
      file.write(JSON.pretty_generate(documents))
    end

    content
  end

  def search_file
    @search_file ||= File.join(@site.config[:output_dir],
      @site.config[:search_file] || 'search.json')
  end

  def extract_first(doc, path)
    extract_text(doc, path).first
  end

  def extract_all(doc, path)
    extract_text(doc, path).join(' ')
  end

  def extract_text(doc, path)
    doc.xpath(path).to_a.map { |t|
      t.content.gsub('\r', ' ').gsub('\n', ' ').squeeze(' ').strip
    }.reject { |t|
      t.empty?
    }
  end

  def extract_values(doc, path)
    tokens = doc.xpath(path).to_a.map { |t|
      t.value().gsub('\r', ' ').gsub('\n', ' ').squeeze(' ').strip
    }
    tokens.join(' ')
  end
end

Version data entries

54 entries across 54 versions & 1 rubygems

Version	Path
origen-0.7.5	templates/nanoc/lib/search_filter.rb
origen-0.7.4	templates/nanoc/lib/search_filter.rb
origen-0.7.3	templates/nanoc/lib/search_filter.rb
origen-0.7.2	templates/nanoc/lib/search_filter.rb
origen-0.7.1	templates/nanoc/lib/search_filter.rb
origen-0.7.0	templates/nanoc/lib/search_filter.rb
origen-0.6.12	templates/nanoc/lib/search_filter.rb
origen-0.6.11	templates/nanoc/lib/search_filter.rb
origen-0.6.10	templates/nanoc/lib/search_filter.rb
origen-0.6.9	templates/nanoc/lib/search_filter.rb
origen-0.6.8	templates/nanoc/lib/search_filter.rb
origen-0.6.7	templates/nanoc/lib/search_filter.rb
origen-0.6.6	templates/nanoc/lib/search_filter.rb
origen-0.6.5	templates/nanoc/lib/search_filter.rb
origen-0.6.4	templates/nanoc/lib/search_filter.rb
origen-0.6.3	templates/nanoc/lib/search_filter.rb
origen-0.6.2	templates/nanoc/lib/search_filter.rb
origen-0.6.1	templates/nanoc/lib/search_filter.rb
origen-0.6.0	templates/nanoc/lib/search_filter.rb
origen-0.5.11	templates/nanoc/lib/search_filter.rb