RubygemsResearch

Sha256: 5816a961552f688d5f45e04edf03082050d4c0d4626e58ccecec5bda56e278fc

Contents?: true

Size: 1.57 KB

Versions: 16

Compression:

Stored size: 1.57 KB

module Onebox
  module Engine
    class PubmedOnebox
      include Engine
      include LayoutSupport

      matches do
        http
        domain("www.ncbi.nlm.nih")
        tld("gov")
        has("/pubmed/")
      end

      private

      def get_xml
        doc = Nokogiri::XML(open(@url + "?report=xml&format=text"))
        pre = doc.xpath("//pre")
        Nokogiri::XML("<root>" + pre.text + "</root>")
      end

      def authors_of_xml(xml)
        initials = xml.css("Initials").map{|x| x.content}
        last_names = xml.css("LastName").map{|x| x.content}
        author_list = (initials.zip(last_names)).map{|i,l| i + " " + l}
        if author_list.length > 1 then
          author_list[-2] = author_list[-2] + " and " + author_list[-1]
          author_list.pop
        end
        author_list.join(", ")
      end

      def date_of_xml(xml)
        date_arr = (xml.css("PubDate")[0].children).map{|x| x.content}
        date_arr = date_arr.select{|s| !s.match(/^\s+$/)}
        date_arr = (date_arr.map{|s| s.split}).flatten
        date_arr.sort.reverse.join(" ") # Reverse sort so month before year.
      end

      def data
         xml = get_xml()
         {
         title: xml.css("ArticleTitle")[0].content,
         authors: authors_of_xml(xml),
         journal: xml.css("Title")[0].content,
         abstract: xml.css("AbstractText")[0].content,
         date: date_of_xml(xml),
         link: @url,
         pmid: match[:pmid]
        }
      end

      def match
        @match ||= @url.match(%r{www\.ncbi\.nlm\.nih\.gov/pubmed/(?<pmid>[0-9]+)})
      end
    end
  end
end

Version data entries

16 entries across 16 versions & 1 rubygems

Version	Path
onebox-1.3.8	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.7	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.6	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.5	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.4	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.3	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.2	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.1	lib/onebox/engine/pubmed_onebox.rb
onebox-1.3.0	lib/onebox/engine/pubmed_onebox.rb
onebox-1.2.9	lib/onebox/engine/pubmed_onebox.rb
onebox-1.2.8	lib/onebox/engine/pubmed_onebox.rb
onebox-1.2.7	lib/onebox/engine/pubmed_onebox.rb
onebox-1.2.6	lib/onebox/engine/pubmed_onebox.rb
onebox-1.2.5	lib/onebox/engine/pubmed_onebox.rb
onebox-1.2.4	lib/onebox/engine/pubmed_onebox.rb
onebox-1.2.3	lib/onebox/engine/pubmed_onebox.rb