Sha256: df6d36e4f5833ef4fa87a0efe1989324d7e501de3957d7971ab72e7aba16294c

Contents?: true

Size: 1.82 KB

Versions: 2

Compression:

Stored size: 1.82 KB

Contents

require "ruby-spacy"
require "terminal-table"

nlp = Spacy::Language.new("ja_core_news_lg")
doc = nlp.read("任天堂は1983年にファミコンを14,800円で発売した。")

headings = ["text", "lemma", "pos", "tag", "dep"]
rows = []

doc.each do |token|
  rows << [token.text, token.lemma, token.pos, token.tag, token.dep]
end

table = Terminal::Table.new rows: rows, headings: headings
puts table

# +------------+------------+-------+--------------------------+--------+
# | text       | lemma      | pos   | tag                      | dep    |
# +------------+------------+-------+--------------------------+--------+
# | 任天堂     | 任天堂     | PROPN | 名詞-固有名詞-一般       | nsubj  |
# | は         | は         | ADP   | 助詞-係助詞              | case   |
# | 1983       | 1983       | NUM   | 名詞-数詞                | nummod |
# | 年         | 年         | NOUN  | 名詞-普通名詞-助数詞可能 | obl    |
# | に         | に         | ADP   | 助詞-格助詞              | case   |
# | ファミコン | ファミコン | NOUN  | 名詞-普通名詞-一般       | obj    |
# | を         | を         | ADP   | 助詞-格助詞              | case   |
# | 14,800     | 14,800     | NUM   | 名詞-数詞                | fixed  |
# | 円         | 円         | NOUN  | 名詞-普通名詞-助数詞可能 | obl    |
# | で         | で         | ADP   | 助詞-格助詞              | case   |
# | 発売       | 発売       | VERB  | 名詞-普通名詞-サ変可能   | ROOT   |
# | し         | する       | AUX   | 動詞-非自立可能          | aux    |
# | た         | た         | AUX   | 助動詞                   | aux    |
# | 。         | 。         | PUNCT | 補助記号-句点            | punct  |
# +------------+------------+-------+--------------------------+--------+

Version data entries

2 entries across 2 versions & 1 rubygems

Version Path
ruby-spacy-0.1.4.1 examples/japanese/pos_tagging.rb
ruby-spacy-0.1.4 examples/japanese/pos_tagging.rb