README.rdoc in yacan-0.1.0 vs README.rdoc in yacan-0.1.1
- old
+ new
@@ -1,8 +1,76 @@
= yacan
+Yahoo!テキスト解析APIをラップするgem
-Description goes here.
+http://developer.yahoo.co.jp/webapi/jlp/
+== Example
+=== 準備
+ # アプリケーションIDを渡す
+ YaCan.appid = '*****'
+
+=== 係り受け解析
+http://developer.yahoo.co.jp/webapi/jlp/da/v1/parse.html
+
+1文ずつ渡さないと変な結果になる
+
+ # 解析
+ d = YaCan::Dependency.parse('DVDが終わるまで私はお二人の足台にさせられました。')
+ d.chunks #=> [0 1 DVDが, 1 5 終わるまで, 2 5 私は, 3 4 お二人の, 4 5 足台に, 5 -1 させられました。]
+ # 文中に含まれるChunk(文節)インスタンスの配列
+ d.morphems #=> [DVD: 名詞,名詞,*,DVD,でぃーぶいでぃー,DVD, が: 助詞,格助詞,*,が,が,が, 終わる: 動詞,ラ五,基本形,終わる,おわ,終わ, まで: 助詞,副助詞,*,まで,まで,まで, 私: 名詞,名詞人,*,私,わたし,私, は: 助詞,係助詞,*,は,は,は, お: 接頭辞,接頭お,*,お,お,お, 二人: 名詞,名詞人,*,二人,ふたり,二人, の: 助詞,助詞連体化,*,の,の,の, 足: 名詞,名詞,*,足,あし,足, 台: 接尾辞,接尾地名,*,台,だい,台, に: 助詞,助詞副詞化,*,に,に,に, させ: 動詞,サ五,連用テ接続,させ,さ,さ, られ: 助動詞,助動詞一段,未然ウ接続,られ,られ,られ, まし: 助動詞,助動詞ます,未然ウ接続,まし,ま,ま, た: 助動詞,助動詞た,基本形,た,た,た, 。: 特殊,句点,*,。,。,。]
+ # 文中に含まれるMorphem(形態素)のインスタンスの配列
+
+ # Chunk
+ chunk = d.chunks[3]
+ chunk.to_s #=> "3 4 お二人の"
+ chunk.id #=> 3 ; 文節ID
+ chunk.dependency #=> 4 ; 係り先のID、なければ-1
+ chunk.morphems #=> [お: 接頭辞,接頭お,*,お,お,お, 二人: 名詞,名詞人,*,二人,ふたり,二人, の: 助,助詞連体化,*,の,の,の]
+ # Morphem(形態素)インスタンスの配列
+ chunk.depends_on #=> 4 5 足台に ; 係り先のChunk、なければnil
+ chunk.depends_from #=> [] ; 係り元のChunkの配列
+
+ # Morphem
+ morphem = chunk.morphems[1]
+ morphem.to_s #=> 二人: 名詞,名詞人,*,二人,ふたり,二人
+ morphem.surface #=> "二人" ; 表記
+ morphem.reading #=> "ふたり" ; 読み
+ morphem.baseform #=> "二人" ; 基本形
+ morphem.pos #=> "名詞" ; 品詞
+ morphem.feature #=> ["名詞", "名詞人", "*", "二人", "ふたり", "二人"] ; 形態素の全情報
+
+
+=== キーフレーズ抽出
+http://developer.yahoo.co.jp/webapi/jlp/keyphrase/v1/extract.html
+
+ # 抽出
+ k = YaCan::Keyphrase.extract('DVDが終わるまで私はお二人の足台にさせられました。')
+
+ k.results #=> [["足台", 100], ["お二人", 85], ["DVD", 65], ["私", 35]]
+ # キーフレーズとスコアのペアの配列
+ k.phrases #=> ["足台", "お二人", "DVD", "私"]
+ k.scores #=> [100, 85, 65, 35]
+
+
+=== 形態素解析
+http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html
+
+作ったけど係り受け解析使えば用は済みそう
+
+ # 解析
+ m = YaCan::Morphem.parse('DVDが終わるまで私はお二人の足台にさせられました。', {'filter' => '9' })
+ # 抽出対象品詞のフィルタとか渡せる、APIのページ見れば分かる感じ
+ m.ma_result.morphems.map(&:surface) #=> ["DVD", "私", "二人", "足", "台"]
+
+あとはコード見てほしい
+
+https://github.com/pokutuna/yacan/blob/master/lib/yacan/morphem.rb
+
+== その他
+* テストは環境変数のYAHOO_API_APPIDをみにいってる
+* 環境変数のhttp_proxyを見て通信してる。YaCan.proxy_host=, YaCan.proxy_port= で設定もできる
+
== Contributing to yacan
* Check out the latest master to make sure the feature hasn't been implemented or the bug hasn't been fixed yet
* Check out the issue tracker to make sure someone already hasn't requested it and/or contributed it
* Fork the project