apache-arrow-2019.rab in rabbit-slide-kou-apache-arrow-tokyo-meetup-2019-2019.12.11.0 vs apache-arrow-2019.rab in rabbit-slide-kou-apache-arrow-tokyo-meetup-2019-2019.12.11.1
- old
+ new
@@ -7,13 +7,13 @@
: content-source
Apache Arrow東京ミートアップ2019
: date
2019-12-11
: start-time
- 2019-12-11T19:05:00+09:00
+ 2019-12-11T19:10:00+09:00
: end-time
- 2019-12-11T19:20:00+09:00
+ 2019-12-11T19:25:00+09:00
: theme
.
= Apache Arrowと私
@@ -21,10 +21,17 @@
* 2017-05-10にコミッター
* 2017-09-15にPMCメンバー
* 2018-12-06現在コミット数3位(224人中)
* 2019-12-09現在コミット数2位(348人中)
+= Apache Arrow 1.0.0がでるぞ!
+
+ * たぶん2020年1月か2月あたり
+ * 使い始めるなら今!
+ * 普通のユーザー:リリースされたら試そう
+ * 先進的なみなさん:リリースされたら本格使用!
+
= 今日の目的
Apache Arrow\n
ユーザーを\n
増やす
@@ -124,11 +131,11 @@
なにもしなければ最速!
* データフォーマットを定義
* ほぼパースいらずなので速い!
* シリアライズ・デシリアライズが高速化!
- * このフォーマットの普及
+ * このフォーマットを普及
* 各種言語で読み書き処理を実装
* みんなが使えばフォーマット変換いらずで速い!
= Apache Sparkでの高速化事例
@@ -396,17 +403,25 @@
* データの高速な計算は一部言語で対応
* C++ベース、Java、Rust(DataFusion)、Go
* フォーマット変換も各言語の対応は様々
-= ユースケース
+= ユースケース(1)
* PostgreSQLの高速化
* 海外さんがPG-Stromの事例を紹介!
* TensorFlow・BitQuery Storage APIが\n
Apache Arrowをサポート
* 石崎さんと漆山さんが紹介!
+
+= ユースケース(2)
+
* FluentdでログデータをApache Arrow化
+ * プラグインあり
+ * Groongaに高速データロード
+ * Groonga:全文検索エンジン
+ * Fluentdで集めたログデータを\n
+ Apache Arrowで流し込んで高速検索
= 今日の目的
Apache Arrow\n
ユーザーを\n