DeNAのデータ分析基盤
App -> LogGateway
- LogGatewayで認証したサービスのログを受け取る
- Log
- Fluentd
- DB SnapShot
- オンプレの場合はApache Sqoopというもので収集
- Log
Hadoop
- データレイクとして使用
- HiveQL使用者のためにHue提供していたり
- サービスごとに、分けて異なるHDFSパスへ
HDFS -> Vertica or BIgQuery
- 内製のバルクロードツール「Medjed」を使用
ダッシュボード
- 柔軟な対応ができる内製ダッシュボード「Argus」を使用
- クエリエンジン
- Google BigQuery
- HP Vertica
- 細かな要望に素早く対応できる
- 社内に合わせた細かな権限管理を行える
- ActiveDirectoryのグループに合わせた管理・編集・閲覧それぞれの権限を付与できる
- 権限管理やグルーピングなどのかゆいところに手が届くのがポイント