出たとこデータサイエンス

アラサーでデータサイエンティストになったエンジニアが、覚えたことを書きなぐるためのブログ

2018-12-01から1ヶ月間の記事一覧

SQLのウィンドウ関数で粒度の異なるグルーピングを同時に行う

SQL

背景 SQLで分析をしていると、粒度の異なるグルーピングを同時に行いたくなる場合がある。 例えば何らかの割合を出すために「分子はカラムAとカラムBでGROUP BYしてSUM、分母はカラムBだけでGROUP BYしてSUMしたい」という場合がある。 このような場合に、教…

BigQueryの分割テーブルをちょっとだけ完全に理解する

新しい会社に来て初めてGoogle BigQueryに触っているので、新しく学んだ概念や機能を備忘録として記していきたい。 今日のテーマは分割テーブル。 分割テーブをざっくり要約すると…… 分割テーブルは、巨大なテーブルに対するクエリのパフォーマンスを上げる…