データアナリストになりたての頃に勉強していたこと & 読んでいた本を紹介します。
「これからデータ分析の勉強を始めようと思うけど何から始めればいいの?」って方の参考になれば幸いです。
・転職等でデータアナリストになろうとしている方
・データアナリスト1年目~2年目の方
・データ分析の勉強をしたいけど何をすれば良いかわからない方
高速でSQLを書けるようになるためにやったこと
意識してSQLを速く書こうと思っていたわけではないですが、結果的にSQLが速く書けるようになった勉強方法を紹介します。SQLが速く書けると仕事の効率が上がるので、修得に一定の時間を割くべきだと思っています。
① SQLの本を読んで勉強
実践的なSQLの書き方を修得するために、「ビッグデータ分析・活用のためのSQLレシピ」という本を読みました。移動平均やヒストグラムなど、日々の業務でよく使うコードの書き方を学べます。
この本の素晴らしい点は、単にSQLの書き方がわかるだけでなく分析の引き出しも増えること。
売上の構造を把握するための分析やユーザーの定着率の分析など、かなり実践的なトピックを扱っているので、めちゃくちゃ参考になりました。
② 先輩が書いたコードを写経した
写経とは、お手本となるコードを書き写すことです。先輩が書いたSQLの写経をすることで、複雑なコードが速く書けるようになりました。
具体的には、会社の先輩が書いた「複雑で難解に見える数百行のコード」を1行目から書き写していきました。
もちろん、漫然と書き写すだけでは全く意味がないので、途中のサブクエリを実行しつつ「なぜこんな書き方をする必要があるのか?」を考えながら写経しました。
実行結果を逐一確認しながらコードを読み解いていくと、「複雑で難解だったコード」が「理にかなっていて実はスマート」だったことがわかりました。
こうやってお手本となる先輩が書いたコードを何度か写経するうちに、速く正確にSQLが書けるようになったと思います。
東大出版の「統計学入門」を丁寧に読んだ
「赤本」という名で親しまれ、統計学の勉強をしている人なら知らない人はいないであろう名著「統計学入門(東大出版)」を読みました。
やはり名著と言われるだけあって、読みやすさと内容の充実度が抜群に良いです。
日本語での説明が素晴らしくて、「統計学の気持ち」がスッと理解できます。
他の本では曖昧に書かれているところも丁寧に説明されていて、「そうだったのか!」と感激することもしばしば。
私はこの本を、ノートにメモを取りながら丁寧に読んでいきました。ほぼ写経のような形ですね。
もし赤本の序盤でつまづきそうなら…
逆に言えば、かなり丁寧に読まないと消化不良を起こすと思います。
入門書ではありますが、一定の読解力と数学力が求められるため、それなりの覚悟を持って読むべきかなと。
もし、この赤本の序盤でつまづきそうなら、他の本から読んでいくことをオススメします。
大学1年生レベルの数学に不安があるなら、マセマシリーズのような本で基礎固めしましょう。
この本で高校数学の復習をしつつ、受験勉強のような感覚で演習問題をこなしていけば赤本を読むのに必要な基礎が身につくと思います。
ざっくり機械学習の勉強をした
実務で使う必要があったため機械学習の勉強もしました。
「そもそも機械学習って何?」というレベルだったので、YouTube で適当に動画を見漁ってざっくり理解していきました。
「なんとなく機械学習が分かったつもり」になったところで、「Pythonではじめる機械学習」という本を、実際に手を動かしながら丁寧に読みました。scikit-learn を使って、教師あり学習、教師なし学習、モデルの評価などを学べます。「機械学習が何なのか」を Python を書きながら理解するのには最適な本です。
機械学習をもっと基礎から勉強すべく、「はじめてのパターン認識」という本にも挑戦しました。こちらも名著として名高いのですが、残念ながら途中で挫折…
あと、ディープラーニングの勉強もしたくて「ゼロから作るDeep Learning」というこれまた名著を読もうとしたのですが、途中で何のコードを書いているのか分からなくなって挫折しました(笑)
以上の通り、データアナリスト1年目の時点ではあまり機械学習の勉強はできていなかったです。
一応、「Pythonではじめる機械学習」の内容は理解できていたので、実務で(ごく簡単な)機械学習を使う分には困らなかったです。
因果推論に入門した
こちらも実務で使う必要があったため因果推論の勉強をしました。
読んだ本は以下の2冊です。
RCT(ABテスト)ができない場合に因果推論を用いて効果検証をする方法が書かれています。
特に、「傾向スコアマッチング」や「差分の差分法」について詳しく説明されています。
「効果検証入門」の方では、例としてDMを送った際の効果を検証するために、「DMを送ったグループ」と「DMを送らなかったグループ」にどのような処理をして比較すれば良いかが書かれていて、とても実用的でした。
その他データ分析関連の本
その他、データ分析関連で読んでいた本をざっと紹介します。
イシューからはじめよ
安宅和人さんの「イシューからはじめよ」は、初版から10年以上経った現代でも色褪せない名著で、「問題解決の決定版」と言われています。
イシュードリブン(解くべき問題を見極める)という考え方は、データアナリストにも必須です。
常に「今直面しているイシューは何で、データアナリストとして何を分析すべきか?」という問いを繰り返し、本質的な課題発見につなげていました。
この本に書いてあることが実践できれば、漫然と分析をしているデータアナリストよりは高いパフォーマンスが出せるはずです。
仮説思考
内田和成さんの「仮説思考」も問題解決の名著です。
仕事の速さ・出来栄えを決めるのは「分析力ではなく、仮説である」という至言。
やはり良い仮説あってこその良いデータ分析だなと思います。筋のいい仮説を見つける方法が書かれていて、参考になりました。こちらもデータアナリストの仕事に活きる一冊です。
データ分析の力―因果関係に迫る思考法
伊藤公一朗さんの「データ分析の力―因果関係に迫る思考法」は、数式を使わずに因果関係の考え方を学べる本です。新書なので読みやすいですね。ランダム化比較試験(ABテスト)の本質がわかりやすく書かれていて、目から鱗だった記憶があります。
以上ですっ!
コメント