年に一度しか更新しないようなブログとなっていますが、今年もとりあえず自分のために2025年の学びと振り返りをしていこうと思います。
2025年できたこと、学び
2025年はイベントが多かった2024年に比べどちらかと言えば次の年へ向けて準備する一年になりました。
- 仕事面
- メインは次の年のプロモーションへ向けて準備する一年になりました。今年はほとんどのプロジェクトが自分がメインでリードするプロジェクトとなり、プロジェクト以外にもメンターとしてインターン生を担当したり、プロジェクト外のツールに新たな機能を追加したり、あとはとにかく提案ドキュメントを大量に書いた。
- メインの技術ドメインである、Spark, Airflow, Hive HMS, Yarn, k8s, Trinoの深い理解を深めることができ、Spark、Airflowについては夏休みをとって、コードベースを一から読むことにした。
- 最近はプロジェクトの仕事を早く終え、できるだけ社内のforkしたこれらのrepoに新たな機能を加えたり、SEVが起きた時に調査に貢献したりした。インパクトドリブン開発という考えは好きではないが、社会人である以上嫌いなことをある程度割り切ってやっている。
- プロモの話をすると長くなってしまいますが、プロジェクトはデリバーして当たり前という評価にしかならない、かつ自分の興味のある深掘りした技術調査とそのoptimizationは社内のプロジェクトではできないため、こうやってプロジェクト外で個人的に開発して、ある程度のものができたら面倒な承認プロセスを経て、みんなに共有してます。
- 仕事外の個人プロジェクト
- 自分の深掘りたい分野で仕事ではfundingがおりないような技術は週末に個人プロジェクトとして、触ってみたり調べてみたりすることにした。LLMのtrainingに必要なcommon crawlerの情報を品質を効率よくフィルタリし、整理し、LLM training pipelineに渡す用のデータを作るspark ML libのようなものを個人的に作ってみたりしています。私費でAWS EMRを立ち上げ、terraformで一元管理し、作ったlibraryでインターネットscaleのデータをprocessするlibraryをまだWIPですが、準備中。個人プロジェクト一番の難題はAWSのコスト。これとどこまで折り合いをつけるか。
- あと今までpysparkでapplication側は書いてきましたが、初めてlibrary側として機能を作るので、scalaをちゃんと勉強する必要が出てきました。今まで避けてきたので作りながらscalaを勉強する。やはり最高の勉強はものを作りながら学ぶこと。
- 家庭
- 第一子が年明け産まれることとなりました。父として準備する一年でした。
- 今後子育てとTechでの仕事が大変になりそうですが、自分なりに努力していきます。
- 生活関係
- 昨年にカナダでの永住権を取得してから二年目となり、オンタリオでドライバーライセンスも取得。第一子が2ヶ月後に産まれるため、新しい物件の契約が無事決まり、今よりも広い物件に引越しが決まった。
来年目指すこと
- 子育てとtechの両立を頑張る、家族の時間を意識的にとる
- 仕事/技術面で言えば、準備の一年だった2025年の努力が実ること
- 社内
- さらなるリーダーシップを発揮する。
- ICEBERGをもっと深掘りする。
- 社外の個人プロジェクトを良いベンチマーキングを叩き出すこと。
- 今まで避けてきたscalaをプロフェッショナルレベルでかけるレベルに持っていく。
- 社内
- その他
- 2027,2028年に向けた将来設計をする。