社員の技術力やスキル研鑽を支援する!社内図書館「ARISE library」とおすすめ書籍紹介

始めに

こんにちは。2020年4月に新卒として入社したMarketing Solution Division所属兼ARISE図書委員の小林と申します。

今回の記事は、ARISE library&書籍購入補助制度について概要を説明し、それらを利用して私が読んだ本について紹介いたします。ARISE analyticsにはデータサイエンティストの技術力やスキルアップのための制度や環境があることを知っていただけると幸いです。

ARISE library&書籍購入補助制度とはARISE libraryについて~

ARISE libraryとはオフィスのカフェスペース内に本棚が置いてある場所と、置いている本の貸出制度や書籍貸出管理システムのことを指します。きれいな本棚と観葉植物があり、ヒカリエ31Fからの景色を眺めることができる空間なので個人的に好きです!(出社時は気分転換に、カフェスペースに移動してオンラインMTGに参加することもあります)

ARISE analyticsで働く従業員は貸出に必要な手続きを踏めば自由に本を借りることができます。

機械学習、マーケティング、コンサルティング、ビジネストレンド、人事など、様々な本がカテゴリー分けして配置されており 、自分が必要な本を探しやすい設計になっています。様々なカテゴリの本が置いてあり、幅広いテーマの本に触れることができます。

読みたいけど本棚にない本は書籍購入補助制度を使って、本を購入することができます。また読まなくなった本を寄贈することもできます。

~書籍購入補助制度について~

続いて書籍購入補助制度の詳しい内容について紹介します。書籍の費用を会社が負担し、購入した本の感想やレビューを専用のslackチャンネルに投稿後、納本するルールとなっています。

実質無料で本を読むことができ、その本を全社員へ共有できる制度は素晴らしいなと思っています。普段他の人がどんな本を読んで自己研鑽をしているかを知るきっかけにもなりますし、本を買うお金も節約できます! 笑

ARISE図書委員が開発を手掛ける「書籍貸出管理システム」

ちなみに私が所属するARISE図書委員には、データサイエンティストやエンジニアなどが所属しており、ARISE library運営に欠かせない「書籍貸出管理システム」を業務の合間を縫って自分たちで開発しています。開発の裏話等は以前こちらの記事にまとめてあるので、宜しければご覧ください!(https://www.ariseanalytics.com/activities/report/20200908/

最近は本システムをさらにアップデートし、過去に自分が借りた書籍の一覧が表示されたり、従業員それぞれの行動ログをもとにしたおすすめ書籍が表示されるレコメンドエンジンが組み込まれたり、様々な機能を追加で実装しています。

次章では、レコメンドエンジンの導入に関して、担当した野尻さんに開発の裏話を紹介していただきます。

書籍貸出管理システム開発担当による 機能アップデートの裏話

こんにちは。ARISE図書委員で書籍貸出管理システム開発を担当している野尻です。

書籍貸出管理システムのレコメンドエンジンは、リストを計算する部分と、リストの配信を行う部分に分かれています。全体構成は以下の図になります。

まず、リスト配信部分ですが、「API Gateway」、「Lambda」、「Dynamo DB」を用いて、レコメンドの配信を行っています。

この部分の責務は2つあり、1つ目が「ユーザが書籍をクリックしたログを取得する」ことで2つ目が「事前に計算したレコメンドリストをフロントエンドに連携する」ことになります。

1つ目の「ユーザが書籍をクリックしたログを取得する」については、ユーザが書籍貸出管理システムにおいて書籍をクリックした瞬間に、クリックした書籍のID・ユーザID・日時がAPI Gatewayにパラメータとして投げられ、それをトリガーとしてLambdaが実行され、最終的にDynamo DBにログとして登録されます。こちらのログは、後述するレコメンド計算部分に用いられます。

2つ目の「事前に計算したレコメンドリストをフロントエンドに連携する」については、ユーザがログインして書籍貸出管理システムを開いた際に、ユーザIDがAPI Gatewayにパラメータとして投げられ、それをトリガーとしてLambdaが実行されます。Lambdaの中では、事前にレコメンドリストが保管されているDynamo DBにユーザIDをキーとしてクエリを投げ、レコメンドリストを取得し、そのリストをAPI Gatewayに返却する、という動作を行っています。

その後API Gatewayからフロントエンドに連携され、画面に表示する、というような流れになっています。

次にレコメンド計算部分についてですが、計算を行うための基盤については「AWS lambda」を使用しており、その上でPythonを動作させて計算しています。
lambda上でプログラムを動かすためには、直でlambdaにコードを書くか、コンテナイメージをデプロイしてコンテナ上で動作させる、というような選択肢があるのですが、今回はソースコードの管理のしやすさと新しいコードをデプロイするときの利便性を考え、ECRを用いてコンテナイメージを管理して、そこからlambdaにデプロイする、という構成にしました。
そのように構成されたlambdaをEvent Bridgeを利用して、日次でバッチ実行させレコメンドリストを更新しています。そして更新した中身のレコメンドロジックについては、とりあえず初期段階ということで、単純なレコメンドのアルゴリズムである「協調フィルタリング」を用いています。簡単なので、興味がある方は調べてみてください。

今回書籍貸出管理システムにレコメンドを導入した理由は、レコメンドがあったらどんな書籍が出るんだろう?という好奇心と、実は私は本業務でもECサイトにおけるレコメンドエンジン開発に取り組んでおり、そこで配信基盤を作りたいけど、前例が無かったので、とりあえず社内サイトで作ってみるのがいいのではないか、という意見があったためです。今後は時間が足りず作れなかった機能(CT,CVの計測など)に取り組んでいけたらと思っています。

データサイエンティストとしてのスキルアップに繋がった書籍をご紹介!

ここまでは、様々なジャンルの書籍を社員自身が会社の書籍購入補助制度によって購入でき、それを管理するシステムを社員が開発している・・・など、ARISE libraryの魅力について触れました。ここからは私が書籍購入補助制度を利用して、実際に投稿した書籍レビューをご紹介します。どちらもデータサイエンティストとしてスキルアップするのに、おすすめの書籍となります!

①:機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック(技術評論社)

業務で扱う技術で詳細に理解していない内容に関する本を読もうと思い、ARISE libraryの本棚を眺めていたところ、この本がSHAP値に関連した本であり、SHAP値に関して深く理解していなかったので思わず手に取りました。

SHAP値は目的変数に対して、各特徴量がどのような影響を与えているかを定量化・可視化するために使う指標(機械学習を解釈する指標)というようなざっくりとした理解でしたが、この本を読んで数式レベルで理解することができました。SHAP値は複雑なロジックで導出しているのですが、そのロジックの背景となる他の指標から順を追って説明し、実際にコード実装しながら分かりやすく書いてあります。またこの本を読んだおかげで、機械学習を解釈する別の指標があるということを知ることができました。

②:A/Bテスト実践ガイド 真のデータドリブンへ至る信用できる実験とは( KADOKAWA )

この本は分析業務の施策・効果検証で使用される手法の「A/Bテスト」をテーマとした本です。

自分がこの本を選んだ理由としては、マーケティング施策効果を正確に検証設計する考え方を基本からきちんと理解したいと思ったためです。

本の内容は、AmazonMicrosoftGoogleなどの大手外資企業が実際に実施してきたA/Bテストの実施例をもとに検討観点(実施する上での適切な設計方法やデータ抽出方法や結果の解釈方法など)を説明するというものになっています。実例で整理されているため、内容をイメージしやすくなっているなと感じました。

終わりに

今回は、ARISE libraryと書籍購入補助制度を紹介しました。私は今後も継続的にこれらを利用して自己研鑽に励みつつ、社内でのARISE library活性化にも取り組んでいこうと思います。今回もお読みいただきありがとうございました!

関連記事