データサイエンスで事業に貢献したい
小副川 健(以下「小副川」):
そうですね。僕の前職はSIerで、基本的にはお客さまのためのデータ分析と提案が主な業務でした。個人的にもとても楽しく満足していたのですが、そのうち「自分たちのためにデータを活用したい」と思うようになったんです。
小副川:
その選択肢もありましたが、できる限り他責にしたくないという思いがあり、事業会社に行くことを検討しました。自分でデータを分析して、そのデータをどう活用してサービスを良くしていくか。主体的に意思決定できる環境に身を置きたかったんです。
事業会社の中でも、データサイエンスと相性が良いのはスタートアップだろうと思っていた中で、SPEEDAでデータサイエンティストを探しているというお話をいただいたのがきっかけです。
小副川:
SPEEDAには社内のアナリストがつくったデータや、サプライヤーさんからいただいている企業情報や業界情報などたくさんのデータがあって、それらを体系的につなげることで分析しやすいサービスを実現しています。このデータ自体が現在、約600万社分と膨大にあるので、テクノロジーの力を使ってサービスをより良くしていくのがデータサイエンスチームの存在意義だと考えています。
機械学習でサービスに役立つAIのモデル作りをする際に大事なのが、教師データをどう集めるかです。SPEEDAの場合は「この企業はこの業界に属する」といった判定をする必要があるので、この教師データ作りにも非常に高度な専門知識が求められます。これは社内のアナリストに相談しながら進めているのですが、こういう取り組みが学術的にも技術的にもおもしろく、チャレンジのしがいがあります。具体的には半教師学習や能動学習という技術を活用して、今のところ精度をあまり落とさず、教師データを数百分の一くらいまで減らせそうな見通しが立ってきました。
こういった社内にある膨大なデータを使って、社内のプロフェッショナルとコミュニケーションしながらプロジェクトを進めていけるのは、インハウスならではの醍醐味だと思います。
エンジニアとしてビジネスにも貢献していきたい
小副川:
コードを書く時間は非常に大事にしていて、日常業務の80%ぐらいの時間は確保できていると思います。一時期は50%ぐらいまで落ち込んでいたんですが、それだと辛いと林さん(林 尚之/B2B SaaS事業 CTO)やチームメンバーとも話して、80%まで増やすことができました。
小副川:
日々増えてくる課題に対するアウトプットが、自分が思っているより出せていない状態でした。課題を解決するためにも論文レベルの知識や発想が必要なので、僕が持っている実際の実験結果やノウハウをチームメンバーに伝えて、手を動かしながらフィードバックをもらって、またディスカッションしていくサイクルが生まれ始めていて心地良いですね。
小副川:
今のところ、あまりないですね。
想像していた以上にエンジニアカルチャーが浸透していて、ビジネスサイドともお互いに尊敬し合えている環境だと感じています。
これは創業メンバーに稲垣さん(現SPEEDA CEO/エンジニア出身)や竹内さん(現チーフテクノロジスト/SPEEDAやNewsPicksなどの初期開発に携わる)といったエンジニアがいて、しっかり貢献してきたことが大きいのだと思います。エンジニアリングの力で世界を本当に変えられるという体験を、会社として積み重ねてきていることは大きい。
このカルチャーをなくさないためにも、僕たちのチームもしっかりと事業に貢献していきたいですね。
「データ活用を体現したチーム」を目指して
小副川:
けっこうありますね。FORCASの北内さん(北内 啓/CAIO = Chief AI Officer)や早川さんとはしょっちゅうディスカッションしています。あと月に1回ぐらいのペースで、社内のAIエンジニアが10人ぐらい集まって勉強会を開催しています。
小副川:
1つは、それぞれが最近勉強した新しい手法についてですね。
AIの世界はすごく進歩が速くて、論文が日々数百本単位で出ているんです。その中でもすごく目立った成果というのが2〜3ヶ月に1本ぐらい出てくるんですが、その新しい論文を誰かが読み解いて、他の人と教え合うみたいな時間にしています。
もう1つは、「今、事業でこんな取り組みしています」とか、「こういう課題があって困っています、何かいいアイデアないですか?」みたいなディスカッションをみんなで一緒にする、そういう機会にしています。
例えばNewsPicksでは最近、データレイクという技術を使ってデータ抽出しやすくする取り組みを始めているのですが、前回はそのプロジェクトについて話をしてもらいました。その前はFORCASのチームが日本人工知能学会で発表してきた内容を話してもらったり、うちのチームのダニエルさんから、BERTという自然言語処理の手法についての論文解説をしてもらったりもしました。
小副川:
僕の場合はやはり、インハウスというところに強く惹かれましたね。他のメンバーは、成長できる環境を求めて来てくれていると認識しています。会社全体でエンジニアカルチャーも強く、今後ますます重要性が増していくAIという技術を、ビジネスの生の現場で勉強しながら実践していける環境は他にあまりないと思います。
小副川:
SPEEDAは現在1,100社ほどのユーザーに使っていただいているのですが、NewsPicksは無料会員ユーザーが400万人もいてデータの規模が桁違いに多いんです。またFORCASでは、ユーザーが持つデータを使って、未来の顧客候補を分析し提案する機能が充実しています。エンジニアに限らず社内のデータサイエンスやAI技術への理解を深めて、事業を超えた横の連携をもっと強化していきたいですね。
SPEEDAのデータサイエンティストチームが最終的に目指すのは、ひたすら「データ活用を体現したチーム」になることです。事業における課題を見つけて、データ活用することで、サービスや事業にもしっかり貢献する。そのためには、今はデータが少なくて解けない課題も、データを蓄積し始めて、徐々に精度高く解けるようにする、といった戦略も必要です。ある意味R&Dのような機能も持ちながら、新しい技術をたくさん試せるチームにしていきたいですね。