「誰もがビジネスを楽しめる世界」を探索するコーポレートマガジン
データの力で事業を進化させる──SPEEDAにデータサイエンティストチームができた理由

データの力で事業を進化させる──SPEEDAにデータサイエンティストチームができた理由

サービス開始から10年目を迎え、3,000件の業界レポート、580万社の企業情報、2,000媒体のニュースなど、あらゆるビジネス情報を格納するSPEEDA。2018年に新設されたデータサイエンティストチームを率いる、チーフデータサイエンティストの小副川健に、SPEEDAが持つデータの魅力や今後の展望をインタビューしました。

小副川 健

小副川 健TAKESHI OSOEKAWASPEEDA Chief Data Scientist

2009年筑波大学数理物質科学研究科博士後期課程修了。博士(理学)。専門は数学、特に計算機代数学と計算科学。2012年...

MORE +
目次

データサイエンスで事業に貢献したい

小副川さんが入社されるまで、SPEEDAにはデータサイエンティストのチームはありませんでした。なぜSPEEDAにジョインされたのか、どんなチームにしていきたいのかを知りたいなと思っています。今日はよろしくお願いします。

小副川 健(以下「小副川」):
そうですね。僕の前職はSIerで、基本的にはお客さまのためのデータ分析と提案が主な業務でした。個人的にもとても楽しく満足していたのですが、そのうち「自分たちのためにデータを活用したい」と思うようになったんです。

大量のデータを扱えるという意味では、独立して複数の会社に関わるという選択肢もあったと思います。

小副川:
その選択肢もありましたが、できる限り他責にしたくないという思いがあり、事業会社に行くことを検討しました。自分でデータを分析して、そのデータをどう活用してサービスを良くしていくか。主体的に意思決定できる環境に身を置きたかったんです。

事業会社の中でも、データサイエンスと相性が良いのはスタートアップだろうと思っていた中で、SPEEDAでデータサイエンティストを探しているというお話をいただいたのがきっかけです。

転職してみて、SPEEDAの環境はいかがでしょうか。

小副川:
SPEEDAには社内のアナリストがつくったデータや、サプライヤーさんからいただいている企業情報や業界情報などたくさんのデータがあって、それらを体系的につなげることで分析しやすいサービスを実現しています。このデータ自体が現在、約600万社分と膨大にあるので、テクノロジーの力を使ってサービスをより良くしていくのがデータサイエンスチームの存在意義だと考えています。

機械学習でサービスに役立つAIのモデル作りをする際に大事なのが、教師データをどう集めるかです。SPEEDAの場合は「この企業はこの業界に属する」といった判定をする必要があるので、この教師データ作りにも非常に高度な専門知識が求められます。これは社内のアナリストに相談しながら進めているのですが、こういう取り組みが学術的にも技術的にもおもしろく、チャレンジのしがいがあります。具体的には半教師学習や能動学習という技術を活用して、今のところ精度をあまり落とさず、教師データを数百分の一くらいまで減らせそうな見通しが立ってきました。

こういった社内にある膨大なデータを使って、社内のプロフェッショナルとコミュニケーションしながらプロジェクトを進めていけるのは、インハウスならではの醍醐味だと思います。

確かに、クライアントワークだとなかなかできない領域ですね。
小副川

エンジニアとしてビジネスにも貢献していきたい

小副川さんが入社して、データサイエンティストチームも人数が増えました。実際にコードを書く時間はどのくらいあるのですか?

小副川:
コードを書く時間は非常に大事にしていて、日常業務の80%ぐらいの時間は確保できていると思います。一時期は50%ぐらいまで落ち込んでいたんですが、それだと辛いと林さん(林 尚之/B2B SaaS事業 CTO)やチームメンバーとも話して、80%まで増やすことができました。

「辛い」というのは具体的にどういうことでしょうか?

小副川:
日々増えてくる課題に対するアウトプットが、自分が思っているより出せていない状態でした。課題を解決するためにも論文レベルの知識や発想が必要なので、僕が持っている実際の実験結果やノウハウをチームメンバーに伝えて、手を動かしながらフィードバックをもらって、またディスカッションしていくサイクルが生まれ始めていて心地良いですね。

逆に、エンジニアとしてSPEEDAでやりにくいなと感じたことはありませんか?

小副川:
今のところ、あまりないですね。
想像していた以上にエンジニアカルチャーが浸透していて、ビジネスサイドともお互いに尊敬し合えている環境だと感じています。

これは創業メンバーに稲垣さん(現SPEEDA CEO/エンジニア出身)や竹内さん(現チーフテクノロジスト/SPEEDAやNewsPicksなどの初期開発に携わる)といったエンジニアがいて、しっかり貢献してきたことが大きいのだと思います。エンジニアリングの力で世界を本当に変えられるという体験を、会社として積み重ねてきていることは大きい。

このカルチャーをなくさないためにも、僕たちのチームもしっかりと事業に貢献していきたいですね。

小副川

「データ活用を体現したチーム」を目指して

SPEEDA以外の事業にも、データサイエンティストやAIエンジニアが増えてきました。事業を超えた交流はあるんですか?

小副川:
けっこうありますね。FORCASの北内さん(北内 啓/CAIO = Chief AI Officer)や早川さんとはしょっちゅうディスカッションしています。あと月に1回ぐらいのペースで、社内のAIエンジニアが10人ぐらい集まって勉強会を開催しています。

どんな内容なんですか?

小副川:
1つは、それぞれが最近勉強した新しい手法についてですね。
AIの世界はすごく進歩が速くて、論文が日々数百本単位で出ているんです。その中でもすごく目立った成果というのが2〜3ヶ月に1本ぐらい出てくるんですが、その新しい論文を誰かが読み解いて、他の人と教え合うみたいな時間にしています。

もう1つは、「今、事業でこんな取り組みしています」とか、「こういう課題があって困っています、何かいいアイデアないですか?」みたいなディスカッションをみんなで一緒にする、そういう機会にしています。

例えばNewsPicksでは最近、データレイクという技術を使ってデータ抽出しやすくする取り組みを始めているのですが、前回はそのプロジェクトについて話をしてもらいました。その前はFORCASのチームが日本人工知能学会で発表してきた内容を話してもらったり、うちのチームのダニエルさんから、BERTという自然言語処理の手法についての論文解説をしてもらったりもしました。

AIやデータサイエンスは現在トレンドになっています。エンジニアが働く環境としてSPEEDAを選ぶ理由って何なのでしょうか?

小副川:
僕の場合はやはり、インハウスというところに強く惹かれましたね。他のメンバーは、成長できる環境を求めて来てくれていると認識しています。会社全体でエンジニアカルチャーも強く、今後ますます重要性が増していくAIという技術を、ビジネスの生の現場で勉強しながら実践していける環境は他にあまりないと思います。

小副川
最後に、小副川さんが実現していきたい世界を教えてください。

小副川:
SPEEDAは現在1,100社ほどのユーザーに使っていただいているのですが、NewsPicksは無料会員ユーザーが400万人もいてデータの規模が桁違いに多いんです。またFORCASでは、ユーザーが持つデータを使って、未来の顧客候補を分析し提案する機能が充実しています。エンジニアに限らず社内のデータサイエンスやAI技術への理解を深めて、事業を超えた横の連携をもっと強化していきたいですね。

SPEEDAのデータサイエンティストチームが最終的に目指すのは、ひたすら「データ活用を体現したチーム」になることです。事業における課題を見つけて、データ活用することで、サービスや事業にもしっかり貢献する。そのためには、今はデータが少なくて解けない課題も、データを蓄積し始めて、徐々に精度高く解けるようにする、といった戦略も必要です。ある意味R&Dのような機能も持ちながら、新しい技術をたくさん試せるチームにしていきたいですね。

写真:山田 聖裕 / 執筆・編集:筒井 智子
Uzabase Connect