特別対談 第3回

第3回 : 非金融業界から、バラバラな専門性をもったプロフェッショナルが集まる理由

柳川範之氏(東京大学大学院経済学研究科 教授)
× 杉原行洋(当社代表取締役)

柳川範之氏 柳川範之氏
柳川範之氏
1963年生まれ。東京大学大学院経済学研究科・経済学部教授。中学校卒業後、父親の海外転勤に伴い、ブラジルで独学生活を送る。大検を受け、慶応義塾大学経済学部通信教育課程へ入学し、シンガポールで独学生活を送る。大学卒業後、東京大学大学院経済学研究科博士課程修了。経済学博士。
最近の主な関心分野は、法と経済学、働き方改革、AI と働き方、フィンテック。 政府の審議会・研究会メンバーとして政策立案にも参加。勉強法や経済学のやさしい解説を積極的に行っている。著書『東大教授が教える独学勉強法』(草思社)、『東大柳川ゼミで経済と人生を学ぶ』(日経ビジネス文庫)、『経済の考え方がわかる本』(岩波ジュニア新書)等がある。

第1回、第2回と、これからの金融事業に求められる人材像、育成の概念、評価制度、リーダーシップについてアドバイスを頂きました。第3回は、伝統的な金融事業にテクノロジーがもたらすインパクトとビジネスモデルの変容について、当社の研究開発プロジェクト「7 SIGMA」を通じて議論しました。

第3回 : 非金融業界から、バラバラな専門性をもったプロフェッショナルが集まる理由

杉:前回、柳川先生は必要な情報もツールもない、正解が何かもわからない状況で創意工夫を重ね独学でやってこられたと伺いました。この状況は、ビジネス、特にベンチャー企業の経営と似ているところがあるように思います。
ええ、そうかもしれません。
杉:その上で当社の今後の経営方針についてお話をさせて頂ければと思います。当社は今後、伝統的なアセット・マネジメント会社のモデルから、テクノロジーを最大限に活用する研究開発集団に転じたいと考えています。あらゆる産業においてこの流れは避けられないと思います。柳川先生は、テクノロジーが金融業界において果たす役割をどのようにみていらっしゃいますか?
金融業は、基本的に情報産業ですので、いかに技術を使い情報を獲得するかが肝です。技術革新があれば、情報の流れが変わり、活用方法が変わる。その意味で、業界の構造や金融機関の役割は確実に変わっていくし、いかざるをえないのでしょう。伝統的な金融業から脱皮していくには、ある意味チャンスですよね。ただ、金融業は規制産業でもあるため、伝統的なビジネスモデルに発想が縛られる傾向があります。そこの発想をどれだけ柔軟にできるかでしょうね。
杉:なるほど。規制に縛られながらも発想を柔軟にしていくには、どうしたらよいのでしょうか?
金融の中で「縦」に掘り下げていくのではなく、「横」展開できるかどうかだと思います。つまり、他の産業との連携により、新しい産業を作っていくというスタンスを取れるかどうか。
杉:当社の「7SIGMA」というプロジェクトは、金融に限らない様々な分野の専門性をもったプロフェッショナルが集まっており、国籍もバラバラ。先生のおっしゃる新しい視点を見出すスタンスは備えているかもしれません。
その「7SIGMA」というのは、そもそも何を目的としたプロジェクトなんでしょうか?
杉:「7SIGMA」は、当社のこれまでの金融事業における10年を超える実績の源泉を数理的に解析したり、あるいはAI等によりそれを再現できるかどうかを試行するプロジェクトです。
名前の由来は、とある大学教授に私どものトラック・レコードをお見せしたところ「数学的にはあり得ない。この実績の市場平均からの乖離は6標準偏差(6SIGMA)を越えているのではないか」と言われたことから来ています。
でも、6 SIGMAでなく、「7 SIGMA」なんですね。
杉:そうですね、縁起も良い数字ですし、その後、更にパフォーマンスが上がったため、1つノッチをあげて7SIGMAと命名しました(笑)。
研究内容の一例を挙げますと、当社のアナリストは、証券会社が発行する企業調査レポート、雑誌、財務諸表、株価動向などあらゆる情報を統合して「この企業がおもしろそうだ」とスコープを絞ります。しかし、その判断基準を言語化できる場合は多くありません。これら投資アイデアの卵を、財務などの定量情報だけを用いて予測できないか、という研究をしています。
つまり、財務情報だけからアナリストが興味を持つか持たないかを予測させるということですね?
杉:そうです。それが予測できれば、アナリストが事前に行う投資先スクリーニングを一定程度助けるプロダクトが開発できるかもしれません。また、その予測上の特徴量を抽出できれば、それは事前スクリーニングにおいて重視されている因子を特定できることも意味します。
なるほど。変数の選定も含めて、設計が難しいテーマに感じますが、具体的な成果は見えているんでしょうか?
杉:具体的な成果の一つとしては、「ある特定の業種内」かつ「ある特定の条件下」という限定性の下ですが、GLMやSVM、XGBoostなどの統計モデルを用いて、アナリストが興味を持った企業の82%を予測できる因子を特定できました。

「機械学習」×「業界知識」から見えてくるもの

82%というのは、調査から意思決定に至るプロセスの最初にくる「アナリストにとってどの企業が興味深いか」の事前スクリーニングにおける数字という理解でよいのでしょうか?
杉:はい、そうです。
ここで選ばれたものが本当にパフォーマンスがよいものを選べているのかというのは検証できているのですか?
杉:いえ、できておりません。あくまでアナリストが興味をもったものを正解としています。
そうすると、現状人間による企業選定をAIで再現できたとして、それはよいことなのか?という問題も残りますね。実は定量情報では判別できなかったところ、つまり18%を拾いあげないといけないかもしれない。
杉:おっしゃるとおりです。ただ、差し当たっては10年間のプラスリターンの実績を是とし、今のアプローチが再現できたら、そのアプローチの期待値はプラスであろうという仮定のもとに進めています。
ストラテジーとしては確かにあり得ると思いますが、もしかすると、残り18%の方にアナリストが本当に探している企業が埋もれているかもしれない。そうなると、もったいないですよね。
杉:はい、そのとおりです。その意味では、現状は「これまでのリターンを再現する」あるいは「維持する」要因の解析に留まっています。
だとすると、まだ「さらにリターンを向上させる」因子の研究というアップサイドが残っているとも言える。
杉:そうだと思います。実は、チーム内でそもそも何を解析すべきなのかという議論がありました。究極的にはその企業への投資から生まれるリターンそのものを教師データにしてしまえば、ブラックボックスのままでもリターンが出せるかもしれないし、それでよいのではないのか、と。
しかし、実際には投資に至るまでのバリューチェーン上のプロセスや参照情報という変数が多すぎて、なかなか解明できない。だからそのプロセスごとに分解してプロジェクトを進めることになり、やっとごく一部の成果として82%という数字に到達しました。ここから先、82%を縦に掘っていくのか、18%という横を掘るべきか……そんな、壮大なプロジェクトです。
そうですよね。やはり、そうやって1段ずつそのプロセスごとに解析する現在の戦略でよいのではないでしょうか。
基本的に今のビッグ・データ解析は、とにかくブラックボックスの中に全部放り込んでみて、アウトプットの目標値を決める。それで目標値がよいものを選び出すことができる特性値を探し出してくるということで、成功の「カギ」をみつけようとしているわけですね。だから、理論的に言えば、このプロジェクトもデータを全部突っ込んで、パフォーマンスを見ていけば何かが出てくるはずなんですよ。ただ、やはり影響を与えるファクターが多すぎる。これをきれいに出していこうとすると、膨大かつ多岐にわたるデータが必要で、シングルタスクの解決に集中している機械学習の現状から考えれば、ほとんど不可能でしょう。
杉:そうだと思います。
そうするとやっぱり、もう少し断面を切って、それぞれのところで何が起きているのかをみる形でやってよいと思います。それでも相当なデータ量になり、ブラックボックス感は残りますし。AIでやらせようとすると、おそらく細かく区切ることと、あとやっぱり単純な機械学習ではなくて、もう少し業界知識を活かした解析をやらないとなかなか厳しい。
杉:そう感じています。実は、証券会社の発行する企業調査レポートを数千通あつめてデータ化し、同じく当社のアナリストが興味をもつ企業を予測させる挑戦も行いました。こちらは古典的な統計解析ではなく、自然言語処理向けのディープラーニング技術を活用し、数百ノードで三層のニューラルネットワークで学習させました。結果としては、有意な予測精度は出ませんでした。何でも学習させれば何かを得られるわけでもないのだと学びました。業界知識を活かしたモデルを検討する必要性を感じます。
このようにブラックボックスでも良いから実用的なプロダクトを開発したいと思いつつも、一方でそれでは有意な予測精度が出なかった時の改善案が出しづらいことを経験しました。ですので、これからは機械学習等による予測などの機能開発と、その原理の解析を同時並行すべきだと思い、チームを3班にわけました。AIを走らせる機械学習班と、特徴量を抽出しようという数理解析班と、そのインフラを整えるデータベース班の3つです。これで研究(解析)と開発を行き来しようと思っています。

成功に必要なのは「環境」か、「能力」か?

なるほど。取り組みの方向性が、だいぶ見えてきました。
ここからは、あくまで一般論として聞いてください。ハヤテには10年間の実績があり、それはゆるぎない事実だと思います。ただ、その成功の決定要因は、大別すると、市場その他のマクロ環境という「外的要因」と、能力や戦略を含めた「内的要因」とがありますよね。外的要因と内的要因(能力)のペアリングでうまくいったのだとすれば、能力の部分を抽出できたとしても、外的要因が変われば、その能力では成功しないかもしれないですよね。
杉:おっしゃるとおりです。
そうすると、その能力と外的要因の相互関係をいかに分析するかが論点になります。過去数年のやり方がそのままAIに取り込めたとしても、これからの数年間同じことをやって成功するとは言えない。特に金融マーケットは日々情報が飛び交い、他の産業に比べ外的環境の変化がものすごく速いですよね。
杉:そうですよね。
ただ、そこはいろいろな考え方があるのかもしれません。外的要因とは無関係なところだけをピックアップするようなアプローチもあり得ます。
また、社内の要素、つまり内部要因の一例としては、たとえば「組織の全体的な基礎能力」を見れば、全員がファイナンスの知識を身に着けている会社と、基礎知識が無い素人集団との比較で、どちらが長期的パフォーマンスがよいかといえば、明らかに前者です。つまり外的要因に左右されづらい、安定的に作用する基礎的な能力があるのではないかとも思っています。
杉:なるほど。外的要因に左右されない、絶対的に有効な内部要因ですね。それが解析結果として抽出されると非常におもしろいですね。リターンは確率的分布をすると思いますが、土台となる普遍的な基礎能力などの内的要因が抽出され、強化されれば、正の方向にその分布が寄っていくとは想像できます。
その普遍的なものが具体的な意思決定プロセス上の、誰の、どこに、どのように、効いているのでしょうね。
杉:調査から最終的な意思決定をするという投資の一連のプロセスの一つずつに何か成功の決定因子があると仮定して要素還元的なアプローチをとるべきなのでしょうか。一方で、脳機能は要素に分解していくと、こぼれ落ちるものがあると思います、きっと。個の集合は全体を表さない場合もあるからこそ脳機能の解析は難しい。果たして、我々にできるのか(苦笑)。このプロジェクトの解析目的の本質は「脳の情報処理結果としての意思決定に迫る」であり、あまりの大風呂敷です。しかし、脳機能の研究者にはじまり、数理生物学者、ディープラーニングのエキスパートなどあらゆる分野の方に集まってもらうことで、金融の枠をとっ払い、斬新なアイデアと研究成果が出るものと思っています。
楽しみですね。開発はどのように進めるのですか?
杉:はい、チーム内で、開発のアイデアが出すぎて困っています(笑)。先ほど出てきた「アナリストが興味を持つ企業」を自動的に抽出するアルゴリズムはすぐにでも取り組むことができるテーマですね。これを開発できれば、大いにアナリストの調査活動を助けられます。
開発環境という点で見れば、ハヤテは小さなチームのためアナリストと開発の距離が近く、すぐフィードバックがあります。さらに、金融は市場がすぐにフィードバックをくれるので、そういった点も醍醐味かと思います。
なるほど。規模が大きくない組織は熱量を共有しやすく、手触り感があるため有利だと前回もお話しましたが、開発上の利点もありますね。
杉:はい。他にも、世の中に公表されているビッグ・データだけでなく、当社の独自データを含めて解析できる点が研究者や開発者にとっての醍醐味になると信じています。
どういうことですか?
杉:公表されているビッグ・データを解析するだけでは、究極的には欧米の巨大なプラットフォーマーには勝てないでしょう。また、そもそも皆が同じデータを扱うと、同じ結論に収れんするリスクもあります。それらを防ぐためにも、ビッグ・データを視野にいれつつも、当社独自のデータセットも用意してあります。
その独自データというのは、具体的にはどのようなものなのでしょうか?

第4回「金融を大切にしつつ、金融の垣根を壊す。「レガシー」なきハヤテの挑戦」へと続きます。