新学環の教員と社会のトップランナーたちとの対談を通じ、統計・データサイエンスの可能性について考える本企画。第2回目は、統計データサイエンス学環(設置構想中)の特任教授に就任予定の西内啓氏と、新学環開設準備室室長の荒木万寿夫教授による対談をお届けします。ベストセラー『統計学が最強の学問である』の著者であり、データサイエンスの社会実装を牽引してきた西内啓氏に、統計学の意義と統計データサイエンス学環(設置構想中)で目指す教育について伺いました。

PROFILE

学長補佐
(データサイエンス担当)
経営学部 経営学科 教授
新学環開設準備室室長

荒木 万寿夫

ARAKI Masuo

修士(経済学)(青山学院大学)。青山学院大学大学院経済学研究科経済学専攻博士後期課程標準年限満了退学。専門分野は経済統計学、情報教育。1999年青山学院大学経営学部経営学科専任講師に着任し、2010年同教授に就任。2020年経営学部教務主任を経て、2021年学長補佐に就任し、現在に至る。

統計データサイエンス学環 特任教授 就任予定
株式会社ソウジョウデータ
代表取締役

西内 啓

NISHIUCHI Hiromu

東京大学医学部卒業後、同大学院医学系研究科博士課程にて医療統計学や行動科学を研究し、東京大学医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長(兼任)、ダナファーバーがん研究センター客員研究員を歴任。2013年発表の著書『統計学が最強の学問である』(ダイヤモンド社)はシリーズ累計55万部のベストセラーとなる。2017年には本学経営学部の招聘准教授等を務め、現在は株式会社ソウジョウデータ代表取締役として、企業のデータ活用や意思決定を支援している。

1.医学部から歩んだ
統計家としてのキャリア

原体験は、幼少期に没頭した
「ゲームの攻略」

荒木教授(以下、荒木):西内先生は現在、統計家として企業支援をされていますが、ご出身は医学部なのですね。

西内氏(以下、西内):高校生の時から人間の行動や存在自体に興味を持っており、得意な数学を使いながら人間について研究できる医学部に進学しました。ただし医者になるつもりはなく、もともと教養の科目で最も没頭した分野は心理学や社会科学といった、実証データから統計学的手法で行動を分析する学問で、そうしたモチベーションから進学先を決めました。博士課程での主な専門分野は行動科学やコミュニケーション科学で、生活習慣病リスクがある人の生活を改善するためにはどういったアプローチが有効か、データで検証していました。「ビッグデータ」という言葉が広まり始めた2010年頃に、こちらの仕事の方が向いているのではとフリーランスのデータサイエンティストとして活動を始め、企業のDX推進やデータ活用を支援してきました。

荒木:そうだったのですね。大学での研究が統計学との出会いだったのですか。

西内:実は、原体験が幼少期にありまして。私が小学生の頃に流行していたゲーム「ドラゴンクエスト」では、場所によってモンスターの出現率が違うという噂があったのです。出現の法則が分かれば効率よくクリアできる。そう考え、ストップウォッチ片手にいろいろな場所でモンスターの遭遇回数と獲得経験値を計測すると、時間あたりの効率が明らかに高いエリアをいくつか見つけられました。これが私にとって初めての統計学です。「もっと良い方法はないのか?」「楽にできる手法はないか?」。そんな裏技探しへの意欲が、データから最適解を導くモチベーションとなってきたのかもしれません。

荒木:まさに記述統計ですね。統計学に触れたことのある人にとって「こうすると上手くいくのはなぜだろう」という経験則から分析がスタートするケースは自然かもしれませんが、幼い頃から統計学的な思考をされていたとは驚きです。

2.なぜ統計学は
「最強の学問」なのか

複雑な現実世界を投影する
実用的学問

荒木:西内先生といえば、シリーズ累計55万部を超える『統計学が最強の学問である』の著者としても知られています。私のゼミナールの学生も愛読しており、統計を学ぶ人にとって必読書のような存在です。改めて、統計学とはどういった学問か話していただけますか。

西内:ありがとうございます。まず、よく聞かれるのが「数学と統計学はどう違うのか」という質問です。どちらも数字や数式を扱うため似ているようですが、実はアプローチが異なります。例えば、小学校の算数に「12個のリンゴを3人で分ける場合、1人当たり何個になりますか」という問題がありますよね。数学では、リンゴを全て同じものとして抽象化し、計算します。一方で統計学では、「一言でリンゴと言っても、甘いリンゴもあれば腐っているリンゴも、いろいろあるかもしれない」という具体性を考慮しながら、数量的思考を展開します。つまり統計学は、現実世界を前提にしながら、数字という客観的な指標で結論を導く、実用的な学問なのです。

荒木:数量的な指標は、対象の個体差をある程度捨て去ることで、物事の量的な比較を可能にし、全体像の把握を可能にしたものです。「何となく良いから」ではなく、具体的に「○%利益が上がるから」「リスクが〇割低減するから」といった数字による根拠を提示された方が、説得力は格段に高まります。

あらゆる意思決定の根拠となる
データの力

西内:おっしゃる通りです。私が「統計学が最強」だと考えるのは、あらゆる意思決定に役立つからです。例えば商品のメディア広告を考える際に重要なのは、ターゲット層が商品を「買いたい」と思うようなものを展開すること。そのために、ターゲットとなる人々はどのようなメディアをよく見ているのか、どういうストーリーだと共感してもらえるのかを解析し、広告形態と購買率の関係性を明らかにします。しかし統計学的な検証がなされなかったら、「本当はネット広告の方が適切なのに、テレビCMしか出していない」などのミスマッチが生じ、莫大な広告費を無駄にしてしまう可能性があります。最も有効な手段を取るために合理的な判断をリードできるのが統計学的人材で、データが存在する限り、どのような分野にも活躍の場があります。

荒木:実際、日本の企業ではデータ駆動型の経営はどれほど進んでいるのでしょうか。

西内:徐々に浸透してきていますが、新たな試みに対して保守的な企業が多いことを踏まえると、もう一歩という印象です。しかし大学での研究の一環で統計学を学んでいた方や、社会人になって統計検定を受ける方は数多くおり、今後そういった人材がデータ活用に前向きな企業へと流れていくと予想されます。

3.AI時代に求められる、
人間の考える力

可能性を広げる知の循環

荒木:近年はAIの進化が目覚ましいですが、こうした時代に統計やデータサイエンスを学ぶ意義について、西内先生はどのように考えていますか。

西内:昨今の生成AIは非常に高度な統計モデルを基盤にしており、その内部の計算ロジックの精度は驚くほど複雑です。ただし、AIが出力する結果は過去のデータや既存の文献に基づいているという点には注意が必要でしょう。もし元となる情報が間違っていれば、結果も誤ったものになります。また、まだ誰も発見していない知識は当然ながらAIは学習していません。だからこそ、人間が現状に対して問いを立て、新たな知見を生み出す必要があります。そのための手段として、データを集め、読み解く統計学的思考力はますます重要になるでしょう。

荒木:同感です。人間が新たな発見や価値を生み出し、それがAIに取り込まれて活用されることで、さらに人間の新たな発見へとつながっていく。そのような知の循環が今後ますます重要になると考えられますね。とはいえ、教育現場ではAIとの付き合い方を考えざるを得なくなっています。産業界では、AIの登場でデータサイエンスティストの役割は変化しているのでしょうか。

これからの
データサイエンス人材

西内:そうですね。かつてはデータ分析に関するプログラミングができるだけでも価値がありましたが、その部分は生成AIがかなりの範囲を担えるようになっています。私はよく、データサイエンティストの仕事には「What」と「How」があると話しています。「How」とは、「この分析をしてください」と依頼されたときに、コードを書いて分析する仕事です。「What」とは、そもそも何を分析すべきなのかを考える仕事。これまでは、Howの仕事を経験しながら徐々にWhatの仕事へ進むキャリアパスが一般的でした。しかしAIの普及によって、企業は「Howだけができる人材」を大量に採用する必要がなくなり、何を分析するべきかを提案できる人材、つまりデータ活用の上流工程を担う人材が特に今後も必要とされると考えられます。

荒木:なるほど。さらに言うと「なぜこの方法が有効なのか」を説明し、組織の中で合意形成を行う役割はAIには代替できません。単に技術を身に付けるだけでなく、きちんと論理を説明し、チームを導ける人材の育成が重要だと言えますね。

4.統計データサイエンス学環で
育てたい人材像

生のデータを教材に養う
「問う」力

荒木:そういった人材を育成するために、現在どのような授業を構想されていますか。

西内:学生がゼロから調査を設計する「リサーチデザイン」を教えたいと考えています。企業から提供していただくデータを題材に、目的や分析手法を自ら選択し、計画を立てるという演習的な科目です。銀行やECサイトなど幅広いデータを扱いたいと思っています。

荒木:社会のさまざまな分野にデータがありますが、「データを前にしてどう分析するか」という方法論には共通する部分があります。リサーチデザインは、まさにその核を養うプログラムだと思います。データサイエンス人材としてさまざまな場所に赴き、そこで活躍するためのパスポートのような素養が身に付くのではないでしょうか。

西内:そのように期待しています。また、学環という仕組みに大きなメリットがあると感じています。データサイエンスの分野でよく言われるのは、「統計的」「計算機的」「人間的」側面の3つが重要ということ。つまり、数学的なスキルと社会理解、双方がデータサイエンス人材には欠かせないのです。それらをバランスよく学べる環境が統計データサイエンス学環にはあります。連携協力学部の5学部(教育人間科学部、経済学部、法学部、経営学部、理工学部)の専門知識を母体としながら、統計学やコンピュータサイエンスを本格的に学べる点は非常にユニークでしょう。

荒木:他分野の専門家による教育展開は本学環の強みですので、そう言っていただけるのは嬉しい限りです。また、企業や行政が抱える実課題は、貴重な教育資源です。BIT VALLEY 渋谷・青山エリアに位置する青山キャンパスの地の利を生かし、学生が産官それぞれの現場の問いに触れ、課題解決の当事者として学び、共同研究にも参画できることは、教育上の大きな強みです。学生には、どのような4年間を送ってほしいと思われますか。

西内:面白そうだと思った分野にどんどん触れていってほしいですね。そして、幅広い学問領域の中から自分の武器となる専門性を2つ以上、手にできると理想です。社会課題は多様な分野が複雑に絡むものばかりで、複数の専門性があると解決のための選択肢が広がります。私がアメリカのボストンに留学していた際に研究していた公衆衛生学では、「社会の健康」という目的に対して、法学や経済学など多角的なアプローチが取られていました。2つ以上専門性を持っていると、「AがだめならBのアプローチではどうだろう?」と試行錯誤することができるのです。

5.統計学は
「幸せ」を形にする学問

広いアンテナと
興味関心の深掘り

荒木:統計データサイエンス学環を志す高校生に、メッセージをお願いいたします。

西内:統計学は「どうなれば人は幸せになれるのか」という問いからはじまります。社会や組織の困りごとを改善するために、データを集め、分析し、解決策を実装する。その結果、思いがけないビジネスチャンスが見つかったり、社会課題の解決が実現したりと、ワクワクする発見がもたらされる学問です。自分はデータからどんな幸せを見つけたいか、どういった社会をつくりたいか、ぜひ大学生活の中で見つけてください。アンテナを広く張り、疑問に思ったことはどんどんAIに質問しながら興味を深めていくのもよいでしょう。そして、確かなスキルに裏打ちされた判断力で、周囲をリードする責任感のある大人になってほしいと思います。

荒木:ありがとうございます。高校で身に付けた数学のスキルは、必ず大学の学びの素地となります。ぜひ、そうした基礎力を伸ばしながら、データ分析という人を幸せに導く、探究しがいのある世界に足を踏み入れてほしいですね。西内先生にも協力いただきながら、社会で活躍する人材を育てていきたいと思います。皆さんとご一緒に学べることを楽しみにしています。

AFTER THE CONVERSATION対談を終えて

統計学は最強だと西内氏は語る。
膨大なデータから導き出される客観的な根拠は、
あらゆる意思決定の質を劇的に向上させるからだ。
ゲームの攻略法をデータから導き出すように、
統計学の本質は、複雑な現実世界から「最適解」という名の
裏技を見つけ出す遊び心と実利を兼ね備えている。
統計学、データサイエンスを片手に、いかなる幸せを実現させたいのか。
まさに「人間的」な希望が学びの出発点となるだろう。