情報科オンラインセミナー『新学習指導要領スタート直前! ―情報Ⅰ指導のポイントを考える―』 セミナーレポートVol.2

データサイエンスの未来へ向けた一歩を踏み出そう/早稲田大学創造理工学部 経営システム工学科 蓮池隆教授

「情報Ⅰ」において、プログラミングや情報デザインと並んで注目される「データ活用」。近年は、データサイエンティストが花形職業として知られるようにもなりました。そこで、早稲田大学でデータサイエンスを研究する蓮池隆教授をお招きしました。「データを活用する」とはどういうことなのか、どんな力が必要なのか、そしてその入り口となる高校情報科に何が求められるのかご解説いただきます。そこには、「データ活用」が拓く未来への期待があふれていました。

データサイエンスは楽しい! 構えなくても大丈夫

蓮池教授のご専門は「オペレーションズ・リサーチ」と呼ばれる研究分野。例えばECサイトの購買履歴からレコメンド(おすすめ)を行う機能や、宿泊施設の稼働率最大化の方法を探るなどの問題解決に、数学的なアプローチから最適解を

探ることもオペレーションズ・リサーチで扱う研究分野の1つです。

データサイエンスの注目度が高まる中で、情報Ⅰでもさまざまな取り組みが求められることになりますが、蓮池教授は「そこまで仰々しく構えないでいいですよ」とニッコリ。なぜなら、データサイエンスは「楽しいもの」だから。そんな気持ちで、生徒にもデータ活用の世界に触れて欲しいと言います。

早稲田大学創造理工学部 経営システム工学科 蓮池隆教授

データを「処理」「分析」「提示」できる人材=データサイエンティスト

そして、まずは「データ」と「データサイエンス」にまつわる前提知識をこのように共有しました。「現代の、そして今後の社会では、『データを持っていない企業はもはや勝てない』とまで言われます。しかし、持っているだけではダメです。データを分析して次へ活かす力があって初めて、その価値が成立します。だからこそ情報Ⅰにも『データ分析』が入ってきたのではないですか?」。

蓮池教授によると、企業の多くは「食材(データ)はあるけど、調理(分析)ができない」状態だそう。だからこそ調理ができる(=データを扱える)人材として、データサイエンティストの需要が高まっているのです。

これをふまえ「データサイエンティストとは何か」をこう表現します。「データを『処理』できて、『分析』できて、『解決方法を提示』できる人材です」。つまり「プログラミング・エンジニア系」と、「統計・データマイニング系」と、「コミュニケーション系」の力を兼ね備えた人材だと言えるでしょう。

企業におけるICT人材の不足が顕著に

「データサイエンティスト」とは

まずは「データ」に対して一歩を踏み出すことから

さらに、指導要領にも言及。「『情報の科学的な理解に裏打ちされた情報活⽤能⼒を育むとともに、情報と情報技術を問題の発⾒・解決に活⽤するための科学的な考え⽅等を育むことが求められている』と記載がありますが、まさに同じ意味です。つまり、情報(データ)に触ることができるだけでは足りなくて、目的に沿ってそれを活かせる力を育ててください、と言っているわけですね」。

ただ、それでも「恐れる必要はない」と繰り返し強調します。「目指すゴールはそこでも、まずはデータに触らないと始まりませんからね。『データ』というものに対して、まずは一歩を踏み出すことこそ大事なんです」。

日常の「素朴な疑問」から始めれば十分

まさに今回の講演テーマでもある最初の「一歩」。では、その「一歩」をどこに、どうやって踏み出せばいいのでしょうか。蓮池教授は笑顔で「とにもかくにも『素朴な疑問』だ」と言い切ります。

「日常のいたるところに散らばる『なぜ?』『どうして?』をきっかけにすればいいんですよ。例えばジャンケン。強い人もいれば弱い人もいます。これに何らかの傾向や特徴はあるのでしょうか? それともすべて偶然の産物でしょうか? そんな些細なことでいいのです。都市伝説や心理系の眉唾話でもいいですよ。私は雨男なんですけど、本当に雨男は存在するのか、なんてのも面白いですよね」。

さらに『牛乳を飲むと背が伸びるのは本当か』を、身長と牛乳の飲用率から分析してみるのもいいし、もう少しマーケティング的なものなら『コンビニは競合店が近隣でひしめき合いがちだが、何か意味があるのか」を地図データから調べてみるのもいいとのこと。

近年はスポーツ界が熱い領域らしく、例えば野球なら「2点ビハインドの7回裏ノーアウト1塁。送りバントすべきか否か」とか、卓球やバレーボールであれば「どのコースにどの球種でサーブを打つのが最も効果的か」という分析もなされているのだそう。

確かにどれもユニークで、好奇心をくすぐられます。授業で実行する際は「どんなくだらないテーマでも、子どもたちの着想を否定することなく『面白いね!』と受け止めてあげること」がポイントだと言います。

身近で素朴な疑問から「データ」に触れるのがコツ

データを「どう解釈し、使うか」が二歩め、三歩め

そうして「一歩」を踏み出すことができたら、次は二歩め、三歩めです。これを指導要領の文言に照らすと「データに基づく現象のモデル化やデータの処理を行い解釈・表現する方法について理解し技能を身につけること」の部分に当たる、と蓮池教授。つまり「データをどう解釈し、どう使うか」です。

「現在はハードもソフトも高性能化していますから、入力してボタンさえ押せば、『データから何らかの結果を得る』こと自体は誰でもできる時代なんです。これが先ほどの“一歩め”ですね。そこで次に目指したいのが『この結果は正しいのか』という視点や、それを判断するための力です」と述べ、こんな例を示してくれました。

ある店の売上向上を図るとして、客数・気温・雨天日数・降水量から重回帰分析(複数の要素が絡み合っているケースの分析)を用いて調べて、何らかの結論を得たとします。ところが、その分析結果を営業に反映してみたのに、なぜか売上が伸びないケースが往々にしてあるそうなのです。

蓮池教授はその理由をこう解説します。「例えば、雨天日数と降水量は互いに影響を与えやすいファクターですよね? 『多重共線性』といって、このような相関性の高い要素が同時に存在すると、分析結果は不安定になることが知られています。こうした違和に気付けるようになれば、二歩め、三歩めへと進んでいけるのではないでしょうか」。

正しくデータを扱い、読み取らないと、誤った判断をしてしまうことも

「なぜそうなったのか」を分析できる力を養うのが、情報Ⅰの役割

「不確実な分析結果が出るケースは他にもある」と、続けていくつか事例も紹介されました。

例えば「かき氷の売上と日中の気温には正の相関がある」「日中の気温と熱中症患者数には正の相関がある」というデータから、「かき氷の売上増加が熱中症患者増加の原因である」と判断してしまうような、「疑似相関の罠」のパターン。

あるいは、食料品や衣料品の消費傾向から若者の趣味嗜好の分析を試みるとして、このとき、「若者」といっても年齢や男女の区別がなかったり、品目も飲み物だけしかデータがなかったりなど、大ざっぱなデータでは分析などできるはずもありません。

「話題のディープラーニングやAIも、良い面ばかりではありません。内部でどういう処理をしているかが見えないため、結果は出るけど『なぜそうなったかが分からない、分からないけど(たまたま)問題解決はうまくいった』というケースがよくあるんです」(蓮池教授)。

そして「なぜそうなったのかを分析できる力を養うことこそ、情報Ⅰの役割だと思います」と強調しました。

「データ収集力」+「分析手法適用力」+「結果を理解し伝える能力」
「誤ったデータを使えば、誤った判断をするのがAIです。入ってきたデータをそのまま判断しますからね。食事に例えるなら、AIも“栄養バランス”が大事。つまり『データの質』と、その質を『見極める力』が何より重要なんです」と蓮池教授。

しかし、高校の情報Ⅰでどうやってそうした力を養えばいいのでしょう? そこにはコツがあるそうで「出てきたデータを表やグラフで可視化すること」だとアドバイスします。平均値や中央値、散布図などで図表化すれば、「おかしなところ」に気付きやすくなるからです。

まとめると「情報活用能力」とは「質の高いデータの収集力+適切な分析手法適用力+分析結果を正しく理解し、伝える能力」だと語り、最後にこんなエールを送ってくれました。

「こう話すと『やはり分析って難しい』と思われるかもしれませんが、それでもデータサイエンスって面白いです。データそのものは単なる材料に過ぎません。しかし、テーマ設定や分析方法というアプローチしだいで、結果はいかようにでもなります。そこに常識を覆すような結果が出てくれば、もうそれは宝物。まずは、疑問に思ったことが『解決できそうな』データから集めるだけでも十分。その“第一歩”を踏み出してみませんか?」

分析結果を可視化することで、誤りに気付きやすくなる

データサイエンスにおける「情報活用能力」とは

関連記事

情報科オンラインセミナー『新学習指導要領スタート直前! ―情報Ⅰ指導のポイントを考える―』セミナーレポート Vol.1

情報科オンラインセミナー『新学習指導要領スタート直前! ―情報Ⅰ指導のポイントを考える―』 セミナーレポート Vol.3