この記事の目次
慶應義塾大学 総合政策学部2015年【問い】
慶應義塾大学総合政策学部・環境情報学部では、2014年度からの新カリキュラムで「データサイエンス」を、「言語コミュニケーション」「情報技術」「ウェルネス」と並び必須の履修科目と位置づけています。この背景として、現代社会では、様々なデータを収集・分析し意思決定することで、証拠に基づく問題発見・解決の能力を身につけることが、今まで以上に重要視されていることが挙げられます。
両学部のデータサイエンス教育では、学生が自分自身でデータを上手に集めて適切に分析し、 様々な意思決定ができるようになることを目指しています。ここでいうデータには、数値だけでは なく、文字や映像・音なども含みます。現実に存在する問題を発見し解決するためには、様々な場面で意思決定が必要となります。しばしば、将来が予見できないとか、想定外の事象が起きるなどといった不確実な状況の下で意思決定 を行うことがあります。「不確実さ」を数量的に表現するために確率が用いられます。そのため確率 の概念を理解することは社会科学の分野でも重要です。そして意思決定を支援するために、収集さ れたデータを分析した結果が用いられます。データの分析には、統計学を理解する必要があります。そのため確率と統計は、データサイエンスの根幹となる学問分野として位置づけられています。
この問題は、総合政策学部で学び、研究を行う上でデータサイエンスを修得することの重要性について、みなさんに考えてもらうことを目的としています。
資料1は、17世紀後半から20世紀初頭における、統計学の歴史とその時代背景を説明したものです。
資料2は、20世紀後半以降の統計学をめぐる状況を紹介したものです。
資料3と4は、同じ統計学者によるものです。資料3では社会科学における「数量的把握」の意味について、資料4では統計学の立場から経済学などの関連した問題について、それぞれ論じられています。
資料5と6は、太平洋戦争開戦時の意思決定とデータとの関係を論じています。資料5は太平洋 戦争開戦時に国家の重要政策や物資動員の企画立案を担った当時の企画院の鈴木貞一総裁に対す るインタビューです。資料6は、太平洋戦争における旧日本軍の組織としての失敗に関する学際的 共同研究を行った成果をまとめたものです。
資料7では、裁判における確率統計の誤用例が紹介されています。資料1~7を読んだ上で、以下の3つの問に答えて下さい。
問1
資料1~7は、意思決定を行う際に、データを収集し分析することの利点およびその難しさと限界について述べています。資料1~7のなかから重要だと思う資料を2つ挙げて、データを用いることの利点およびその難しさを、それぞれ200字以内で要約し述べて下さい。
問2
以下のボックスに示された社会的課題は、データを収集・分析し、意思決定することにより解決可能と考えられます。
(1) 生活習慣病の予防や健康管理による医療費の適正化
(2)保育所の待機児童解消や男性の育児参加促進による子育て支援
(3) 選挙区の区割り改定による一票の格差是正
(4) 外国人観光客の誘致による雇用促進このうち、あなたが最も関心のある課題を一つ選び、その番号を解答欄)に記入してください。そして、その問題の現状と課題を示すことができる定量的な指標を提案し、その指標の定義を解答 欄2に記述してください。ここで、定量的な指標は以下の例を参考にし、例に示された以外の指標を提案してください。
さらに、その指標をあらわす上で必要な資料やデータの収集方法を解答欄3に記述してください。 (300字)定量的な指標の例
例1:人口密度(人/㎢)=P/A
P=ある地域の人口(人)、A=当該地域の居住可能な面積(㎢)例2:高齢化率(%)=P65+/Ptot×100
Ptot=総人口(人)、P65+ = 65歳以上の人口(人)
問3
問2で提案した指標を用いて問題解決のための意思決定を行う上で、どのような限界があると思うか、考えを述べてください。(300字)
慶應義塾大学 総合政策学部2015年【答案例】
問1
利点:資料3
数量というものは、多くの場合それだけでは意味を持たず、孤立した数字を出しても意味がない。また、何か議論を進めるに当たって、通常の厳密さにこだわる必要が存在しない。なぜなら、数学的論というものは対象の間の形式的な関係を重視しているからである。またそれを導くためのプロセスを形式的な論理規則さえ知っていればだれでも行えるという点で客観的であり、同じ構造であれば応用できるという普遍性も備えている。
難点:資料7
資料7において、サリー・クラークは乳幼児ふたりがSIDSによって死亡する確率は非常に低いというデータのみによって彼女が子供窒息死させたとして逮捕されたが、本当に求めるべき確率は2人の乳幼児のシーンがSIDSだというものであり、それが前者より高いと評価されたため、彼女を釈放された。
これより、データ利用には、そのプロセスの不備によって判決結果や人の人生を変えるという点で難しさがあると言える。
問2
指標
待機度(1を基準として考える)=Pw/Ptot
Pw:待機児童数(人)
Ptot:保育所の定員(人)
男性による育児参加率(育児率とする、%)=Pm/Pmtot ・100
Pm:調査地域内において育児に参加している、子供を持つ男性の数(人)
Pmtot:調査地域内において未就学児の子供を持つ男性の数(人)
課題は(2)を選択。
まず、ある地域における保育園の待機児童(Pw)と保育園の定員(Ptot)はその地域内の全ての保育園に電話やメールなどで連絡をしてデータを収集する。
次に、ある地域内における、男性による育児参加率を求めるため、その地域内で子供がおりなおかつ育児に参加している男性(ここでの『育児に参加している』とは、週20時間以上子供の面倒を見ていることとする。)の数(Pm)のデータをアンケートという形で収集する。Pmtotに関しては、Pwと同様にして収集する。
問3
保育所の待機児童解消については、待機度が1を上回っている保育園の待機児童を待機度が1を下回っている保育園に移動させることが解決策になりうるが、そもそも保育所の待機児童問題はその地域の人口の過密によって引き起こされる問題なので、この指標を用いて現時点で空いている保育所にわずかな待機児童を入れる事は可能だが、それ以上の待機児童解消には物理的な限界がある。
また、男性の育児促進について、その地域における育児率を求めることができたとしても、男性が育児に積極的に参加できない理由というものが主に会社勤めにより時間制約であるため、そのような要素を無視したこの指標での問題解決には情報的な限界がある。
慶應義塾大学 総合政策学部2015年【解説】
この問題は僕が今までやったSFC小論文の中で最も嫌いなものです(笑)。
問題を見てもらえれば分かるのですがとにかく書きにくい。何を書けば良いのか、と。この答案例も偉そうにのっけていますがかなり苦しいものとなっています。
もともと総合政策学部の小論文が嫌いすぎて全然過去問を解いていなかったのですが、さすがにまずいと思い冬前に初めて手を付けたと思えばこれでした(笑)。なので僕の答案例をアテにするのではなく、これから書く、僕がこの答案を学校の先生に添削して頂いた時に得た改善点、また僕がこの問題について色々と調べた時に得た知見などを参考にしていただけると幸いです。
まず設問に入る前に導入文をしっかりと確認していきます。
その上で意識すべきことを抜き出すと
現代社会では、様々なデータを収集・分析し意思決定することで証拠に基づく問題発見・解決の能力を身につけることが、今まで以上に重要視されている
しばしば、将来が予見できないとか、想定外の事象が起きるなどといった不確実な状況の下で意思決定を行うことがあります。
『不確実さ』を数量的に表現するために確率が用いられます。
この問題は、総合政策学部で学び、研究を行う上でデータサイエンスを修得することの重要性について、皆さんに考えてもらうことを目的としています。
一番最後の文章が一番わかりやすくこの問題の意義について触れています。今回はこれを知ったことによって劇的に問題が解きやすくなるというものではありませんが、このようにまずは導入文を確認するくせはつけておきましょう。
問1
箇条書きで何を答えれば良いのかをまとめます。
・資料1~7から重要だと思うものを2つ挙げる
・データを用いることの利点(200字で要約)
・データを用いることの難しさ(200字で要約)
です。これについては「限界」を書いてしまう人が多そうだなと思いました。ですが、別に限界については求められていません。資料1~7が「意思決定を行う際に、データを収集し分析することの利点およびその難しさと限界」について述べていると書いてあるだけで「限界について述べよ」とは書いていません。
本番では焦って読み違えをしてしまう恐れがありますが、練習の時点からこのように設問文を注意深く読むクセを付ければ大丈夫です。
問2
僕は答案例において(2)を選択しましたが、これはやめておけばよかったと後から思いました。なぜなら、「保育所の待機児童解消や男性の育児参加促進による子育て支援」は「保育所の待機児童解消」と「男性の育児参加促進による子育て支援」の両方を書けばよいのか、それともどちらかでよいのかが不明瞭だからです。
他の選択肢はすべて書くことが1つなので、比較的安全です。このようなケースはあまりないかもしれませんが、少しでも曖昧な選択肢(記述の場合はなおさら)はできる限り避けるほうが良いと思います。
そしてこの問題についても要求を箇条書きにします。
・問題の現状と課題を示すことのできる定量的な指標
・その指標の定義
・その指標をあらわす上で必要な資料やデータの収集方法
です。これに関して僕が言えるのは「無理に難解な指標を作る必要はまったくない」ということです。難しい指標を作ると説明が300字では追いつかなくなり中途半端な記述になってしまいます。答案例の通り僕は逆に単純すぎるのですが、ここには時間をかけすぎずに済みました。
また、「指標の定義」については自分なりの基準を設定するほうがよいです。例えば僕の回答では「ここでの『育児に参加している』とは、週20時間以上子供の面倒を見ていることとする。」などと定義に関して具体的な数値とともに説明しています。添削を受けた時は、これに加えて「なぜ20時間なのか?」といった根拠まで書けるとより信頼できるというアドバイスを受けました。
他の年度の問題でも、自分の考えを支えるために独自のもの(前述の育児参加についてなど)を書くことはあると思いますが、その時は自分の考えの範囲内でよいのでできるだけ具体的な数値と根拠を揃えると「ただの勝手なことば」ではなくなります。
正直この問題に関して、絶対に成功するうまいやり方を提示するのは不可能です。おそらく予備校などもこれの解説を作る際はかなり困ったと思います。ですが、ひとつ言えるとしたら「問いの要求にきっちり沿わせる」ことが大事ということです。指標に気を取られて独りよがりなものを書き出すのではなく、常に問いで何を問われているかを意識しながら考えることをオススメします。
問3
要求は
・問2で作った指標を用いた問題解決の意思決定を行う上での限界があるかの考え
です。これについては問1で述べたデータの難点からヒントを得てもよいし、自分の考えにケチをつけるかたちでもよいと思います。とにかく書きづらいのは確かです。ですが、「どのような限界があるか」についての記述を外さないように組み立てていきましょう。
まとめ
総合政策学部の2015年度の問題は、正直かなりやりづらいです。「何を書けばよいのか分からない」という受験生が大半だと思います。SFC小論文のためにネタをせっせと仕込んで知識勝負で受かってしまおうと目論んでいた人はかなり痛い目を見たものだとも思います。このことからも、SFC小論文において最も重要なのは思考だということがわかると思います。
この年度にこだわらなくても良いので、特にSFC小論文を解く時は確実に問いに正対することを意識するようにしましょう。
なお、環境情報学部2021年入学のkuboくんが書いた別解は、こちらの記事をお読みください。