Audio Transcript Auto-generated
- 00:01 - 00:01
はい
- 00:02 - 00:03
では第一回目
- 00:03 - 00:06
の後半について進めていきたいと思います。
- 00:07 - 00:12
でデータサイエンスなんですが、今回エクセLを今回使うとお伝えしました。
- 00:13 - 00:16
で、なぜエクセルを使うのか丸一というところ
- 00:16 - 00:18
を少しお話したいと思います。
- 00:18 - 00:23
で、一般ま統計のデータ分析というところで言うと、専門の統計ソフトがあります。
- 00:24 - 00:27
もしかしたら聞いたことあるかもしれませんが、SPSS
- 00:27 - 00:29
であったり、SAS
- 00:29 - 00:33
もしくはスタワークという風なまいろんな統計のソフトがあって、
- 00:34 - 00:37
それで言うとそれらを使うとま非常に便利なこともあります。
- 00:37 - 00:38
ただし、
- 00:38 - 00:40
この科目ではエクセルを使用したいと思います。
- 00:41 - 00:43
その理由なんですが、
- 00:43 - 00:44
え、統計ソフト
- 00:44 - 00:44
ま、
- 00:45 - 00:48
単純な操作で分析を得ることができます。
- 00:48 - 00:49
で、ただし
- 00:49 - 00:51
あまり良くない点として、
- 00:51 - 00:54
途中でどんな計算を行っているのかが分かりにくい
- 00:55 - 00:56
という風な、そういった
- 00:56 - 00:57
デメリットもあります。
- 00:59 - 01:02
excelでは、ま自分で水えー数式を
- 01:02 - 01:05
入力して計算を進めてもらうとか、作業を
- 01:05 - 01:08
進めてもらうということがあるので、ま学習効果が高いと
- 01:08 - 01:10
いう風なことが言えると思います。
- 01:12 - 01:13
で、
- 01:13 - 01:13
あとは
- 01:13 - 01:18
え統計のソフト先ほどあげたものに関して言うと、実はま非常に高いです。
- 01:18 - 01:23
え、何十万円するものもあったりして、個人で買うのはなかなか大変です。
- 01:24 - 01:27
そういった意味で、将来性ということで、ま、これから
- 01:27 - 01:30
皆さんえ収束される、起業されるということなんですが、
- 01:30 - 01:34
ま統計のソフト会社によって使っているものも違ったりも
- 01:34 - 01:34
します。
- 01:35 - 01:35
ただ、
- 01:35 - 01:40
えXLというところは、ま基本的にま、どんなパソコンにも入っていることが多いので、
- 01:40 - 01:41
是非この
- 01:42 - 01:43
データサイエンス一
- 01:43 - 01:43
では
- 01:43 - 01:45
えこの将来性も考え
- 01:45 - 01:46
て、XLと
- 01:46 - 01:47
いう風なことを使って、
- 01:47 - 01:50
皆さんには作業を覚えてもらいたいなと思っています。
- 01:53 - 01:57
ではえま今回まオリエンテーションという風なこともありますが、少しだけ
- 01:57 - 02:01
えま第一回目の内容というところで進めていきます。
- 02:02 - 02:03
でえ、その中で
- 02:03 - 02:07
ま、今回の授業の名前にもなっています。データサイエンス
- 02:07 - 02:11
あとはデータとは何かという風なことについて、少し触れていきます。
- 02:13 - 02:17
でえ、そもそもまだデータサイエンスって何?っていうところですが。
- 02:17 - 02:20
えー、ここにあります。データを扱う学問、
- 02:21 - 02:26
統計学、そして情報学、それが混じったものだという風に言われています。
- 02:27 - 02:29
で、何かま情報があったとする
- 02:29 - 02:35
え像の情報に対して統計学を有効活用しているのかが重要ということ。
- 02:35 - 02:37
この情報という風なものを、
- 02:37 - 02:39
もちろんいろんな情報があります。
- 02:40 - 02:41
例えばですが、
- 02:41 - 02:42
十代
- 02:42 - 02:43
の学生は
- 02:43 - 02:43
え、
- 02:44 - 02:44
例えば
- 02:44 - 02:45
えappleを使っている
- 02:46 - 02:46
のが
- 02:46 - 02:47
多い
- 02:47 - 02:48
であったりとか、
- 02:49 - 02:53
あとは天気の話。でもえ、今日は雨が降りそうだという風なその
- 02:53 - 02:55
色んな情報に対して、
- 02:55 - 03:01
統計学という風なことをちゃんと使っているのか、有効活用しているのかというところが重要だと
- 03:01 - 03:02
いう。風に
- 03:02 - 03:02
ます。
- 03:02 - 03:05
少しま抽象的にはなっていますが、
- 03:05 - 03:10
えこのデータを扱う統計学と情報学のミックスという風なイメージを持っていただければな
- 03:11 - 03:12
何もやっています。
- 03:14 - 03:18
でえ、あとはま分析と解析の違いという風にあります。
- 03:18 - 03:21
時々まあの一緒にしてしまうことがあったりするんですが、
- 03:21 - 03:23
分析という風なものは、
- 03:24 - 03:27
調査対象のデータを何か意味がある情報
- 03:27 - 03:28
に置き換えること。
- 03:29 - 03:32
そうではなくて、解析という風なのは、
- 03:32 - 03:35
そのま分析があって、分析の結果を
- 03:36 - 03:37
ね、論理的に調べて、
- 03:37 - 03:41
何かの課題を解決したい、問題解決のために
- 03:41 - 03:44
のアクションに結びつけることという風なことがあります。
- 03:44 - 03:45
なので、
- 03:45 - 03:47
分析ということがあって、その後に
- 03:48 - 03:51
解析をするという風な、そういった違いがあります。
- 03:53 - 03:53
で、
- 03:53 - 03:55
データとは何か
- 03:55 - 03:57
ということ。先ほどま天気の話もしましたが、
- 03:57 - 04:02
例えば今日傘を持っていったら方がいいのかなどうかなという風な課題について考えていく
- 04:03 - 04:03
で、
- 04:04 - 04:07
じゃあどんな方法で傘を持っていくべきかどうかを決めようかな
- 04:08 - 04:08
ということ
- 04:09 - 04:09
で、
- 04:10 - 04:15
例えば一人の方は天気予報ですね。ネットの天気予報を見るという風なものもあるかもしれません。
- 04:16 - 04:20
あとはまなんとなくという風なま他の方は、例えばなんとなく今日はな
- 04:21 - 04:21
雰囲気を
- 04:21 - 04:23
という風なことかもしれません。し
- 04:24 - 04:26
え、また別の方という風なのは、ま外を見て
- 04:26 - 04:28
あ、例えば曇ってるなとか、
- 04:28 - 04:31
そういったものを見て判断するという風に、
- 04:31 - 04:32
あのいろんな
- 04:32 - 04:35
考え方、いろんな見方で傘を持っていくべきかと
- 04:35 - 04:36
いう風なことを決めると
- 04:37 - 04:37
いうことであります。
- 04:38 - 04:44
で、その中でも例えば天気予報で降水確率三十パーセントと言われたらと
- 04:44 - 04:45
いう風に、
- 04:45 - 04:46
今回は書いています。
- 04:49 - 04:50
で、
- 04:50 - 04:50
データ
- 04:51 - 04:52
先ほどのまえ
- 04:52 - 04:57
ありました。この同法という風なこと、知識という風なちょっと矢印がありますが、
- 04:57 - 05:01
データという風なことがあった時に、それを分析して、何かの情報にしてあげる
- 05:02 - 05:04
で、その情報を解釈して、
- 05:05 - 05:05
知識
- 05:06 - 05:07
を持って意思決定をすると
- 05:07 - 05:08
いう風な、
- 05:08 - 05:09
そういったものがあります。
- 05:10 - 05:10
なので、
- 05:10 - 05:10
ま
- 05:11 - 05:13
今回はま傘を持っていくかどうかという風な
- 05:13 - 05:14
ことを決める
- 05:14 - 05:17
上でも、正しい情報が必要ということ
- 05:17 - 05:18
です。
- 05:18 - 05:21
そのためには、データを得る調査であったりとか、
- 05:21 - 05:23
分析という風なことが必要です。
- 05:26 - 05:31
で、今回はま意思決定ということで、傘を持っていくかどうかというところで言うと、
- 05:31 - 05:31
データ
- 05:32 - 05:36
ということで言うと、今、今までの経験誰もが理解できる形にしたものと書いてますが、
- 05:37 - 05:41
先ほどお伝えした天気予報降水確率三十パーセントと
- 05:41 - 05:41
いう風な
- 05:42 - 05:43
で、
- 05:43 - 05:45
その情報という風なのは、
- 05:45 - 05:46
降水確率三十パーセント。
- 05:47 - 05:47
この時に
- 05:48 - 05:50
八割の確率で雨に売れたなとか、
- 05:51 - 05:53
三十パーセントの時に全く
- 05:53 - 05:54
え、
- 05:54 - 05:54
全く
- 05:54 - 05:56
雨が降らなかったなのかなとか
- 05:56 - 05:58
いう風にま実体験があると思います。
- 05:59 - 05:59
それを
- 05:59 - 06:00
知識として
- 06:00 - 06:01
て、
- 06:01 - 06:05
それで意思決定をちゃんと早く適切に行うというものがあります。
- 06:06 - 06:07
例えば、
- 06:07 - 06:12
降水確率三十パーセントの時に、大体ま八割の確率で雨濡れたなという人がいれば、
- 06:12 - 06:13
きちっと
- 06:13 - 06:15
降水確率三十パーセントという風に聞くと、
- 06:15 - 06:16
絶対傘を持っていこうと
- 06:17 - 06:17
いう風に
- 06:18 - 06:19
そういう風に考える人もいます。
- 06:20 - 06:21
もしくは三十パーセントだとま
- 06:21 - 06:24
全く雨が降っていなかったという風な経験から、
- 06:24 - 06:26
え、今回、意思決定として
- 06:26 - 06:26
今
- 06:26 - 06:31
降水確率三十パーセントだけは傘を持っていかないという風に決める人もいる
- 06:31 - 06:31
という。風に
- 06:32 - 06:33
データは
- 06:33 - 06:36
この降水確率の三十パーセントという風なデータ。
- 06:36 - 06:42
それに対してどんな風に意思決定をしていくか、どんな風に解釈をしていくかと
- 06:42 - 06:42
いうところ。
- 06:43 - 06:44
これについては
- 06:44 - 06:45
人によって変わってくると
- 06:46 - 06:46
いうことです
- 06:48 - 06:48
ね。
- 06:48 - 06:50
改めて先ほどの
- 06:50 - 06:52
ところをえスライドを
- 06:52 - 06:53
見ていただきました。
- 06:54 - 07:00
ちょっとこの辺りはもう少し難しいんですが、まずは何かデータという風なものがあった時に、それを分析する
- 07:01 - 07:01
ということですね。
- 07:02 - 07:02
それは、
- 07:02 - 07:06
これから何か決めていく意思決定の上で、
- 07:06 - 07:10
その判断の基準になるという風なことになっています。
- 07:13 - 07:15
とはえ、次の
- 07:15 - 07:20
トピックとしては、社会調査データ分析の用語解説というものがあります。
- 07:20 - 07:28
というのもま今回データサイエンス一なんですが、ま社会調査士になるという風なこと、社会調査とも大きく関わってきますよというところで、
- 07:28 - 07:33
少しだけいくつかえ、用語についても説明をしていきたいと思います。
- 07:35 - 07:39
でえ、今回まこの科目で対象にするのはま社会調査というところ。
- 07:39 - 07:40
これは、
- 07:40 - 07:43
社会や集団についてのデータを集めて、
- 07:43 - 07:45
その特徴を読み取る
- 07:45 - 07:46
技法です。
- 07:47 - 07:51
で、社会に対しての意思決定を行うためには、データをもうとりあえず得て、
- 07:51 - 07:52
分析を通じて
- 07:52 - 07:54
情報を得ることが必要です。
- 07:55 - 07:56
さらに、データを分析したりとか、
- 07:57 - 08:02
解釈したりとかっていう風な、そういったデータリタリテラシーを鍛えていただく
- 08:02 - 08:05
という風なこと。これが社会調査の意義です。
- 08:07 - 08:11
でえ、今回ま、社会調査データの分析ということで、
- 08:11 - 08:14
分析というのは、集めたデータ
- 08:14 - 08:14
から
- 08:15 - 08:16
客観的
- 08:16 - 08:16
な
- 08:17 - 08:19
方法によって情報をまとめる、
- 08:19 - 08:22
そして妥当な説明をすること、
- 08:23 - 08:26
この科目では数字を使ったデータを扱うと
- 08:27 - 08:27
いうことで、
- 08:27 - 08:31
なんとなくこう思うとかっていう風なことではなくって、
- 08:32 - 08:34
数字として十パーセント
- 08:34 - 08:34
とか
- 08:35 - 08:37
百パーセントとかっていう風に、
- 08:37 - 08:41
その数字を使った客観的な方法ということが
- 08:41 - 08:42
ポイントです。
- 08:43 - 08:45
あと次にあるのがデータ処理
- 08:46 - 08:46
ですね。
- 08:46 - 08:50
分析をの前に行うデータの整備や加工、
- 08:51 - 08:54
これはま時々勘違いがあるのが、調査データを使って
- 08:54 - 08:57
分析という風なことを、すぐに実際はできることではないです。
- 08:57 - 09:01
ちょっとその前の処理というふうなことが必要になってくるので、
- 09:01 - 09:04
こういったところもま今回は、概要として、
- 09:05 - 09:05
今後、
- 09:05 - 09:08
あのもう少し説明していきたいと思っています。
- 09:11 - 09:14
でえ、社会調査の特徴としてなんですが、
- 09:14 - 09:16
まずは集団の特性を知ることが目的と
- 09:16 - 09:17
書いてあります。
- 09:18 - 09:18
え、知りたいのは
- 09:19 - 09:23
えーとその人がどうかというよりは、個人が属する社会や集団について、
- 09:24 - 09:25
例えば
- 09:25 - 09:28
二十代の専業主婦っていう風などんな
- 09:28 - 09:29
特徴があるのかなとか、
- 09:30 - 09:32
大阪に住む学生ってどんな特徴があるのかな
- 09:33 - 09:33
という風に、
- 09:33 - 09:35
一人一人を知るというよりは、
- 09:36 - 09:36
その
- 09:36 - 09:37
社会とか
- 09:37 - 09:39
集団グループについて知ると
- 09:39 - 09:42
いう風なことが社会調査では言われています。
- 09:43 - 09:45
で、現地の調査によってデータを集めます。
- 09:46 - 09:47
え、これはま調査対象まで行って
- 09:48 - 09:50
データを集めるというところで、何か本を見る
- 09:50 - 09:53
ネットを見るという風な、それだけではない。
- 09:53 - 09:55
そういうのをま文献調査とか
- 09:55 - 09:58
資料調査とかっていうように言いますが、それだけとは違っています。
- 09:59 - 10:01
で、データの分析というところ
- 10:01 - 10:01
で、
- 10:02 - 10:03
他の集団グループ
- 10:04 - 10:04
であったりとか、
- 10:05 - 10:09
昔としてどう違っているのかなといった比較という風なことを行っていく
- 10:10 - 10:14
データが示した特徴から、なぜそうなるかなという風な
- 10:14 - 10:17
ま妥当なという風なことを書いていますが、説明を
- 10:17 - 10:18
考えていきます。
- 10:20 - 10:28
こちらの方は、えー分類ですね。社会調査という風な左にありまして、えーと、その中、右にある二つに分かれています。
- 10:28 - 10:31
統計調査事例調査という風なことがあります。
- 10:32 - 10:33
え、これはえーと
- 10:33 - 10:38
まソーシャルリサーチ基礎であったりとか、データサイエンス入門のところでも少しもお話しした
- 10:38 - 10:40
ものになっているかなと思います。
- 10:43 - 10:45
で、統計調査ということで言うと、ま具体的な発想
- 10:46 - 10:49
社会や集団、一個一体としてみるではなくて、何かの
- 10:49 - 10:52
観察単位ケースごとに分けます。
- 10:52 - 10:53
なんとなく
- 10:53 - 10:56
社会ということだけではなくて、例えば日本に住んでいる人とか、
- 10:57 - 11:00
日本の中でも日本の大阪に住んでいる
- 11:00 - 11:04
留学生とかっていう風に、ケースごとに分けていきます。
- 11:04 - 11:07
で、データを集めて特徴を掴もうとする
- 11:07 - 11:13
で、グループの中で人々がどんな風にま分布分かれているのかなということで着目していきます。
- 11:15 - 11:18
例えば、ま英語の能力というところで、このスライドがあります。
- 11:19 - 11:19
左の方ですね。
- 11:20 - 11:27
なんとなく色々な中で八十点、四十点、二十点という風な若い人がいた時に、これバラバラだと分かりにくいので、
- 11:27 - 11:28
例えばそれを
- 11:29 - 11:30
点数ごとで並べてみる。
- 11:31 - 11:34
二十点四十点、八十点という風に右の図で
- 11:34 - 11:36
書いてあるように、点数ごとを並べてみる
- 11:37 - 11:44
で、この考えのテストが例えば三十点ですよと。平均点三十点ですよという風なことで、例えば出てきたら
- 11:44 - 11:45
平均点より低いとか
- 11:45 - 11:47
高いとかっていう風に、
- 11:47 - 11:49
だんだんだんだんそんな比較ができてくると
- 11:49 - 11:50
いう風なものが
- 11:50 - 11:51
挙げられます。
- 11:52 - 11:52
このように
- 11:53 - 11:54
何点でしたとか
- 11:54 - 11:58
いう風なデータだけじゃなくて、それを比較するということが非常に
- 11:58 - 11:58
重要です。
- 12:01 - 12:04
だからこの辺りもかなり難しいので、えーと簡単にだけ
- 12:04 - 12:07
なんですが、コードで置き換えるという風な話です。
- 12:07 - 12:09
えーと、これは操作化
- 12:09 - 12:10
という風に言いますが、
- 12:11 - 12:13
概念を具体的な変数によって置き換えること。
- 12:14 - 12:16
変数とは人によって変わる
- 12:16 - 12:16
ということですが、
- 12:17 - 12:18
例えば英語の能力、
- 12:18 - 12:22
皆さんは英語できる方、できない方という風なことで、
- 12:22 - 12:23
あー、例えば的に
- 12:23 - 12:26
この英語ができるという風なこと
- 12:26 - 12:27
っていうのは、
- 12:27 - 12:29
なかなか正直難しいです。
- 12:29 - 12:33
えーと、これ英語ができるって、どうやったら英語ができるのかなとかっていうようなこと、
- 12:33 - 12:37
分かりにくい中で、例えば英語のテストの点数
- 12:37 - 12:39
という風な方で分けることができます。
- 12:39 - 12:40
ただし、これも
- 12:41 - 12:42
リスニングの
- 12:42 - 12:45
テストの点数が高い人、低い人であったりとか、
- 12:46 - 12:47
例えば英語の
- 12:47 - 12:49
言葉、単語を知っている
- 12:49 - 12:50
のが
- 12:50 - 12:52
多いかかというのはテストですると
- 12:52 - 12:52
いうふうに
- 12:53 - 12:55
大きく英語の能力という風に言って
- 12:55 - 12:57
もそのなのかと
- 12:58 - 12:58
か
- 12:58 - 12:59
ライティングなのかとか、
- 12:59 - 13:00
単語の
- 13:00 - 13:02
テストなのかとかっていう風に
- 13:02 - 13:02
いろんな
- 13:03 - 13:03
ことがあります。
- 13:03 - 13:07
それを英語能力という風な、なんとなく分かりにくい。ぼんやりしたものを
- 13:08 - 13:09
操作と言って、
- 13:09 - 13:11
英語のテストの点数によって測定すると
- 13:12 - 13:12
いう風なものが、
- 13:13 - 13:15
こちらのコードで置き換えるという話です。
- 13:17 - 13:17
で、ただし
- 13:17 - 13:20
ま操作化を考えていくのは難しい。
- 13:20 - 13:22
例えば、ま性別に関する平等意識の高さ、もしくは
- 13:23 - 13:24
おたくさんの度合い
- 13:24 - 13:27
という風に、どうやって計っていくのか、かなりま難しいです。
- 13:28 - 13:29
こういったことも、まデータサイエンス
- 13:30 - 13:30
を
- 13:30 - 13:32
であったりとか、まあの他の
- 13:32 - 13:35
えソーシャルリサーチの演習という風なことも
- 13:35 - 13:36
考えながら
- 13:36 - 13:37
で、通して、
- 13:37 - 13:39
少しずつ一緒にやっていきたいと
- 13:39 - 13:40
いう風に考えています。
- 13:43 - 13:48
でえ、これはま全数調査、標本調査という風にありますが、全数調査という風な全部を
- 13:48 - 13:53
する調査標本調査というのは、その中でも一部という風なことを選ぶということ
- 13:53 - 13:54
です。
- 13:54 - 14:04
え、これはまあの左かま全部母集団という風な全体右が標本という風に一部を分けますよという風なこと。これはま説明を以前もしたかと思います。
- 14:06 - 14:09
これはま先ほどと一緒なので飛ばしていきます。
- 14:10 - 14:15
でま、今回ま記述統計と推測統計というところで記述統計学は、
- 14:15 - 14:17
データ全体の概要を記述するための方法
- 14:18 - 14:19
データ分析の基礎
- 14:19 - 14:20
基礎ですね
- 14:20 - 14:23
推測、統計という風なこと。これは赤になりますが、
- 14:24 - 14:26
これは実はデータサイス二の授業になるので、
- 14:27 - 14:33
今回データサイエンス一では、この青い記述統計という風なことを中心に行っていきたいと思います。
- 14:35 - 14:35
では、
- 14:35 - 14:36
最後に
- 14:36 - 14:37
授業のレポートの
- 14:37 - 14:38
説明です。
- 14:38 - 14:44
で、今回の授業のレポートなんですが、このデータサイエンス一の授業、この授業を通して期待していること、
- 14:44 - 14:47
学びたいことは何でしょうかという風なことを
- 14:47 - 14:48
考えてください。
- 14:48 - 14:51
百五十文字以上で回答してください。
- 14:52 - 14:55
では、トリプルエーで書いて提出をいただければと思います。
- 14:55 - 14:55
では、
- 14:56 - 14:57
この第一回授業を終わります。