(1)授業の達成目標 | 授業で得られる「学位授与の方針」要素 | ⇔ | 【授業の達成目標】 | 大学DP | 学士の称号にふさわしい基礎学力と専門的学力 | ⇔ | データサイエンスの見方に沿って情報を捉えることができる.モデルカリキュラム「基礎」においては,データの図示の中に代表値や散布度などの統計量を読み取れる. |
|
(2)授業の概要 | AI(人工知能)技術の急速な普及を背景にビッグデータの処理と活用が可能となり,データサイエンスの必要性が急速に増したことで,我が国はデータサイエンスを2025年に大学生全員が身につけるべき素養として位置づけており(参考:文部科学省「AI戦略2019」),データサイエンス教育コンソーシアムにより学習すべきリテラシーレベルのカリキュラムも公表されました. 本授業ではそのリテラシーレベルの学習を進めます.データサイエンスの必要性については,これからの社会のあり方を考え,そこで生活する個人の立場を念頭においた理解を図ります.また,データサイエンスの基礎を築いていくために不可欠な統計学,情報科学,数学の位置づけを理解します. そのために,こうした問題を密接なものとしてとらえやすいよう,オープンデータとして提供されている実データ,とくに信州大学のある長野県の実情を明らかにするものを取り入れた多くのデータ処理結果を基本材料に進めます.
|
(3)授業のキーワード | 問題発見・解決,論理的思考,データサイエンス,統計学,プログラミング,数理的手法 |
(4)授業計画 | 第1回:(導入)データ駆動型社会とSociety5.0 現代社会の特徴としてSociety5.0などの概念がなぜ提唱されるようになったのか全体像の把握を目指します.また経済産業省の新産業ビジョンや第4次産業革命などの理解を通じて,私たちがデータサイエンスを必修とすべき時代となった背景へのより正確な描像を築きます. 第2回:(導入,心得)データの増大する社会とAIの必要性 データを日夜増大させ続ける社会の仕組み,とくにIoTの広がりとインターネットで集積される情報を扱う分析装置としてのAIの必要性をとらえること,また,インターネット上のSNSを中心にAIの活用の仕方が情報セキュリティを含めて,私たちの社会のあり方を大きく変えつつある現状を把握します.たとえば東京五輪(2021年)のアメリカでのTV中継視聴率が前回五輪(2016年)に比べて5割近くと大きく落ち込んだのも,そうした現れの一つです. 第3回:(導入,心得)オープンデータの活用と個人情報管理 基礎編で扱うオープンデータの活用に焦点を当て,データ駆動型社会のあり方を考えます.またデータベース管理技術の視点から個人情報管理の重要性に気づいてください.政府統計のe-statや地域経済分析のRESASにある実データは,オープンデータの一例です. こうしたデータの取り扱いの中に,個人情報保護の技術がどう関わるかも説明します. 第4回:(基礎,導入)1変量データから情報を得る方法の概説 代表値*,散布度*,箱ひげ図*,分布の図示(*は高校までで既習) 箱ひげ図ではとくに分布の特徴が要約されているので重要です.なお,2021年度までの高校数学Iで扱った計算法の一部は特殊であり,実際には別定義が使われています. 分布の図示を介すると,複数のデータの特徴の比較や,ビッグデータによく現れるべき分布的な特徴を読み取ることもできます. 第5回:(基礎,導入)2変量以上のデータから情報を得る方法の概説 クロス集計,散布図*,相関係数*,回帰直線(*は高校までで既習) クロス集計に伴う分割表の考え方は,私たちが統計データへの判断で犯しがちである誤認を避ける上で重要な見方です.また回帰直線は人工知能による予測技術などで多用される基本技術です.多くの実データを通じて,2変量の相関と予測との関連に触れていきます. 第6回:(基礎,導入)図示による表現 第4回と第5回の概説を踏まえて「導入」で話題とした事例などを,適切にグラフを描くことやビッグデータによく表れる分布を通じて確認をします. 第7回:(基礎,導入)数値による比較 第4回と第5回の概説を踏まえてこれまで取り上げた統計処理に関わる概念が,人工知能技術へいかに適用されているのかを確認します. 第8回:(導入,基礎,心得)総括 現代社会におけるSociety5.0の概念が絵空事でないことを,基礎編で扱った事例も交えて振り返ります. |
(5)成績評価の方法 | 第1回から第7回まで毎回の課題ごとに10点で合計70点,総合問題(第8回)20点.
※いずれもeALPS/eChes上に課題を掲示し,eALPS/eChes上で課題を提出します
他に授業に相応しい良い質問に対して最大20点の加点をします.ただし全体で100点は超えません.
|
(6)成績評価の基準 | 60点未満:不可 60点以上70点未満:可 70点以上80点未満:良 80点以上90点未満:優 90点以上:秀 |
(7)事前事後学習の内容 | 毎回の授業においては,eALPS/eChes上に指示のある復習すべき内容をもとに小テスト(練習問題)が提供されるので,それを参考に学習を進めてください.
授業に相応しい良い質問に対して加点があるので,提供資料を批判的に見ることを心がけてください.
※この授業は45時間の学修を必要とする内容です。 |
(8)履修上の注意 | クラス指定必修科目です.授業開始日までに履修登録を済ませてください.
eALPS/eChesに掲載した方法にしたがって課題(レポート提出または小テストの受験)があります.各課題にはそれぞれ締め切りが設定されているので,期日までに提出または受験してください. また質問に対する加点となるような良い質問を期待しています.
授業で提供した材料で説明のあるデータ処理において,各自が実習を行う課題はありませんが,多くの課題は実行できるプログラムとして提供してあります.興味のある人は自習を進めてみてください.質問にも対応します.
|
(9)質問,相談への対応 | eALPS/eChes上の掲示板およびメール szkjiro@shinshu-u.ac.jp によります.研究室訪問もメールで事前に時間帯を打合せてください. eALPS/eChesの使い方についてはe-Learningセンターに相談してください. |
(10)授業への出席 | 出席はとらない |
(11)授業に出席できない場合の学修の補充 | |
【教科書】 | 授業は教科書に沿って進めるわけではありません.データサイエンス・数理・AI教育強化拠点コンソーシアムの提供するモデルカリキュラムの詳細を次の書籍で確認できます.
竹村彰通編「教養としてのデータサイエンス」講談社 |
【参考書】 | 本授業に関わる知識を深めるための参考書をいくつかあげておきます.また本授業の先まで学習を進めるための参考書の案内をeALPS/eChesに掲載してあります.
久野遼平他「大学4年間のデータサイエンスが10時間でざっと学べる」KADOKAWA 倉田博史「大学4年間の統計学が10時間でざっと学べる」KADOKAWA 我妻幸長「Google Colaboratoryで学ぶ! あたらしい人工知能の教科書」翔泳社 矢沢久雄他「コンピュータはなぜ動くのか」日経BP 矢沢久雄他「プログラムはなぜ動くのか 第2版」日経BP 中井悦司「ITエンジニアのための機械学習理論入門」技術評論社 浅野正彦他「はじめてのRStudio」オーム社 高橋秀一郎「e-Statと仲良くする本」NextPublishing 西田典充「Rでらくらくデータ分析入門」技術評論社
|
【添付ファイル】 |
なし |