講習会

for 塾生

募集終了

【AIC春休み集中講座】Pythonで始めるウェブスクレイピング入門

3/13(木)、3/14(金)13:00-16:30

回数:全6コマ(1日3コマx2日間)

形式:対面

主催:AIC

講習会の概要

 この講習会では、インターネット上の情報を自動的に収集する「ウェブスクレイピング」について、実際に手を動かして学習します。ここでは普及率が特に高く、書きやすいプログラミング言語であるPythonを使用します。スクレイピングを学ぶ過程で、Pythonの基本的な文法(ライブラリの活用)や、HTMLの構造についても理解を深めていきます。
 到達目標は、受講者が自身で簡単なスクレイピングを実行し、必要なデータを取得できるようになることです。ウェブページの仕組みを学びながら、日常生活や仕事で役立つスキルを身につけましょう。

形式・場所

日吉協生館2階AICラウンジにて対面形式で実施
※録画およびオンライン配信の予定はありません。

講師

直井 智基 (理工学研究科 開放環境科学専攻 修士2年)

対象

塾生および教職員

  • Pythonを使って実践的なことをしたい方なら、文系理系問わず受講可能です。
  • Pythonについては、四則演算やデータ構造、関数、ライブラリなどを習ったことがある人が望ましいですが、今回、はじめてPythonを触る人でも、やる気と情熱さえあれば参加可能です。

※受講申し込みが多い場合には、抽選することもありますので、予めご了承ください。

持ち物

Google アカウント(keio.jp)、ノートPC

日程

1日目 3/13(木)13:00-16:30

2日目 3/14(金)13:00-16:30

各回の実施内容

1日目
3/13(木)
第1回 ウェブスクレイピングとは
13:00-14:00
最初にウェブスクレイピングの概要を学習する。スクレイピングの具体的な利用例や可能性を理解し、技術を使用する際に必須である法的な注意点について解説する。
さらに、Pythonを用いた環境構築をGoogle Colaboratoryを活用して行い、受講生がスムーズにプログラミングを始められる環境を整える。授業後半では、こちら側で用意したサンプルプログラムを動かし、Pythonの動作を確認する。プログラムを動作させ、スクレイピングに対する全体像を掴むことを到達目的とする。
第2回 Pythonの基本文法
14:15-15:15
スクレイピングを行う上で必要なPythonの基本文法について学習する。最初に、変数やデータ型(特にリストを重点的に)の使い方、if-else条件分岐、ループ構造など、スクレイピングに必須となる基本文法を学習する。
続いて、スクレイピングで頻繁に使用するrequestsやBeautifulSoupなどといったPythonライブラリの簡単な使い方にも触れる。また、確認問題を頻繁に挟むことで、受講生が実際に手を動かして学ぶ機会を提供する。簡単なスクリプトを実行できるようになることを到達目的とする。
第3回 HTMLの構造
15:30-16:30
スクレイピングを行う上でHTMLの理解は不可欠であるため、1コマ分の授業を使って学習する。ウェブページを構成する基本要素である、HTMLのタグ、属性、階層構造について重点的に学習する。
また、ブラウザの「開発者ツール」を使用して、実際のウェブページ上でHTML構造を確認しながら、解析するスキルを習得する。具体的には、抽出したいデータがどこに存在しているのかを効率的に見つけ出し、それをプログラムで扱うための基礎力を身につける。データを解析するための準備を整えることを到達目的とする。
2日目
3/14(金)
第4回 データの取得
13:00-14:00
残りの3回の授業を使って、実際のスクレイピングに取り組む。まず、PythonのrequestsやBeautifulSoupなどのライブラリを使ったサンプルプログラムを用意し、その動作を確認しながらコードの内容を詳しく解説する。
具体的には、HTMLをどのように解析し、どのように特定のデータを抽出するのかを学ぶ。また、受講生自身に収集したいデータを考え、その目的や対象を具体化してもらう。この回では、5回、6回に続くスクレイピング技術の実践準備を目的とする。
第5回 スクレイピング実践 (1)
14:15-15:15
第4回で具体化したスクレイピングの目的をもとに、受講生が自ら実装を行う。対象のウェブページから抽出したいデータに応じて、それぞれのスクリプトを作成する作業を進める。
なお、講師やTAからヒントやアドバイスを積極的に提供するようにする。受講生には、自身で作成したプログラムを動かしながら改善点を見つけ、エラーを修正し、完成させていくプロセスを体験してもらう。この回において、受講生が実践を通じて理解を深めることを到達目的とする。
第6回 スクレイピング実践 (2)
15:30-16:30
第5回に引き続いて、作成したスクリプトを完成させる。最終的には、収集したデータをCSVやExcel形式で保存し、日常や業務での活用をイメージできる形に整える。
また、講習会の最後の時間を使用して、受講生それぞれが成果物を発表し、自身の取り組みや工夫点について共有する。この回を通じて、講習会全体の総まとめを行い、受講生がスクレイピングのスキルを身につけられたかどうかを確認する。最終的には、実践的なプログラミングの楽しさを知ってもらうことを到達目的とする。
ページトップ