様々なHTML要素を含むページでスクレイピングの練習をしましょう
テキスト、リンク、画像などの基本的なHTML要素
表形式のデータを含むページ
フォーム要素とユーザー入力
様々なリスト形式のデータ
class、id、data属性などの練習
JavaScriptで生成される要素
import requests from bs4 import BeautifulSoup url = "http://localhost:3000/basic" response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') # 見出しを取得 title = soup.find('h1').text print(title)
# class属性で要素を選択 elements = soup.find_all(class_='product-name') # id属性で要素を選択 element = soup.find(id='main-content') # CSSセレクタを使用 items = soup.select('.item-list li')
実際のWebサイトをスクレイピングする前に、必ず以下を確認してください: