GrowGen | 整

Website Scraping with Python

J.Gong

2020-01-13

0.26min

Website Scraping with Python

Parsing robots.txt

page 28

Using Beautiful Soup

用来解析 HTML

  • page 56 - 使用
  • page 101 - 利用 strainer 只解析想要的数据

Exporting the Data

  • page 80 - CSV
  • page 87 - JSON
  • page 90 - SQLite
  • page 97 - MongoDB

Using Scrapy

  • page 111

Handling JavaScript

  • page 186 - Splash
  • page 196 - Selenium

Cloud

© 2025 我的技术博客. 保留所有权利.

使用 Astro.build + Mantine 构建 | 部署在 Vercel