Pythonでスクレイピングをする学習をはじめました。
Pythonは初心者です(他の言語は学習済み)。
私が買った本がこれ↓
「スラスラ読める Pytonふりがなプログラミング スクレイピング入門」です。
現在一周読んで、実際パソコンでも半分くらいまでやりました。
なぜこの本にしたのかや、本の感想について書いていきたいと思います。
なぜこの本にした?
Pythonでスクレイピングの学習をするにあたり、どの本がいいのかかなり迷いました。
ググったりYouTubeで調べたりしても、おすすめしてるのが結構バラバラだったり、
どれが自分のレベルに合ってるのかわかりません。
なので実際本屋に行って見てみました。
そこでパラパラめくってみて一番よさげだったのがこの本です。
他の本に比べたらわかりやすそうだったし、スクレイピングの応用テクニックなども載っている。
簡単すぎず難しすぎない、自分のレベルに合ってるかなと思いこの本にしました。
他の本は結構ぶ厚かったり、文字も小さく難しそうでした。
「スラスラ読める Pytonふりがなプログラミング スクレイピング入門」の感想。
実際にこの本で学習してみた感想は、「わかりやすくて結構いいですよ。」
初心者向けに
- Pythonの環境構築
- requests、BeautifulSoupを使ったスクレイピングの基礎
がわかりやすく書いてあるし、
- スクレイピングの応用テクニック
- データの整理・加工方法
- 表形式のデータを扱うPandasの使い方
などもかいてあるので、スクレイピングの全体像が把握できました。
この本をやれば実際のWebサイトからスクレイピングできるようになります。
Webサイトから複数の画像を自動でダウンロードできたときは感動しました
( *゚A゚)
目次はこんな感じ↓
ただ決して簡単ではないです。
オブジェクトやメソッドなど、私は他の言語でプログラミングを勉強していたので理解できましたが、
プログラミング初心者だとなかなか理解できないのではないでしょうか。
また、この本はPythonの基礎文法からは学習できません。あくまで基礎文法がわかっている前提です。
(私はPython基礎文法はYouTubeでさらっと勉強しました。)
なのでこの本は、
- 他のプログラミング言語は学習したが、Pythonは初心者。
- Pythonは学習済みでスクレイピングを勉強したい。
という方におすすめです。
プログラミング初心者は、同じシリーズの下の本を事前に読んでおくといいかもしれません↓
決して簡単ではない。
先ほども書きましたが、決して簡単ではありません。
これはこの本がというか、スクレイピング自体が結構難しくて奥が深い。
オブジェクトやメソッドが次から次に出てきます。
一回ではなかなか理解できないと思います。
ただこの本のいいところは、理屈は後回しにしてもとりあえず本の通りにコードを書けばスクレイピングできるということです。
とりあえず一回やってみて、あとから理解を深める、でもいいと思います。
Selenium(セレニウム)は?
スクレイピングというと、Selenium(セレニウム)をイメージする方もいるでしょう。
知らない方のために説明するとSeleniumとは、JavaScriptが使われているWebサイトでもスクレイピングできるライブラリです。
ただ、この本ではSeleniumは基本的に学習できません。
最後の方に少し触れる程度です。
Pythonの環境構築方法は?
この本のPython環境構築の方法は、VsCodeとPowerShell(Macはターミナル)です。
PowerShellとはコマンドプロンプトをもっと強力にしたようなもの。Windowsなら標準搭載されているので大丈夫です。
やり方もとっても簡単でした。
私的にはこのやり方が一番オススメです。
Pythonの環境構築というと「アナコンダ」とか「ジュピターなんとか」とか聞いたことがあるかもしれませんが、
あれらはPythonをガチでやりたい人が使えば良くって、初心者はまだ必要ないです。
ちなみにアナコンダとはPythonに必要なライブラリが初めから入っている便利なソフトです。
なんか名前からして初心者は尻込みしてしまいますよね(笑)
ジュピターなんとかは、アナコンダと一緒にインストールするエディタみたいなもの。
こんな本もおすすめ。
私が買った本は決して簡単ではないので、
スクレイピングを絶対に挫折したくないという方は以下のシリーズ本もおすすめです↓
たぶんこれが一番簡単だと思います。