こんばんは。年度末の繁忙期で大忙しのため久しぶりのPythonです。
早く会社辞めたい…泣きたい…
今日も頑張っていきます。
今日もスクレイピングの続きです。
前回はhtml内の「タグ」を検索して表示するプログラムを書いたのですが、そもそもタグって種類によって何か違いがあるのでしょうか…
調べてみます。
こちらのサイトを覗かせていただきました。お邪魔します。
HTMLのタグには、文字の大きさや色など書体を表すもの、タイトルや本文などを指定するもの、などなどいろいろ種類があるようです。
その中に、前回検索に使った<a>や<ul>がありました。
上記のサイトによると、
<a>:リンクのアンカー
<ul>:順不同のリスト
とのこと。<ul>は箇条書きみたいなもんなんですかね…きっと。
そして前回なんだか不思議で仕方なかった<li>は、リストの項目だそうです。
「リ」って何だろう。と思っていました。
なるほどなるほど。
そして今日検索するのに使うタグは<href>だそうです。
とここまで書いて、調べてみたらhrefはタグじゃなかった…笑
aタグの属性らしいです。ちょっとよくわかりませんが先に進みます。
その下にはsrcという属性も書いてあります。
srcは<img>タグの属性らしいです。
どちらにせよまだ属性が何たるかは分かりません。
今日分かったのはurljoinという機能があること。
この機能の呼び方が分かりません。関数?ではないような。
でも眠すぎてどうでもよくなってきました。
全然分からないまま今日の章が終わってしまいました。そして眠気がやってくる…
仕事はしたくない、Pythonの勉強にも集中できずスマホをいじってしまうダメな人間…
明日はもう少し頑張ろうと思います。
おやすみなさい。
追伸
会社に個室が欲しい