Pythonを勉強してみる人の日記

仕事に元気を奪われながらなんとか続けてみたいと思う限り

Python15日目 htmlのページからリンクを集めてくる回。

こんばんは。年度末の繁忙期で大忙しのため久しぶりのPythonです。

早く会社辞めたい…泣きたい…

今日も頑張っていきます。

 

今日もスクレイピングの続きです。

前回はhtml内の「タグ」を検索して表示するプログラムを書いたのですが、そもそもタグって種類によって何か違いがあるのでしょうか…

調べてみます。

こちらのサイトを覗かせていただきました。お邪魔します。

HTMLタグ/HTML要素一覧 - TAG index

 

HTMLのタグには、文字の大きさや色など書体を表すもの、タイトルや本文などを指定するもの、などなどいろいろ種類があるようです。

その中に、前回検索に使った<a>や<ul>がありました。

上記のサイトによると、

<a>:リンクのアンカー

<ul>:順不同のリスト

とのこと。<ul>は箇条書きみたいなもんなんですかね…きっと。

そして前回なんだか不思議で仕方なかった<li>は、リストの項目だそうです。

「リ」って何だろう。と思っていました。

なるほどなるほど。

 

そして今日検索するのに使うタグは<href>だそうです。

とここまで書いて、調べてみたらhrefはタグじゃなかった…笑

aタグの属性らしいです。ちょっとよくわかりませんが先に進みます。

 

その下にはsrcという属性も書いてあります。

srcは<img>タグの属性らしいです。

どちらにせよまだ属性が何たるかは分かりません。

 

今日分かったのはurljoinという機能があること。

この機能の呼び方が分かりません。関数?ではないような。

でも眠すぎてどうでもよくなってきました。

 

全然分からないまま今日の章が終わってしまいました。そして眠気がやってくる…

仕事はしたくない、Pythonの勉強にも集中できずスマホをいじってしまうダメな人間…

 

明日はもう少し頑張ろうと思います。

 

おやすみなさい。

 

追伸

会社に個室が欲しい