お世話になります。競輪の並びやレース結果の過去データを自分のパ…

お世話になります。

競輪の並びやレース結果の過去データを

自分のパソコンのデスクトップの

任意のフォルダに集めたいです。

プログラムはpythonで、

楽天kドリームさんのサイトを

スクレイピングしたいです。

vscodeをエディタで初めたいです。

環境設定から、スクレイピングして

データ取得完了までの流れを教えてください。

回答

dat********:

の並びやレース結果の過去データには著作権は存在しませんが、Webスクレイピングで高負荷を与えるのはオススメしません
データを参照して取り込むだけならブラウザで表示させるのと同じなので、言うほど高負荷を掛ける訳でも無いですがね

python スクレイピングでAmazonで検索すれば参考になる本はいくらでも見つかります

著作物について
https://www.bunka.go.jp/seisaku/chosakuken/seidokaisetsu/gaiyo/chosakubutsu.html


1051010379:

匿さんがおっしゃっていますが、
WebスクレイピングはWebサーバーに過度に通信負荷をかけると威力業務妨害、また、そもそもサイトに掲載されている情報を2次利用する際には著作権等の問題がある場合があり、株価や結果を掲載しているサイトでは最近ではスクレイピングについての利用規約を明記しているところもあるらしく、違反すると問題になりかねません。(明記されていないからと言って無断で使用してよいわけではありません)
YouTubeに動画をあげている方が規約を守っているのか、守っていないのかは知りませんが。

以上を踏まえて、それでも良いのであれば「vscode
python」や「python Beautifulsoup」で検索すれば情報が見つかります。
そもそもPythonが入っていなければ環境構築からですね。
あくまで自己責任で、お願いします。

    1150455755

    pythonの決まり事で
    タイマーを3秒に
    設定して
    一つづつ情報取得する
    という宣言をすれば
    問題ないそうです。

    確かに禁止しているサイトと
    スクレイプ条件付など
    ありました。
    掲示してないサイトは
    pythonのルールに
    準ずるそうなので、
    タイマー宣言を守れば
    大丈夫ということでした。

    重く考えてくださり、
    サイト確認に関心がもてました。

    ありがとうございました。


匿:

> データ取得完了までの流れを教えてください。
まずは、そのサイトをスクレイピングして良いという許可をとってください。
https://keirin.kdreams.jp/info/sitepolicy/?l-id=l-ti-directoryNav_link_sitepolicy

    1150455755

    YouTubeに競馬のデータを
    スクレイピングしてるので
    競輪もスクレイピングのやり方を
    教えてほしいと相談しただけです。

    ありがとうございました。