Stimulator

機械学習とか好きな技術話とかエンジニア的な話とかを書く

2017-06-01から1ヶ月間の記事一覧

PythonでWebスクレイピングする時の知見をまとめておく

- はじめに - 最近はWebスクレイピングにお熱である。趣味の機械学習のデータセット集めに利用したり、自身のカードの情報や各アカウントの支払い状況をスクレイピングしてスプレッドシートで管理したりしている。最近この手の記事は多くあるものの「~して…

Pythonのhttp.serverを利用してWebスクレイピングのunittestを書く

- はじめに - 「Webスクレイピングで情報を収集する」という内容は多い。しかし、Webスクレイピングのコードは肥大化しやすいだけでなく、細かな変更が多くなる。 テストを書いて変更の影響をちゃんと見ておく必要性が高い。unittestとhttp.serverを使ったテ…

headless chromeをPythonのseleniumから動かして引数を考えた (Ubuntu 16.04)

- はじめに - Chrome 59が正式版となりheadless版も正式に動き始めました。めでたい。New in Chrome 59 | Web | Google Developersheadless chromeをUbuntuに導入してPythonから触ったという記事です。Ubuntuへの導入から、実行時の引数となるargsの考察など…