in my 雑記

プログラミング bump 日々のことなど

pyhtonを入れたらとりあえず入れるライブラリ

PCをクリーンインストールしたので、よく使うライブラリをまとめた。
anacondaとかでまとめて入れてもいいけど、いちから入れたほうが最小限で済むので好き。
個人的なメモ。

sqlite3

slite(DB)に接続、操作する用のライブラリ。
ちょっとした、スタンドアロンのアプリとか、軽いスクレイピングデータ保存するときとかに使う。 sqliteは並列処理に弱いため、スクレイピング処理が遅くて並列処理にしようと思ってsqliteを使っていると、
DBごと変更せざるおえなくなる。
あくまで、ちょっとしたものを作るときに使う。
sqliteはデータを単一ファイルで持っているのでいろいろ手軽。

pip install sqlite3

psycopg2

postgresql(DB)に接続、操作するようのライブラリ。
sqliteで物足りないときに使う。
使い方はsqlite3とほぼ同じなので、移行しやすい。

pip install psycopg2

tqdm

プログラムの進捗をプログレスバーで表示してくれる。
超手軽にプログレスバーをつけてくれる、開発時にとりあえずfor文につけておくと便利。

pip install tqdm

line_profiler

プログラムの時間がかかる個所を分析するライブラリ。
関数にアノテーションをつけるだけで使える。

pip install line_profiler

joblib

並列化用ライブラリ。
高速化のために色々試みたけど、どうにもならんってときは並列化が手っ取り速い。
並列化ライブラリの中ではとても簡単にかける。

pip install joblib

requests

HTTPリクエストを返してくれるライブラリ。
スクレイピング、クローリングには必須。
デフォで入ってるurllibより簡単に短く書ける。
セッション管理もできるので、ログインするサイトとかにも使える超万能。

pip install requests

beautifulsoup4

HTTPリクエストからほしい要素だけを抜け出してくれる。
requestsとセットで使う。
スクレイピング、クローリングには必須。

pip install beautifulsoup4

selenium

requestsだとjavascriptのレンダリングまでしてくれないのでその時に使う。
後webブラウザの自動化をしたいときに使用。
自動化するブラウザはchroniumが良い。
ただし、javascriptのレンダリングだけならSplash使うとよさそうだと思う。

pip install selenium

tensorflow

機械学習用のライブラリ。 windowsだとpython3.5の64bitじゃないと動かないので注意。
googleが開発しているので今後も伸びていくだろう。

pip install tensorflow

keras

tensorflowを簡単に使えるラッパーライブラリ。
kerasはjavascriptやらjavaやらでも使える。
機械学習=pythonだと思っていたけど、今はどんな言語でも簡単にできるようになった。

pip install keras

pandas

データ構造という形式で配列の操作ができるライブラリ。
私はmatplotlibでデータを可視化するときぐらいしか使ってない。

pip install pandas

matplotlib

データをグラフ表示するライブラリ。
pandasと一緒に使う。

pip install matplotlib

codecs

txt、csvファイル操作用ライブラリ。
デフォでも入っているが、こっちのほうが文字コードに強い。
UnicodeErrorにあいたくないならこっちを使ったほうがいい。

pip install codecs

flask

ウェブアプリのフレームワークライブラリ。
1分でローカル環境でハローワールドできる手軽さが最高。
あとラインのapi使うときとかに重宝する。

pip install flask

line-bot-sdk

ラインのapiを使うためのライブラリ。
flaskと一緒に使うと手軽。
ラインボット作るときに使った。

pip install line-bot-sdk

twitter

作ったシステムのログをtwitterで吐くのに使ってる。

pip install twitter

google-api-python-client

googleapiは多岐にわたるgoogleの様々な機能をapiを介して使用できる。
ただ、googleapiはほとんどの機能が有料でしかも高い。
無料で使うなら機能は結構制限される。

pip install google-api-python-client

PyDrive

googleapiのgoogledriveを操作するラッパー。
サーバー間のデータのやり取りならftpを使うよりこっちのほうが手軽にできるし、
同時にバックアップも取れるし、一石二鳥。

pip install PyDrive