Pythonの文字化けで検索すると同じようにはまってる人がたくさんいた。
よくわかってないけど、取り敢えず先に進めるようになったので中途半端なメモ
Pythonの中ではunicode型というものが標準で使われていて、これが問題の中心っぽい。
なので外から入れるときにunicode型に変換して、中から外に出すときにunicode型からutf-8に変換する、ということを頭の中に入れておくと見通しがよくなるみたい。
文字関係で出てくる
decode
encode
の意味は
decode=元の型に戻す
encode=元の型から、ある型に変換する
というのを初めて知った・・・。なので
encode(‘UTF-8’)、utf-8へunicode型から変換
decode(‘UTF-8’)、utf-8からunicode型へ変換
という意味らしい。
もう一つ
unicode(str, ‘utf_8’)
というのがあって、これも使い方はdecodeと同じらしい。