トモロログ

仕事や趣味でのメモや記録など

2016-10-07から1日間の記事一覧

整理標準化データの文字コード

特許庁からもらった xml ファイルの文字コードはeuc-jp、 こちらの環境はmac , python(2.7) でうまく処理できない。 原因はxml処理ライブラリがeuc-jpを処理しないことにあった。 以下の方法で解決。効率よいのかはわからんけど。 import xml.etree.ElementT…

やってみよう

最近プログラミングを趣味として再開してふと特許データベースを自分で作れないかと思いついた。 フルスケールでできるのか、速度はそもそも完成するのかなど?な点は多いがとりあえずここをメモ代わりにしながら進めてみることに。 だれかの参考になればと…