2009-11-03から1日間の記事一覧

Windows環境下でlxml+python(lxmlのバイナリは未使用)

はじめに 最近、pythonでHTMLテキストをパースすることが必要になった。当初、HTMLパーサとして、BeautifulSoupを利用していた。しかし、しばしばある特定のWebページのパース時に、HTMLParseErrorという例外が発生した。そのため、他のpython用のHTMLパーサ…