2010年03月25日

Html Agility Packで、エンティティ文字の解決

  
C#で利用できるHtml Agility Pack というオープンソースの HTMLパーサーが、CodePlexがら入手できます。
HTMLをDOMに展開するので、XMLのDOMを扱ったことがあれば、それほど苦労することなく利用できます。

ただ、TextノードのTextプロパティを参照しても、> などのエンティティ文字がそのままなのには 困りました。
HtmlEntity というユーティリティクラスの DeEntitize メソッドを使います。


第1引数は何を入れたらよいのか良くわかりません。nullを入れておけばよさげです。


 

この記事へのトラックバックURL

http://trackback.blogsys.jp/livedoor/gushwell/51974864