以下斜め読んだ内容

pseudo translation of useful posts, book reviews, remarks,etc. twitter: feeddict

PipesのFetch FeedとFetch Pageでの文字化けの解決

  • Fetch Feedモジュールで取得したフィードが文字化けする
  • Fetch Pageモジュールで取得したページが文字化けする。

上記2点については解決できた気がする。やっとGIGAZINEの全文配信フィードが作れた。
フィードの文字化けについては、Pipes の文字化け回避策3つ - 帝冠ダイアリーで紹介されてるサービスを使って、フィードのURLを作り変えれば解決。


http://www.pheedo.jp/f/gigazine_2/

http://william.cswiz.org/tool/xmliconv/?url=http://www.pheedo.jp/f/gigazine_2/

Fetch Pageしたページの文字化けの方は、上で利用したサービスとString Builderモジュールを組み合わせると解決する。
フィードに載っているエントリの各URLの前後に文字列を追加できるので、URLを作り変えることができる。Loopモジュールの中に、String Builderモジュールを挿入して各URLに「http://william.cswiz.org/tool/xmliconv/?url=」などを追加していく。
String Builderモジュールで作り直したURLなら、Fetch Pageで取得しても文字化けはしなくなる。

追記

帝冠ダイアリーさんでは3つのサービスの中でrsscacheがオススメにしてたけど、自分の場合、キャッシュされてるフィードのデータが古かったでwilliam.cswiz.orgのものを使った。

さらに追記→訂正

livedoorのブログとかは上記サービスを経由しても文字化けする。最初charsetがeuc-jpのせいかと思ったが、はてなはeuc-jpでも文字化けしてない。化ける原因がわからない。Doctypeの有無が原因?
google mashup editorのアカウント来たのでこれから試す。

追記:2008.10.22
  • xmliconv
    • 死亡。
    • というか。xml以外のページを指定するとエラーになるみたい。
  • MyRemix
    • 日本語版のPipesみたいなもの?ドキュメントが乏しいが、こっちのサービスを使って、livedoorのブログでも文字化けしないfeedを作れた。
    • ↓作ったfeed