以下斜め読んだ内容

pseudo translation of useful posts, book reviews, remarks,etc. twitter: feeddict

OUseful.info「Data Scraping Wikipedia with Google Spreadsheets」

Data Scraping Wikipedia with Google Spreadsheets

OUseful.Infoのブログエントリ
GoogleスプレッドシートとPipesのそれぞれ得意とする所を活かしてスクレイピング。サンプルとしてWikipediaのデータ

  • Wikipediaのページのデータ
  • Googleスプレッドシートで読み込んで加工
    • パブリッシュして、URL生成
  • Pipesでパブリッシュしたページ読み込んで加工
    • パブリッシュ
気になるところ斜め読み
  • Googleスプレッドシート+Pipesのあわせ技
    • CSV形式でGoogleスプレッドシートからパブリッシュ
      • パブリッシュするとpermanentなURLができる
    • パブリッシュしたCSVをYahoo!Pipesのfetch CSVモジュールで読み込む
  • パブリッシュしてるCSVファイルを更新すればPipes側で受信するデータも更新される
    • タイムラグがどれくらいかは???