以下斜め読んだ内容

pseudo translation of useful posts, book reviews, remarks,etc. twitter: feeddict

googleスプレッドシートでスクレイピングする時用のメモ

普段全く使わないgoogleスプレッドシートでYahoo!Pipesのfetch feed,fetch pageのような機能があるのを知ったのでメモ

関数 : 外部データに対する関数 - Google ドキュメント ヘルプ

この新機能では、xml、html、csv、tsv などのファイル形式の情報や、Google リーダーで購読可能な RSSAtom フィードの情報を取得することができます。

用意されてる関数

下記4つ。スプレッドシート1つあたり50に制限。

  • importXML("URL","query")
  • importData("URL")
  • ImportHtml(URL, "list" | "table", index)
  • ImportFeed(URL, [feedQuery | itemQuery], [headers], [numItems])
xpathが使える

全文配信フィードが作れる、かも

  • パブリッシュするフォーマットの中にがHTML、CSVRSSがあるから
参考