googleスプレッドシートでスクレイピングする時用のメモ
普段全く使わないgoogleスプレッドシートでYahoo!Pipesのfetch feed,fetch pageのような機能があるのを知ったのでメモ
関数 : 外部データに対する関数 - Google ドキュメント ヘルプ
この新機能では、xml、html、csv、tsv などのファイル形式の情報や、Google リーダーで購読可能な RSS や Atom フィードの情報を取得することができます。
用意されてる関数
下記4つ。スプレッドシート1つあたり50に制限。
- importXML("URL","query")
- importData("URL")
- ImportHtml(URL, "list" | "table", index)
- ImportFeed(URL, [feedQuery | itemQuery], [headers], [numItems])