ScrapBook(FireFoxアドオン)

前置き

Webページをローカルディスクに取り込むためのFireFoxアドオンで、東工大の研究室が開発したものです。私にとっての用途を紹介します。改造方法についても、ちょっとだけ。

本文

取り込み方法のカスタマイズや、取り込んだページの管理、加工、検索など、いろんな機能を持っていますが、自分の場合、主な用途は3つ。

  1. 文字通り、Webページをスクラップする
  2. プログラミング言語のリファレンスのような、頻繁に参照するサイトをディスクにキャッシュする
  3. 取り込んだ後、印刷に向いたレイアウトに加工する(メニューや広告などの要素を削除してスリム化できる)

特に2番目の用途に関しては、リンクをたどって複数階層分をまとめてダウンロードできるのが嬉しいですね。ただ私が使用しているバージョン(1.3.3.14)では、サーバ側の負荷を考慮して、1ページごとに3秒待つようになっているのでダルいです。またフィルタ機能(余計なリンクを除外して取り込む機能)が便利なのですが、フィルタ条件を正規表現で指定できないのは残念です。

とは言え、JavaScriptで書かれているので、自分で改造してしまえば問題ありません。Windowsの場合、アドオンの置き場は下記です(USERNAMEとXXXXXは可変)。

 C:\Documents and Settings\USERNAME\Application Data\Mozilla\Firefox\Profiles\XXXXX.default\extensions

ScrapBookの場合、scrapbook.jarというファイルです。ここからcapture.jsを抽出して、改造した後で再度jarに書き戻せばOKです。

 > jar xvf scrapbook.jar content/scrapbook/capture.js
 > capture.jsを編集
 > jar uvf scrapbook.jar content/scrapbook/capture.js

ライセンスで保護されているので、ソースコードは載せません。タイムアウト時間の指定値とフィルタの処理を変えるだけです。

P.S.

その後のバージョンでは仕様変更されて、待機時間が1秒になったようですね。

P.PS.

久々にアドオンを更新したら、アドオン一式をxpiファイルに固めるようになったようです(ver 1.4.3)。xpiファイルはjarファイルとしても使えるようなので、jarコマンドでscrapbook.jarを抽出できます。修正するソースは依然としてcapture.jsです。待ち時間の設定は、最初の待ち時間(5秒)とページ間の待ち時間(1秒)の2種類です。フィルタの方は、"filter"で検索すると見つかるでしょう。フィルタリング用の無名関数を改造して、indexOf()の代わりにmatch()を使うようにします。

P.PPS.

FireFox3.X時代はメニューバーからScrapBookを使っていたので、FireFox4でFireFoxボタンが導入された(メニューバーが非表示になった)ときは一瞬手が止まってしまいました。対策は…。

  • メニューバーを「表示」にする
  • ScrapBookを使いたいときだけ、Altキーでメニューバーを出す
  • コンテキストメニューからScrapBookを使う

といったところでしょうか。あとツールバーに、ScrapBookサイドバーのON/OFFボタンを置いておくと便利でしょう。FireFoxボタンのメニューにScrapBookを入れることもできそうな気がしますが…。

Last modified:2011/05/28 10:51:56
Keyword(s):
References:[便利なツール] [役に立つ記事・書籍など]
This page is frozen.