<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>読書日記 &#187; ネットワーク</title>
	<atom:link href="http://books.onaneet.org/category/%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf/%e3%83%8d%e3%83%83%e3%83%88%e3%83%af%e3%83%bc%e3%82%af/feed/" rel="self" type="application/rss+xml" />
	<link>http://books.onaneet.org</link>
	<description>今までに読んだ本について色々書きます。</description>
	<lastBuildDate>Mon, 07 Jun 2010 04:15:44 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Javaネットワークプログラミングの真髄</title>
		<link>http://books.onaneet.org/%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf/%e3%83%97%e3%83%ad%e3%82%b0%e3%83%a9%e3%83%9f%e3%83%b3%e3%82%b0/java%e3%83%8d%e3%83%83%e3%83%88%e3%83%af%e3%83%bc%e3%82%af%e3%83%97%e3%83%ad%e3%82%b0%e3%83%a9%e3%83%9f%e3%83%b3%e3%82%b0%e3%81%ae%e7%9c%9f%e9%ab%84/</link>
		<comments>http://books.onaneet.org/%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf/%e3%83%97%e3%83%ad%e3%82%b0%e3%83%a9%e3%83%9f%e3%83%b3%e3%82%b0/java%e3%83%8d%e3%83%83%e3%83%88%e3%83%af%e3%83%bc%e3%82%af%e3%83%97%e3%83%ad%e3%82%b0%e3%83%a9%e3%83%9f%e3%83%b3%e3%82%b0%e3%81%ae%e7%9c%9f%e9%ab%84/#comments</comments>
		<pubDate>Fri, 10 Jul 2009 08:07:05 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Java]]></category>
		<category><![CDATA[ネットワーク]]></category>
		<category><![CDATA[プログラミング]]></category>

		<guid isPermaLink="false">http://books.onaneet.org/?p=29</guid>
		<description><![CDATA[ネットワークプログラミングの本の決定版。
Javaのネットワークプログラミングの本であるが、Java以外の言語でプログラミングをしている人にも向いていると思う。言語に特化した記述以外にも、プログラムの設計の指針になる記述もふんだんにあるからである。Socketプログラミングの本は数多くあり、Webでも入門記事は多く見かける。したがって、単純なサーバ・クライアントを作成するだけならお金をかけて本を買う必要はない。本書はそうしたありふれた入門書とは一線を画する記述がある。
中級者以上でも面白い記述がある
TCP/IPは古い設計であるため、色々と問題が指摘されている。TCPは信頼性のある通信を手軽に実現してくれて便利なのだが、TCPのフロー制御や輻輳制御、あるいは公平性についての取り決めは現代の高速ネットワークにはそぐわない点がいくつかある。ほとんどの場合は気にしなくてよいのだけど、必要な場合にはシンプルなUDPを使うこともある。UDPはほとんど何もしないプロトコルなので、TCPがやっている信頼性確保のための色々な工夫を自分で実装しないといけない。こうしたトピックについて気軽に読める本はあまり多くないと思う（大学のネットワークの教科書には書いてある）。
他にもサーバの負荷を考慮して、スレッドで捌くのか、SocketChannelを使って捌くのかなどの詳細な分析などは中級者にとっては面白い読み物となるだろう。
新しい世代の入門書
Javaは古くからSocketによるネットワークがサポートされていたが、最近（と言ってもずいぶん経つが）NIO(New IO)という新しいインターフェースがサポートされた。典型的にはブロッキングを回避するためにコネクションをスレッドに割り当てていたのだが、多くのコネクションをその数だけスレッドを作ってさばいているとパフォーマンスに問題がある。そうした要求に応える新しいインターフェースだが、あまり本は多くないと思う。WebにもNIOの解説はあるのだけど、数は多くない。数が少ないと親切な解説に当たることも少ないので少し困る。
本書は昔ながらのSocket通信はもちろん、NIOにも対応しているので、初心者が最初に手に取る本としても十分に役に立つ。
]]></description>
			<content:encoded><![CDATA[<div class="tmkm-amazon-view">
	<p><a href="http://www.amazon.co.jp/Java%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0%E3%81%AE%E7%9C%9F%E9%AB%84-%E3%82%A8%E3%82%BA%E3%83%A2%E3%83%B3%E3%83%89%E3%83%BB%E3%83%94%E3%83%83%E3%83%88/dp/4797341866%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4797341866"><img src="http://ecx.images-amazon.com/images/I/51cjfMLeb1L._SL160_.jpg" border="0" alt="" /></a></p>
	<p><a href="http://www.amazon.co.jp/Java%E3%83%8D%E3%83%83%E3%83%88%E3%83%AF%E3%83%BC%E3%82%AF%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0%E3%81%AE%E7%9C%9F%E9%AB%84-%E3%82%A8%E3%82%BA%E3%83%A2%E3%83%B3%E3%83%89%E3%83%BB%E3%83%94%E3%83%83%E3%83%88/dp/4797341866%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4797341866">Javaネットワークプログラミングの真髄</a></p>
	<p><em>著者／訳者：</em>Array</p>
	<p><em>出版社：</em>ソフトバンク クリエイティブ( 2007-04-28 )</p>
	<p><em>定価：</em>￥ 3,885</p>
	<p>大型本 ( 408 ページ )</p>
	<p>ISBN-10 : 4797341866</p>
	<p>ISBN-13 : 9784797341867</p>
<hr class="tmkm-amazon-clear" /></div>
<p>ネットワークプログラミングの本の決定版。</p>
<p>Javaのネットワークプログラミングの本であるが、Java以外の言語でプログラミングをしている人にも向いていると思う。言語に特化した記述以外にも、プログラムの設計の指針になる記述もふんだんにあるからである。Socketプログラミングの本は数多くあり、Webでも入門記事は多く見かける。したがって、単純なサーバ・クライアントを作成するだけならお金をかけて本を買う必要はない。本書はそうしたありふれた入門書とは一線を画する記述がある。</p>
<h2>中級者以上でも面白い記述がある</h2>
<p>TCP/IPは古い設計であるため、色々と問題が指摘されている。TCPは信頼性のある通信を手軽に実現してくれて便利なのだが、TCPのフロー制御や輻輳制御、あるいは公平性についての取り決めは現代の高速ネットワークにはそぐわない点がいくつかある。ほとんどの場合は気にしなくてよいのだけど、必要な場合にはシンプルなUDPを使うこともある。UDPはほとんど何もしないプロトコルなので、TCPがやっている信頼性確保のための色々な工夫を自分で実装しないといけない。こうしたトピックについて気軽に読める本はあまり多くないと思う（大学のネットワークの教科書には書いてある）。</p>
<p>他にもサーバの負荷を考慮して、スレッドで捌くのか、SocketChannelを使って捌くのかなどの詳細な分析などは中級者にとっては面白い読み物となるだろう。</p>
<h2>新しい世代の入門書</h2>
<p>Javaは古くからSocketによるネットワークがサポートされていたが、最近（と言ってもずいぶん経つが）NIO(New IO)という新しいインターフェースがサポートされた。典型的にはブロッキングを回避するためにコネクションをスレッドに割り当てていたのだが、多くのコネクションをその数だけスレッドを作ってさばいているとパフォーマンスに問題がある。そうした要求に応える新しいインターフェースだが、あまり本は多くないと思う。WebにもNIOの解説はあるのだけど、数は多くない。数が少ないと親切な解説に当たることも少ないので少し困る。</p>
<p>本書は昔ながらのSocket通信はもちろん、NIOにも対応しているので、初心者が最初に手に取る本としても十分に役に立つ。</p>
]]></content:encoded>
			<wfw:commentRss>http://books.onaneet.org/%e3%82%b3%e3%83%b3%e3%83%94%e3%83%a5%e3%83%bc%e3%82%bf/%e3%83%97%e3%83%ad%e3%82%b0%e3%83%a9%e3%83%9f%e3%83%b3%e3%82%b0/java%e3%83%8d%e3%83%83%e3%83%88%e3%83%af%e3%83%bc%e3%82%af%e3%83%97%e3%83%ad%e3%82%b0%e3%83%a9%e3%83%9f%e3%83%b3%e3%82%b0%e3%81%ae%e7%9c%9f%e9%ab%84/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ウェブアプリケーションセキュリティ</title>
		<link>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/%e3%82%a6%e3%82%a7%e3%83%96%e3%82%a2%e3%83%97%e3%83%aa%e3%82%b1%e3%83%bc%e3%82%b7%e3%83%a7%e3%83%b3%e3%82%bb%e3%82%ad%e3%83%a5%e3%83%aa%e3%83%86%e3%82%a3/</link>
		<comments>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/%e3%82%a6%e3%82%a7%e3%83%96%e3%82%a2%e3%83%97%e3%83%aa%e3%82%b1%e3%83%bc%e3%82%b7%e3%83%a7%e3%83%b3%e3%82%bb%e3%82%ad%e3%83%a5%e3%83%aa%e3%83%86%e3%82%a3/#comments</comments>
		<pubDate>Wed, 05 Mar 2008 14:50:33 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[コンピュータ]]></category>
		<category><![CDATA[セキュリティ]]></category>
		<category><![CDATA[ネットワーク]]></category>
		<category><![CDATA[書評]]></category>
		<category><![CDATA[Network]]></category>
		<category><![CDATA[Security]]></category>

		<guid isPermaLink="false">http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/%e3%82%a6%e3%82%a7%e3%83%96%e3%82%a2%e3%83%97%e3%83%aa%e3%82%b1%e3%83%bc%e3%82%b7%e3%83%a7%e3%83%b3%e3%82%bb%e3%82%ad%e3%83%a5%e3%83%aa%e3%83%86%e3%82%a3/</guid>
		<description><![CDATA[実践的でとても興味深いセキュリティの本。
クラッカーの攻撃方法は非常に多彩で、よくこんなことを思いつくなというものがたくさんある。しかし、普通にネットを使っているとそうした想像すらしないような手口は知らないけれど、掲示板などに「IP抜いた」とか書かれるとびっくりしないだろうか。だからこそ、具体的なクラックの方法について知っておくことで、だいたいこんな感じのことができると理解できる。もちろん、さらに奇抜な攻撃方法は次々開発されていくのだが、それでもハッタリくらいにはびっくりしなくなる知識は得られると思う。
掲載されている分野は多岐にわたっていて、かつそう難しくない。トピックによっては「なあんだ、知ってるよ」というものもたくさんあるのではないかと思う。それゆえ読みやすさと、新しい発見のバランスがちょうどいいのだと思う。クラック手法の中には「こんなの自分には絶対にできない」というものを披露するようなものもあるけれど、本書は手法を明らかにするとともに、クラッカーの視点を紹介して防衛する、つまり理解しやすいように配慮されているように思う。
ところで、何でハードカバーで箱入りなのだろう？本の大きさに比して文字もちょっと大きい感じがするし、無駄に価格を上げようとしているのかと勘ぐってしまう。
目次

1章 ウェブアプリケーションセキュリティの基礎
2章 データ処理の原則と指針
3章 XSS
4章 CSRF
5章 セッション管理
6章 SQLインジェクション
7章 Doorman@JUMPERZ.NET
8章 Guardian@JUMPERZ.NET
9章 ディレクトリトラバーサル
10章 コマンドインジェクション
11章 ヘッダインジェクション
12章 HRS
13章 XST
14章 Connection Flooding
15章 SSL MITM攻撃
16章 DNSを使った攻撃
17章 クロスドメイン通信
18章 AJAX

]]></description>
			<content:encoded><![CDATA[<div class="tmkm-amazon-view">
	<p><a href="http://www.amazon.co.jp/%E3%82%A6%E3%82%A7%E3%83%96%E3%82%A2%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3-%E9%87%91%E5%BA%8A/dp/4887189400%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4887189400"><img src="http://ecx.images-amazon.com/images/I/31kq-lDFQ-L._SL160_.jpg" border="0" alt="" /></a></p>
	<p><a href="http://www.amazon.co.jp/%E3%82%A6%E3%82%A7%E3%83%96%E3%82%A2%E3%83%97%E3%83%AA%E3%82%B1%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%82%BB%E3%82%AD%E3%83%A5%E3%83%AA%E3%83%86%E3%82%A3-%E9%87%91%E5%BA%8A/dp/4887189400%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4887189400">ウェブアプリケーションセキュリティ</a></p>
	<p><em>著者／訳者：</em>Array</p>
	<p><em>出版社：</em>データ・ハウス( 2007-07-21 )</p>
	<p><em>定価：</em>￥ 4,830</p>
	<p>ハードカバー ( 495 ページ )</p>
	<p>ISBN-10 : 4887189400</p>
	<p>ISBN-13 : 9784887189409</p>
<hr class="tmkm-amazon-clear" /></div>
<p>実践的でとても興味深いセキュリティの本。</p>
<p>クラッカーの攻撃方法は非常に多彩で、よくこんなことを思いつくなというものがたくさんある。しかし、普通にネットを使っているとそうした想像すらしないような手口は知らないけれど、掲示板などに「IP抜いた」とか書かれるとびっくりしないだろうか。だからこそ、具体的なクラックの方法について知っておくことで、だいたいこんな感じのことができると理解できる。もちろん、さらに奇抜な攻撃方法は次々開発されていくのだが、それでもハッタリくらいにはびっくりしなくなる知識は得られると思う。</p>
<p>掲載されている分野は多岐にわたっていて、かつそう難しくない。トピックによっては「なあんだ、知ってるよ」というものもたくさんあるのではないかと思う。それゆえ読みやすさと、新しい発見のバランスがちょうどいいのだと思う。クラック手法の中には「こんなの自分には絶対にできない」というものを披露するようなものもあるけれど、本書は手法を明らかにするとともに、クラッカーの視点を紹介して防衛する、つまり理解しやすいように配慮されているように思う。</p>
<p>ところで、何でハードカバーで箱入りなのだろう？本の大きさに比して文字もちょっと大きい感じがするし、無駄に価格を上げようとしているのかと勘ぐってしまう。</p>
<h4>目次</h4>
<ul>
<li>1章 ウェブアプリケーションセキュリティの基礎</li>
<li>2章 データ処理の原則と指針</li>
<li>3章 XSS</li>
<li>4章 CSRF</li>
<li>5章 セッション管理</li>
<li>6章 SQLインジェクション</li>
<li>7章 Doorman@JUMPERZ.NET</li>
<li>8章 Guardian@JUMPERZ.NET</li>
<li>9章 ディレクトリトラバーサル</li>
<li>10章 コマンドインジェクション</li>
<li>11章 ヘッダインジェクション</li>
<li>12章 HRS</li>
<li>13章 XST</li>
<li>14章 Connection Flooding</li>
<li>15章 SSL MITM攻撃</li>
<li>16章 DNSを使った攻撃</li>
<li>17章 クロスドメイン通信</li>
<li>18章 AJAX</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/%e3%82%a6%e3%82%a7%e3%83%96%e3%82%a2%e3%83%97%e3%83%aa%e3%82%b1%e3%83%bc%e3%82%b7%e3%83%a7%e3%83%b3%e3%82%bb%e3%82%ad%e3%83%a5%e3%83%aa%e3%83%86%e3%82%a3/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Spidering hacks—ウェブ情報ラクラク取得テクニック101選</title>
		<link>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/spidering-hacks%e2%80%94%e3%82%a6%e3%82%a7%e3%83%96%e6%83%85%e5%a0%b1%e3%83%a9%e3%82%af%e3%83%a9%e3%82%af%e5%8f%96%e5%be%97%e3%83%86%e3%82%af%e3%83%8b%e3%83%83%e3%82%af101%e9%81%b8/</link>
		<comments>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/spidering-hacks%e2%80%94%e3%82%a6%e3%82%a7%e3%83%96%e6%83%85%e5%a0%b1%e3%83%a9%e3%82%af%e3%83%a9%e3%82%af%e5%8f%96%e5%be%97%e3%83%86%e3%82%af%e3%83%8b%e3%83%83%e3%82%af101%e9%81%b8/#comments</comments>
		<pubDate>Mon, 04 Feb 2008 19:04:02 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[コンピュータ]]></category>
		<category><![CDATA[ネットワーク]]></category>
		<category><![CDATA[プログラミング]]></category>
		<category><![CDATA[書評]]></category>
		<category><![CDATA[Network]]></category>
		<category><![CDATA[Programming]]></category>
		<category><![CDATA[Spidering]]></category>

		<guid isPermaLink="false">http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/spidering-hacks%e2%80%94%e3%82%a6%e3%82%a7%e3%83%96%e6%83%85%e5%a0%b1%e3%83%a9%e3%82%af%e3%83%a9%e3%82%af%e5%8f%96%e5%be%97%e3%83%86%e3%82%af%e3%83%8b%e3%83%83%e3%82%af101%e9%81%b8/</guid>
		<description><![CDATA[Javaスパイダーツールサンプルが面白かったので購入した本。Javaスパイダーツールサンプルの方が自分にとっては良書であった。
まず、ツールの中心がPerlになる。Java本は正規表現を中心にゴリゴリやっていたのに対して、こちらはHTML::TokeParserなどのツールも積極的に使う。しかし、私はスクリプト言語ではRubyやPythonのほうに関心があるので同等の同じものを探すことになった。RubyではHpricotというHTMLパーサが評判がいいなどを調べてレンタルサーバにインストールなど、私にとっては本を読んですぐに実践に移れるわけではなかった。
また、もともとアメリカの本であるためかサンプルがアメリカのものが多い。それでも日本の気象庁などからデータを引っ張ってくるサンプルなども充実しており、単にやり方を学ぶだけではなく、人によってはそのまま使えるようなサンプルも入っている。最後に付録として「日本語処理（訳者補）」がついており、この辺のサービスもよい。
本書の一番自分にとってよかったのはXML-RPCなどの技術について多く触れていたことである。別件でWordPressにプログラムから投稿を行うためにXML-RPCの資料を探していたが、こんなところにもあったのかという感じである。このように、スパイダリングのみならず、色々な技術やツールについても理解が深まる点で勉強になった。
目次：
訳者まえがき
クレジット
まえがき
1章　ウォーミングアップ
2章　道具を揃える
3章　メディアファイルの収集
4章　データベースからのデータ収集
5章　コレクションを維持管理する
6章　世の中に還元する
付録　日本語処理［訳者補］
索引
]]></description>
			<content:encoded><![CDATA[<div class="tmkm-amazon-view">
	<p><a href="http://www.amazon.co.jp/Spidering-hacks%E2%80%95%E3%82%A6%E3%82%A7%E3%83%96%E6%83%85%E5%A0%B1%E3%83%A9%E3%82%AF%E3%83%A9%E3%82%AF%E5%8F%96%E5%BE%97%E3%83%86%E3%82%AF%E3%83%8B%E3%83%83%E3%82%AF101%E9%81%B8-Kevin-Hemenway/dp/4873111870%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4873111870"><img src="http://ecx.images-amazon.com/images/I/41AT4JG2KQL._SL160_.jpg" border="0" alt="" /></a></p>
	<p><a href="http://www.amazon.co.jp/Spidering-hacks%E2%80%95%E3%82%A6%E3%82%A7%E3%83%96%E6%83%85%E5%A0%B1%E3%83%A9%E3%82%AF%E3%83%A9%E3%82%AF%E5%8F%96%E5%BE%97%E3%83%86%E3%82%AF%E3%83%8B%E3%83%83%E3%82%AF101%E9%81%B8-Kevin-Hemenway/dp/4873111870%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4873111870">Spidering hacks―ウェブ情報ラクラク取得テクニック101選</a></p>
	<p><em>著者／訳者：</em>Kevin Hemenway Tara Calishain </p>
	<p><em>出版社：</em>オライリー・ジャパン( 2004-05 )</p>
	<p><em>定価：</em>￥ 3,675</p>
	<p>単行本 ( 516 ページ )</p>
	<p>ISBN-10 : 4873111870</p>
	<p>ISBN-13 : 9784873111872</p>
<hr class="tmkm-amazon-clear" /></div>
<p><a href="http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/java%e3%82%b9%e3%83%91%e3%82%a4%e3%83%80%e3%83%bc%e3%83%84%e3%83%bc%e3%83%ab%e3%82%b5%e3%83%b3%e3%83%97%e3%83%ab%e3%82%af%e3%83%83%e3%82%af%e3%83%96%e3%83%83%e3%82%af%e2%80%94%e8%87%aa%e5%8b%95/">Javaスパイダーツールサンプル</a>が面白かったので購入した本。Javaスパイダーツールサンプルの方が自分にとっては良書であった。</p>
<p>まず、ツールの中心がPerlになる。Java本は正規表現を中心にゴリゴリやっていたのに対して、こちらはHTML::TokeParserなどのツールも積極的に使う。しかし、私はスクリプト言語ではRubyやPythonのほうに関心があるので同等の同じものを探すことになった。RubyではHpricotというHTMLパーサが評判がいいなどを調べてレンタルサーバにインストールなど、私にとっては本を読んですぐに実践に移れるわけではなかった。</p>
<p>また、もともとアメリカの本であるためかサンプルがアメリカのものが多い。それでも日本の気象庁などからデータを引っ張ってくるサンプルなども充実しており、単にやり方を学ぶだけではなく、人によってはそのまま使えるようなサンプルも入っている。最後に付録として「日本語処理（訳者補）」がついており、この辺のサービスもよい。</p>
<p>本書の一番自分にとってよかったのはXML-RPCなどの技術について多く触れていたことである。別件でWordPressにプログラムから投稿を行うためにXML-RPCの資料を探していたが、こんなところにもあったのかという感じである。このように、スパイダリングのみならず、色々な技術やツールについても理解が深まる点で勉強になった。</p>
<p>目次：</p>
<p>訳者まえがき<br />
クレジット<br />
まえがき<br />
1章　ウォーミングアップ<br />
2章　道具を揃える<br />
3章　メディアファイルの収集<br />
4章　データベースからのデータ収集<br />
5章　コレクションを維持管理する<br />
6章　世の中に還元する<br />
付録　日本語処理［訳者補］<br />
索引</p>
]]></content:encoded>
			<wfw:commentRss>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/spidering-hacks%e2%80%94%e3%82%a6%e3%82%a7%e3%83%96%e6%83%85%e5%a0%b1%e3%83%a9%e3%82%af%e3%83%a9%e3%82%af%e5%8f%96%e5%be%97%e3%83%86%e3%82%af%e3%83%8b%e3%83%83%e3%82%af101%e9%81%b8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Javaスパイダーツールサンプル&amp;クックブック—自動アクセス&amp;収集・加工プログラム</title>
		<link>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/java%e3%82%b9%e3%83%91%e3%82%a4%e3%83%80%e3%83%bc%e3%83%84%e3%83%bc%e3%83%ab%e3%82%b5%e3%83%b3%e3%83%97%e3%83%ab%e3%82%af%e3%83%83%e3%82%af%e3%83%96%e3%83%83%e3%82%af%e2%80%94%e8%87%aa%e5%8b%95/</link>
		<comments>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/java%e3%82%b9%e3%83%91%e3%82%a4%e3%83%80%e3%83%bc%e3%83%84%e3%83%bc%e3%83%ab%e3%82%b5%e3%83%b3%e3%83%97%e3%83%ab%e3%82%af%e3%83%83%e3%82%af%e3%83%96%e3%83%83%e3%82%af%e2%80%94%e8%87%aa%e5%8b%95/#comments</comments>
		<pubDate>Mon, 04 Feb 2008 17:56:21 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[Java]]></category>
		<category><![CDATA[コンピュータ]]></category>
		<category><![CDATA[ネットワーク]]></category>
		<category><![CDATA[プログラミング]]></category>
		<category><![CDATA[書評]]></category>
		<category><![CDATA[Network]]></category>
		<category><![CDATA[Programming]]></category>
		<category><![CDATA[Spidering]]></category>

		<guid isPermaLink="false">http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/java%e3%82%b9%e3%83%91%e3%82%a4%e3%83%80%e3%83%bc%e3%83%84%e3%83%bc%e3%83%ab%e3%82%b5%e3%83%b3%e3%83%97%e3%83%ab%e3%82%af%e3%83%83%e3%82%af%e3%83%96%e3%83%83%e3%82%af%e2%80%94%e8%87%aa%e5%8b%95/</guid>
		<description><![CDATA[スパイダリングのみならず、正規表現（Jakarta ORO）やJakarta HttpClient、Javaプログラミングのよい手本となった。
この本は自分にとってはとても当たりで、普通はPerlやRubyなどのスクリプト言語で正規表現の魅力にハマるようだが、私は本書とJakarta OROで学んだ。クックブックというだけあって、実際のサンプルが多く、スパイダリングを行うメリットがあることをハッキリ分かりやすく伝えてくれる。後半にかけてのサンプルはHTMLからどのように正規表現で欲しい部分だけ抽出するかというステップを丁寧に書いてあるため、初めて正規表現を使う者にとっても非常に理解がしやすかった。本書を片手に正規表現対応のエディタで試行錯誤してソースコードを書くだけで、今までとはまったく違う世界が開けたのを覚えている。
また、JakartaやTomcatなどのツールのインストールやチュートリアルとしても優秀で、HttpClientの情報はインターネットを検索しても見つかるが、本書のサンプルが一番分かりやすかったと思う。
このように本書は単にスパイダリングの入門書以上に、プログラミング全般のよい入門書となるだろう。プログラミングを始めたばかりのものにとって&#8221;Hello World!&#8221;のような無味乾燥なプログラムを書かせるより、こうしたすぐにできて、しかも実用になるプログラムはよいと思うし、これだけ丁寧に書いてあれば落伍者もあまり出ないと思う。目次を見るとさまざまなツールの使い方から面白そうなサンプルまでたくさん収録されているのが分かる。とても大盤振る舞いなサービスのよい本であった。
目次：
Part1　スパイダーとスクレーパーの基礎知識

「スパイダー」と「スクレーパー」とは

定義とメリット


スパイダープログラミングの流れ

プログラミングの流れ


問題を起こさないために

知的所有権
使用上の注意をよくお読みください



Part2　環境を用意しよう

J2SE

・インストールと設定


TOMCAT

インストールと設定
web.xmlに関する注意点
TOMCATの起動


Jakarta COMMONSライブラリ

HttpClientの入手とインストール
Loggingの入手とインストール


Codecの入手とインストール

Jakarta OROライブラリ
入手とインストール


MySQL

入手とインストール
サンプルデータベースの作成
MySQLの自動起動


JDBC



Part3　スパイダーの基礎

URLConnectionクラスを使う場合

URLConnectionを使ったスパイダー
文字コード指定のURLConnectionを使ったスパイダー
MIMEヘッダーを読む
文字コードを自動判定してHTMLソースを取得


HttpURLConnectionクラスを使う場合

HttpURLConnectionを使ったスパイダー


HttpClientクラスを使う場合

HttpClientを使ったスパイダー（byte[]で読む）
HttpClientを使ったスパイダー（Stringで読む）
HttpClientを使ったスパイダー（InputStreamで読む）
robots.txtの取得方法



Part4　クッキングレシピ集 Vol.1

「ファイルの収集」

写真のダウンロード
音楽のダウンロード
音楽をまとめて自動ダウンロード
ウェブカメラの映像をダウンロード
ウェブカメラの映像1週間分を1ページにまとめる


「検索」といろいろな日本語コード

スパイダーでNIKKEI検索（Shift_JIS）
スパイダーでYahoo!検索（EUC-JP）
スパイダーでGoogle検索（UTF8）
日本語文字化け対策のまとめ


OROによる検索とスクレーピングテクニック

Yahoo!から東京の週間天気予報だけスクレーピング



Part5　クッキングレシピ集 Vol.2

「欲しい情報」だけを集める

ベストセラーCD一覧表示
JavaBeansを使ったベストセラー本のスパイダリング
マルチスレッドを使ったベストセラー本のスパイダリング
高く売れる古本だけを見つける


「お得な情報」を集める

ぐるなびからクーポン券だけゲット！


「最新情報」を集める

新聞社をスパイダリングしてトップニュースをいただく
複数ポータルサイトの検索語ランキングを一覧にする
売れ筋ワイン
人気化粧品ランキングに価格.comで値段を調べるリンクをつける
複数のJava雑誌の最新目次をまとめて見る



Part6　クッキングレシピ集 Vol.3

「楽しい情報」を集める

話題の人気映画情報をまとめて見る


「ビジネス情報」を集める

いろいろな企業情報をまとめて表示


情報をまとめて見る

面倒だから掲示板のタイトルと本文を同時に表示


「情報を関連させて見る」Webサイト×別のWebサイト＝お得情報

最近の話題を仕入れる
スーパーの特売品をスパイダリングしてそれでできる料理を検索
人気の本をタダで読む！人気の新刊を借りられる図書館の検索



Part7　ひと味違うスパイステクニック

ファイルに書き出す

ホームページをZIP圧縮してディスクに保存
Excelファイル書き出し入門
Webサイトのデータを自動的にExcelファイルに書き出す
Webページのデータを自動的にデータベースに取り込む
データベースにAccessを使う方法


RSSフィールドを読む

RSSとは
環境の準備
JavaでRSSを読む
サーブレット版RSSリーダー


Webコンテンツのグラフ化

ヤマダ電機から液晶テレビの価格をスパイダリング
Javaによるグラフ出力入門
Webページの液晶テレビ価格を自動的にグラフ化する



]]></description>
			<content:encoded><![CDATA[<div class="tmkm-amazon-view">
	<p><a href="http://www.amazon.co.jp/Java%E3%82%B9%E3%83%91%E3%82%A4%E3%83%80%E3%83%BC%E3%83%84%E3%83%BC%E3%83%AB%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB-%E3%82%AF%E3%83%83%E3%82%AF%E3%83%96%E3%83%83%E3%82%AF%E2%80%95%E8%87%AA%E5%8B%95%E3%82%A2%E3%82%AF%E3%82%BB%E3%82%B9-%E5%8F%8E%E9%9B%86%E3%83%BB%E5%8A%A0%E5%B7%A5%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0-%E5%B7%9D%E5%B4%8E-%E5%85%8B%E5%B7%B3/dp/4798010618%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4798010618"><img src="http://ecx.images-amazon.com/images/I/51BBV7Q87RL._SL160_.jpg" border="0" alt="" /></a></p>
	<p><a href="http://www.amazon.co.jp/Java%E3%82%B9%E3%83%91%E3%82%A4%E3%83%80%E3%83%BC%E3%83%84%E3%83%BC%E3%83%AB%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB-%E3%82%AF%E3%83%83%E3%82%AF%E3%83%96%E3%83%83%E3%82%AF%E2%80%95%E8%87%AA%E5%8B%95%E3%82%A2%E3%82%AF%E3%82%BB%E3%82%B9-%E5%8F%8E%E9%9B%86%E3%83%BB%E5%8A%A0%E5%B7%A5%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0-%E5%B7%9D%E5%B4%8E-%E5%85%8B%E5%B7%B3/dp/4798010618%3FSubscriptionId%3DAKIAJUJFHUMWVQBGDBFQ%26tag%3Donaneet-22%26linkCode%3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D4798010618">Javaスパイダーツールサンプル&クックブック―自動アクセス&収集・加工プログラム</a></p>
	<p><em>著者／訳者：</em>Array</p>
	<p><em>出版社：</em>秀和システム( 2005-05 )</p>
	<p><em>定価：</em>￥ 2,730</p>
	<p>単行本 ( 377 ページ )</p>
	<p>ISBN-10 : 4798010618</p>
	<p>ISBN-13 : 9784798010618</p>
<hr class="tmkm-amazon-clear" /></div>
<p>スパイダリングのみならず、正規表現（Jakarta ORO）やJakarta HttpClient、Javaプログラミングのよい手本となった。</p>
<p>この本は自分にとってはとても当たりで、普通はPerlやRubyなどのスクリプト言語で正規表現の魅力にハマるようだが、私は本書とJakarta OROで学んだ。クックブックというだけあって、実際のサンプルが多く、スパイダリングを行うメリットがあることをハッキリ分かりやすく伝えてくれる。後半にかけてのサンプルはHTMLからどのように正規表現で欲しい部分だけ抽出するかというステップを丁寧に書いてあるため、初めて正規表現を使う者にとっても非常に理解がしやすかった。本書を片手に正規表現対応のエディタで試行錯誤してソースコードを書くだけで、今までとはまったく違う世界が開けたのを覚えている。</p>
<p>また、JakartaやTomcatなどのツールのインストールやチュートリアルとしても優秀で、HttpClientの情報はインターネットを検索しても見つかるが、本書のサンプルが一番分かりやすかったと思う。</p>
<p>このように本書は単にスパイダリングの入門書以上に、プログラミング全般のよい入門書となるだろう。プログラミングを始めたばかりのものにとって&#8221;Hello World!&#8221;のような無味乾燥なプログラムを書かせるより、こうしたすぐにできて、しかも実用になるプログラムはよいと思うし、これだけ丁寧に書いてあれば落伍者もあまり出ないと思う。目次を見るとさまざまなツールの使い方から面白そうなサンプルまでたくさん収録されているのが分かる。とても大盤振る舞いなサービスのよい本であった。</p>
<p>目次：</p>
<p>Part1　スパイダーとスクレーパーの基礎知識</p>
<ul>
<li>「スパイダー」と「スクレーパー」とは
<ul>
<li>定義とメリット</li>
</ul>
</li>
<li>スパイダープログラミングの流れ
<ul>
<li>プログラミングの流れ</li>
</ul>
</li>
<li>問題を起こさないために
<ul>
<li>知的所有権</li>
<li>使用上の注意をよくお読みください</li>
</ul>
</li>
</ul>
<p>Part2　環境を用意しよう</p>
<ul>
<li>J2SE
<ul>
<li>・インストールと設定</li>
</ul>
</li>
<li>TOMCAT
<ul>
<li>インストールと設定</li>
<li>web.xmlに関する注意点</li>
<li>TOMCATの起動</li>
</ul>
</li>
<li>Jakarta COMMONSライブラリ
<ul>
<li>HttpClientの入手とインストール</li>
<li>Loggingの入手とインストール</li>
</ul>
</li>
<li>Codecの入手とインストール
<ul>
<li>Jakarta OROライブラリ</li>
<li>入手とインストール</li>
</ul>
</li>
<li>MySQL
<ul>
<li>入手とインストール</li>
<li>サンプルデータベースの作成</li>
<li>MySQLの自動起動</li>
</ul>
<ul>
<li>JDBC</li>
</ul>
</li>
</ul>
<p>Part3　スパイダーの基礎</p>
<ul>
<li>URLConnectionクラスを使う場合
<ul>
<li>URLConnectionを使ったスパイダー</li>
<li>文字コード指定のURLConnectionを使ったスパイダー</li>
<li>MIMEヘッダーを読む</li>
<li>文字コードを自動判定してHTMLソースを取得</li>
</ul>
</li>
<li>HttpURLConnectionクラスを使う場合
<ul>
<li>HttpURLConnectionを使ったスパイダー</li>
</ul>
</li>
<li>HttpClientクラスを使う場合
<ul>
<li>HttpClientを使ったスパイダー（byte[]で読む）</li>
<li>HttpClientを使ったスパイダー（Stringで読む）</li>
<li>HttpClientを使ったスパイダー（InputStreamで読む）</li>
<li>robots.txtの取得方法</li>
</ul>
</li>
</ul>
<p>Part4　クッキングレシピ集 Vol.1</p>
<ul>
<li>「ファイルの収集」
<ul>
<li>写真のダウンロード</li>
<li>音楽のダウンロード</li>
<li>音楽をまとめて自動ダウンロード</li>
<li>ウェブカメラの映像をダウンロード</li>
<li>ウェブカメラの映像1週間分を1ページにまとめる</li>
</ul>
</li>
<li>「検索」といろいろな日本語コード
<ul>
<li>スパイダーでNIKKEI検索（Shift_JIS）</li>
<li>スパイダーでYahoo!検索（EUC-JP）</li>
<li>スパイダーでGoogle検索（UTF8）</li>
<li>日本語文字化け対策のまとめ</li>
</ul>
</li>
<li>OROによる検索とスクレーピングテクニック
<ul>
<li>Yahoo!から東京の週間天気予報だけスクレーピング</li>
</ul>
</li>
</ul>
<p>Part5　クッキングレシピ集 Vol.2</p>
<ul>
<li>「欲しい情報」だけを集める
<ul>
<li>ベストセラーCD一覧表示</li>
<li>JavaBeansを使ったベストセラー本のスパイダリング</li>
<li>マルチスレッドを使ったベストセラー本のスパイダリング</li>
<li>高く売れる古本だけを見つける</li>
</ul>
</li>
<li>「お得な情報」を集める
<ul>
<li>ぐるなびからクーポン券だけゲット！</li>
</ul>
</li>
<li>「最新情報」を集める
<ul>
<li>新聞社をスパイダリングしてトップニュースをいただく</li>
<li>複数ポータルサイトの検索語ランキングを一覧にする</li>
<li>売れ筋ワイン</li>
<li>人気化粧品ランキングに価格.comで値段を調べるリンクをつける</li>
<li>複数のJava雑誌の最新目次をまとめて見る</li>
</ul>
</li>
</ul>
<p>Part6　クッキングレシピ集 Vol.3</p>
<ul>
<li>「楽しい情報」を集める
<ul>
<li>話題の人気映画情報をまとめて見る</li>
</ul>
</li>
<li>「ビジネス情報」を集める
<ul>
<li>いろいろな企業情報をまとめて表示</li>
</ul>
</li>
<li>情報をまとめて見る
<ul>
<li>面倒だから掲示板のタイトルと本文を同時に表示</li>
</ul>
</li>
<li>「情報を関連させて見る」Webサイト×別のWebサイト＝お得情報
<ul>
<li>最近の話題を仕入れる</li>
<li>スーパーの特売品をスパイダリングしてそれでできる料理を検索</li>
<li>人気の本をタダで読む！人気の新刊を借りられる図書館の検索</li>
</ul>
</li>
</ul>
<p>Part7　ひと味違うスパイステクニック</p>
<ul>
<li>ファイルに書き出す
<ul>
<li>ホームページをZIP圧縮してディスクに保存</li>
<li>Excelファイル書き出し入門</li>
<li>Webサイトのデータを自動的にExcelファイルに書き出す</li>
<li>Webページのデータを自動的にデータベースに取り込む</li>
<li>データベースにAccessを使う方法</li>
</ul>
</li>
<li>RSSフィールドを読む
<ul>
<li>RSSとは</li>
<li>環境の準備</li>
<li>JavaでRSSを読む</li>
<li>サーブレット版RSSリーダー</li>
</ul>
</li>
<li>Webコンテンツのグラフ化
<ul>
<li>ヤマダ電機から液晶テレビの価格をスパイダリング</li>
<li>Javaによるグラフ出力入門</li>
<li>Webページの液晶テレビ価格を自動的にグラフ化する</li>
</ul>
</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://books.onaneet.org/%e6%9c%aa%e5%88%86%e9%a1%9e/java%e3%82%b9%e3%83%91%e3%82%a4%e3%83%80%e3%83%bc%e3%83%84%e3%83%bc%e3%83%ab%e3%82%b5%e3%83%b3%e3%83%97%e3%83%ab%e3%82%af%e3%83%83%e3%82%af%e3%83%96%e3%83%83%e3%82%af%e2%80%94%e8%87%aa%e5%8b%95/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
