<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>futuremix &#187; XML</title>
	<atom:link href="http://futuremix.org/tag/xml/feed" rel="self" type="application/rss+xml" />
	<link>http://futuremix.org</link>
	<description>津田ふみかの日記・言想風景改め未来模景。 Remix The Future.</description>
	<lastBuildDate>Thu, 18 Mar 2010 16:40:34 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=abc</generator>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Microformats とセマンティックウェブ</title>
		<link>http://futuremix.org/2007/05/microformats-semantic-web</link>
		<comments>http://futuremix.org/2007/05/microformats-semantic-web#comments</comments>
		<pubDate>Sun, 06 May 2007 03:21:31 +0000</pubDate>
		<dc:creator>うさうさ</dc:creator>
				<category><![CDATA[ウェブデザイン]]></category>
		<category><![CDATA[AJAX]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[HTML]]></category>
		<category><![CDATA[Microformats]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[XHTML]]></category>
		<category><![CDATA[XML]]></category>
		<category><![CDATA[Yahoo]]></category>

		<guid isPermaLink="false">http://futuremix.org/2007/05/microformats-semantic-web</guid>
		<description><![CDATA[Yahoo は Microformats 対応へ

  Yahoo! Search Blog: Introducing Robots-Nocontent for Page Sections という記事を読んで考えたこと。 [...]]]></description>
			<content:encoded><![CDATA[<h3>Yahoo は Microformats 対応へ</h3>
<p>
  <a href="http://www.ysearchblog.com/archives/000444.html" title="Yahoo! Search Blog: Introducing Robots-Nocontent for Page Sections">Yahoo! Search Blog: Introducing Robots-Nocontent for Page Sections</a> という記事を読んで考えたこと。この記事の結論は、Yahoo のクローラーが  <code>class="robots-nocontent"</code> 属性のつけられた部分を重要視しないようになるよ、ということを言っています。一例を挙げると、
</p>
<pre class="html">
&lt;div class="robots-nocontent"&gt;
  この部分はサイトのナビゲーションメニューで
  すべてのページに共通の部分だから、
  記事とは無関係な単語やキーワードも含まれているよ。
&lt;/div&gt;
</pre>
<p>
  というような感じで使うことが想定されています。<code>rel="nofollow"</code> の考え方に近いです。このように特定のクラス名などを付与して、ウェブ全体で共通の意味づけをもたせようという考え方は <dfn><a href="http://microformats.org/wiki/Main_Page-ja" title="Main Page-ja - Microformats">Microformats</a></dfn> といわれています。Technorati はこの Microformats を推進しています。今回の Yahoo の発表は、Yahoo が Microformats に対応していくという表明と考えられます。
</p>
<h3>現代 HTML の問題点</h3>
<p>
  しかし、この発表には賛否両論が渦巻いています。そもそも検査エンジンのロボット（クローラー）のために、文章構造に本来必要のない class を追加することが <abbr title="HyperText Markup Language">HTML</abbr> の本質に反している、という主張があります。
</p>
<p>
私はこの意見には賛成ですが、現代の HTML 文章が、本来想定されていた HTML と異なる使われ方をしているところにそもそもの問題があると思います。今日の HTML が文書内容だけでなくユーザインターフェース（<abbr title="User Interface">UI</abbr>）や広告、サイドバーガジェットなどを含んでしまっているということです。
</p>
<p><!--More--></p>
<p>
  10年前の HTML は、文書構造とデザインが一体化しており、誰もが table,td 要素を使ったレイアウトや font 要素を使った見出し・強調の表現に疑問を持っていませんでした。それが啓蒙活動の成果により、HTML と <abbr title="Cascading Style Sheet">CSS</abbr> によるデザインの分離という考え方が浸透し、確立されてきました。
</p>
<p>
  しかし、UI の分離という点ではいまだに成し遂げられていません。そればかりか <abbr title="Asynchronous JavaScript + XML">AJAX</abbr> の登場で、HTML に UI が組み込まれる状況は加速しています。理想的には UI 部分を HTML から分離し、Mozilla の製品で使われている <abbr title="XML-based User-interface Language">XUL</abbr> など、他の言語で置き換えるという方向性が取られるべきだと思います。そもそも HTML が XHTML に進化したのも、名前空間を使って XML 文書に XML 文書を埋め込めるという XML ならではのメリットがあったからです。
</p>
<h3>セマンティックウェブの考えは普及したが、なぜ XML が使われないのか</h3>
<p>
  セマンティックウェブの考え自体は広く普及していますが、XHTML を XML 文書として積極的に利用しようという考え方はあまり普及していません。これにはいくつかの理由があると考えられます。
</p>
<p>
  一つにはすべての <abbr title="User Agent">UA</abbr>（すなわちウェブブラウザやクローラー）が、XML を解釈できないことがあります。また、多くのウェブデザイナーにとっては HTML はまだしも XML となると難易度が高い（と感じる）ことではないかと思います。技術者の中でも XML は苦手という人はいます。
</p>
<p>
例外的なのは <abbr title="RDF Site Summary">RSS</abbr>（のフォーマットである <abbr title="Resource Description Framework">RDF</abbr>）に <em><a href="http://www.kanzaki.com/docs/sw/dublin-core.html" title="Dublin Core（ダブリン・コア）: 書誌情報メタデータの共通語彙">Dublin Core</a></em> を埋め込んでいる例でしょう。ブログに RSS を埋め込んでいる例もありますが、ほとんどの場合 HTML のコメント扱いされており、本来あるべき姿ではないと感じています。
</p>
<p>
  XML の考え方は非常に有用なのですが、とっつきにくいというのが普及を妨げている要因だと思います。そこで、XML を使わずに HTML の範疇でセマンティックウェブに近づける試みが Microformats なのです。これなら HTML を理解したデザイナーも class 属性に決められた値を追加するだけですから簡単に取り組めます。
</p>
<p>
  Microformats はその導入のしやすさから、注目を集めています。しかし、大局的にはセマンティックウェブへの取り組みを遅らせてしまうという可能性もあると私は考えており、導入には躊躇しています。
</p>
<p>
  本来ならばウェブの文書を作成するツールが XML に対応し、またブラウザが XML に対応していけば Microformats のほとんどは不要になるはずです。それとも私はまだ理解していないだけで、Microformats は XML と共存して、もしくは相互補完してセマンティックウェブの普及に役立つのでしょうか。しかし Microformats は HTML のタグを拡張してきた苦い過去を彷彿とさせます。
</p>
<h3>本来 Yahoo が取るべき対応</h3>
<p>
  なぜ Yahoo はウェブサイトの作成者に労を強いるのでしょうか。Google は以前からウェブ文書のなかからコンテンツの重要部分とそうでない部分の切り分けに成功しているように見えます。Google は力業で解決していますが、Yahoo にはそれが難しいのか、よりスマートな解決策をもとめているのか、あくまで補助的に参考にするだけなのか疑問です。
</p>
<p>
  たとえば今回の Yahoo の取り組みも、スパマーに逆手に取られたらどうなるのか考えてみると、Google のように自動的に判別する技術はどのみち必要になってくると思います。</p>
]]></content:encoded>
			<wfw:commentRss>http://futuremix.org/2007/05/microformats-semantic-web/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>perl の XML::RSS で RSS を表示</title>
		<link>http://futuremix.org/2004/04/xml-rss</link>
		<comments>http://futuremix.org/2004/04/xml-rss#comments</comments>
		<pubDate>Wed, 28 Apr 2004 00:45:37 +0000</pubDate>
		<dc:creator>津田 ふみか</dc:creator>
				<category><![CDATA[ウェブログ]]></category>
		<category><![CDATA[Perl]]></category>
		<category><![CDATA[RSS]]></category>
		<category><![CDATA[XML]]></category>

		<guid isPermaLink="false">http://futuremix.org/2004/04/xml-rss</guid>
		<description><![CDATA[
  日記トップページのサイドバーに、CNET Japan と Slashdot Japan の記事見出しを表示してみました。記事見出しはサイトが配信している RSS ファイルを利用しています。


  RSS から情報 [...]]]></description>
			<content:encoded><![CDATA[<p>
  <a href="http://fumika.jp/nikki/">日記トップページ</a>のサイドバーに、<a href="http://japan.cnet.com/">CNET Japan</a> と <a href="http://slashdot.jp/">Slashdot Japan</a> の記事見出しを表示してみました。記事見出しはサイトが配信している <abbr title="RDF Site Summary">RSS</abbr> ファイルを利用しています。
</p>
<p>
  RSS から情報を取り出すにはいろいろなやり方がありますが、ここでは <a href="http://rpm.fumika.jp/perl#perl-XML-RSS">perl の XML::RSS モジュール</a>を利用しました。このモジュールを利用すると <abbr title="XML Stylesheet Language Transform">XSLT</abbr> などの知識が無くても手軽に RSS から情報を取得できます。Red Hat Linux 9 には含まれていませんので、別途 <a href="http://rpm.fumika.jp/perl#perl-XML-RSS">RPM を作成</a>してからインストール。XML::RSS は XML::Parser を内部で利用しているのでこれも必要になりますが、XML::Parser は Red Hat Linux 9 には含まれています。
</p>
<p><span id="more-406"></span></p>
<p>
  次のような Perl スクリプトを作成します。<br />
  RSS から情報を取り出して、<abbr title="HyperText Markup Language">HTML</abbr> の一部として出力します。
</p>
<pre class="code">
#!/usr/bin/perl
use strict;
use encoding 'utf-8';
use XML::RSS;

my $file = $ARGV[0];

my $rss = new XML::RSS;
eval {
    $rss-&gt;parsefile($file);
};
my ($link, $title);
for my $item (@{$rss-&gt;{items}}) {
    $link = $item-&gt;{link};
    $title = $item-&gt;{title};
    printf "&lt;li&gt;&lt;a href=\"%s\"&gt;%s&lt;/a&gt;&lt;/li&gt;\n", $link, $title;
}
</pre>
<p>
  上記のスクリプトを rss2list.pl として保存します。<br />
  実際には、件数の指定や、サニタイジングなど、の処理をしていますが、基本的にはこのような流れになります。また、出力フォーマットが UTF-8 以外の場合は、Jcode モジュールなどで変換する必要があります。<br />
  次に、wget コマンドで RSS ファイルをダウンロードして、スクリプトを通して、ファイルに出力します。
</p>
<pre class="command">
  $ wget http://japan.cnet.com/rss/index.rdf -O cnetjapan.rdf
  $ ./rss2list.pl cnetjapan.rdf &gt; cnetjapan.inc
</pre>
<p>
  あとは、トップページの HTML で <abbr title="Server-Side Include">SSI</abbr> を使ってこのファイルをインクルードしています。RSS の取得とスクリプトの実行を cron で定期的に行なうように設定すれば、自動的に最新の情報が表示できます。また、他の RSS ファイルも利用することができます。</p>
]]></content:encoded>
			<wfw:commentRss>http://futuremix.org/2004/04/xml-rss/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>perl-XML-Simple 2.12 の RPM つくりました</title>
		<link>http://futuremix.org/2004/04/perl-xml-simple</link>
		<comments>http://futuremix.org/2004/04/perl-xml-simple#comments</comments>
		<pubDate>Mon, 05 Apr 2004 14:59:39 +0000</pubDate>
		<dc:creator>津田 ふみか</dc:creator>
				<category><![CDATA[Linux]]></category>
		<category><![CDATA[Perl]]></category>
		<category><![CDATA[RPM]]></category>
		<category><![CDATA[XML]]></category>

		<guid isPermaLink="false">http://futuremix.org/2004/04/perl-xml-simple</guid>
		<description><![CDATA[
  blog.bulknews.net: XML::Simple 2.12にて、perl の XML::Simple 2.12 が出たと知りました。いつのまにか 2.10 と 2.11 も出ていたのですね。知りませんで [...]]]></description>
			<content:encoded><![CDATA[<p>
  <a href="http://blog.bulknews.net/mt/archives/000904.html">blog.bulknews.net: XML::Simple 2.12</a>にて、perl の <a href="http://search.cpan.org/~grantm/XML-Simple-2.12/">XML::Simple 2.12</a> が出たと知りました。いつのまにか 2.10 と 2.11 も出ていたのですね。知りませんでした。<a href="http://rpm.fumika.jp/">rpm.fumika.jp</a> で配布している <abbr title="Redhat Package Manager">RPM</abbr> は 2.09 だったので、2.12 で再構築しました。<a href="http://rpm.fumika.jp/perl#perl-XML-Simple">配布</a>しますので、どうぞ。Red Hat 9 用ですが、fedora や Turbolinux でも使えるんじゃないでしょうか。確認してませんけど。</p>
]]></content:encoded>
			<wfw:commentRss>http://futuremix.org/2004/04/perl-xml-simple/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
