<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>futuremix &#187; HTML</title>
	<atom:link href="http://futuremix.org/tag/html/feed" rel="self" type="application/rss+xml" />
	<link>http://futuremix.org</link>
	<description>津田ふみかの日記・言想風景改め未来模景。 Remix The Future.</description>
	<lastBuildDate>Thu, 18 Mar 2010 16:40:34 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=abc</generator>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Microformats とセマンティックウェブ</title>
		<link>http://futuremix.org/2007/05/microformats-semantic-web</link>
		<comments>http://futuremix.org/2007/05/microformats-semantic-web#comments</comments>
		<pubDate>Sun, 06 May 2007 03:21:31 +0000</pubDate>
		<dc:creator>うさうさ</dc:creator>
				<category><![CDATA[ウェブデザイン]]></category>
		<category><![CDATA[AJAX]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[HTML]]></category>
		<category><![CDATA[Microformats]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[XHTML]]></category>
		<category><![CDATA[XML]]></category>
		<category><![CDATA[Yahoo]]></category>

		<guid isPermaLink="false">http://futuremix.org/2007/05/microformats-semantic-web</guid>
		<description><![CDATA[Yahoo は Microformats 対応へ

  Yahoo! Search Blog: Introducing Robots-Nocontent for Page Sections という記事を読んで考えたこと。 [...]]]></description>
			<content:encoded><![CDATA[<h3>Yahoo は Microformats 対応へ</h3>
<p>
  <a href="http://www.ysearchblog.com/archives/000444.html" title="Yahoo! Search Blog: Introducing Robots-Nocontent for Page Sections">Yahoo! Search Blog: Introducing Robots-Nocontent for Page Sections</a> という記事を読んで考えたこと。この記事の結論は、Yahoo のクローラーが  <code>class="robots-nocontent"</code> 属性のつけられた部分を重要視しないようになるよ、ということを言っています。一例を挙げると、
</p>
<pre class="html">
&lt;div class="robots-nocontent"&gt;
  この部分はサイトのナビゲーションメニューで
  すべてのページに共通の部分だから、
  記事とは無関係な単語やキーワードも含まれているよ。
&lt;/div&gt;
</pre>
<p>
  というような感じで使うことが想定されています。<code>rel="nofollow"</code> の考え方に近いです。このように特定のクラス名などを付与して、ウェブ全体で共通の意味づけをもたせようという考え方は <dfn><a href="http://microformats.org/wiki/Main_Page-ja" title="Main Page-ja - Microformats">Microformats</a></dfn> といわれています。Technorati はこの Microformats を推進しています。今回の Yahoo の発表は、Yahoo が Microformats に対応していくという表明と考えられます。
</p>
<h3>現代 HTML の問題点</h3>
<p>
  しかし、この発表には賛否両論が渦巻いています。そもそも検査エンジンのロボット（クローラー）のために、文章構造に本来必要のない class を追加することが <abbr title="HyperText Markup Language">HTML</abbr> の本質に反している、という主張があります。
</p>
<p>
私はこの意見には賛成ですが、現代の HTML 文章が、本来想定されていた HTML と異なる使われ方をしているところにそもそもの問題があると思います。今日の HTML が文書内容だけでなくユーザインターフェース（<abbr title="User Interface">UI</abbr>）や広告、サイドバーガジェットなどを含んでしまっているということです。
</p>
<p><!--More--></p>
<p>
  10年前の HTML は、文書構造とデザインが一体化しており、誰もが table,td 要素を使ったレイアウトや font 要素を使った見出し・強調の表現に疑問を持っていませんでした。それが啓蒙活動の成果により、HTML と <abbr title="Cascading Style Sheet">CSS</abbr> によるデザインの分離という考え方が浸透し、確立されてきました。
</p>
<p>
  しかし、UI の分離という点ではいまだに成し遂げられていません。そればかりか <abbr title="Asynchronous JavaScript + XML">AJAX</abbr> の登場で、HTML に UI が組み込まれる状況は加速しています。理想的には UI 部分を HTML から分離し、Mozilla の製品で使われている <abbr title="XML-based User-interface Language">XUL</abbr> など、他の言語で置き換えるという方向性が取られるべきだと思います。そもそも HTML が XHTML に進化したのも、名前空間を使って XML 文書に XML 文書を埋め込めるという XML ならではのメリットがあったからです。
</p>
<h3>セマンティックウェブの考えは普及したが、なぜ XML が使われないのか</h3>
<p>
  セマンティックウェブの考え自体は広く普及していますが、XHTML を XML 文書として積極的に利用しようという考え方はあまり普及していません。これにはいくつかの理由があると考えられます。
</p>
<p>
  一つにはすべての <abbr title="User Agent">UA</abbr>（すなわちウェブブラウザやクローラー）が、XML を解釈できないことがあります。また、多くのウェブデザイナーにとっては HTML はまだしも XML となると難易度が高い（と感じる）ことではないかと思います。技術者の中でも XML は苦手という人はいます。
</p>
<p>
例外的なのは <abbr title="RDF Site Summary">RSS</abbr>（のフォーマットである <abbr title="Resource Description Framework">RDF</abbr>）に <em><a href="http://www.kanzaki.com/docs/sw/dublin-core.html" title="Dublin Core（ダブリン・コア）: 書誌情報メタデータの共通語彙">Dublin Core</a></em> を埋め込んでいる例でしょう。ブログに RSS を埋め込んでいる例もありますが、ほとんどの場合 HTML のコメント扱いされており、本来あるべき姿ではないと感じています。
</p>
<p>
  XML の考え方は非常に有用なのですが、とっつきにくいというのが普及を妨げている要因だと思います。そこで、XML を使わずに HTML の範疇でセマンティックウェブに近づける試みが Microformats なのです。これなら HTML を理解したデザイナーも class 属性に決められた値を追加するだけですから簡単に取り組めます。
</p>
<p>
  Microformats はその導入のしやすさから、注目を集めています。しかし、大局的にはセマンティックウェブへの取り組みを遅らせてしまうという可能性もあると私は考えており、導入には躊躇しています。
</p>
<p>
  本来ならばウェブの文書を作成するツールが XML に対応し、またブラウザが XML に対応していけば Microformats のほとんどは不要になるはずです。それとも私はまだ理解していないだけで、Microformats は XML と共存して、もしくは相互補完してセマンティックウェブの普及に役立つのでしょうか。しかし Microformats は HTML のタグを拡張してきた苦い過去を彷彿とさせます。
</p>
<h3>本来 Yahoo が取るべき対応</h3>
<p>
  なぜ Yahoo はウェブサイトの作成者に労を強いるのでしょうか。Google は以前からウェブ文書のなかからコンテンツの重要部分とそうでない部分の切り分けに成功しているように見えます。Google は力業で解決していますが、Yahoo にはそれが難しいのか、よりスマートな解決策をもとめているのか、あくまで補助的に参考にするだけなのか疑問です。
</p>
<p>
  たとえば今回の Yahoo の取り組みも、スパマーに逆手に取られたらどうなるのか考えてみると、Google のように自動的に判別する技術はどのみち必要になってくると思います。</p>
]]></content:encoded>
			<wfw:commentRss>http://futuremix.org/2007/05/microformats-semantic-web/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Another HTML-lint を Linux サーバに設置</title>
		<link>http://futuremix.org/2005/07/another-htmllint</link>
		<comments>http://futuremix.org/2005/07/another-htmllint#comments</comments>
		<pubDate>Sat, 16 Jul 2005 04:22:13 +0000</pubDate>
		<dc:creator>津田 ふみか</dc:creator>
				<category><![CDATA[Linux]]></category>
		<category><![CDATA[ウェブデザイン]]></category>
		<category><![CDATA[Apache]]></category>
		<category><![CDATA[CGI]]></category>
		<category><![CDATA[HTML]]></category>
		<category><![CDATA[Lynx]]></category>
		<category><![CDATA[Perl]]></category>

		<guid isPermaLink="false">http://futuremix.org/2005/07/another-htmllint</guid>
		<description><![CDATA[
  HTML の文法チェックツールとして有名な Another HTML-lint を、自前の Linux サーバにセットアップしましたので、そのときの設定メモ。ちなみに fumika.jp のサーバではありませんので [...]]]></description>
			<content:encoded><![CDATA[<p>
  <abbr title="HyperText Markup Language">HTML</abbr> の文法チェックツールとして有名な <a href="http://openlab.ring.gr.jp/k16/htmllint/index.html">Another HTML-lint</a> を、自前の Linux サーバにセットアップしましたので、そのときの設定メモ。ちなみに fumika.jp のサーバではありませんので、ヘンな真似はしないで下さい。サーバは Red Hat Linux 9 です。
</p>
<h3 id="download">ダウンロード</h3>
<p>
  まず、<a href="http://openlab.ring.gr.jp/k16/htmllint/download.html">Another HTML-lint をダウンロード</a>します。最新の zip 版をダウンロードし、/var/www/html/htmllint/ に解凍します。ディレクトリ名は <kbd>htmllint</kbd> にする必要性はありませんが、ここでは便宜上そのようにしてあります。
</p>
<h3 id="modules">必要パッケージの確認</h3>
<p>
  Another HTML-lint は Perl の LWP(libwww-perl)、CGI および Jcode モジュールが必要です。
</p>
<pre class="command">
  $ rpm -qa | grep perl
</pre>
<p>
  として必要なモジュールがインストールされているかどうかを確認してください。Red Hat Linux 9 には Jcode の <abbr title="Redhat Package Manager">RPM</abbr> は含まれていませんが、<a href="http://rpm.fumika.jp/perl#perl-Jcode" title="Perl Modules RPM for Red Hat Linux 9">私がパッケージしたものを公開しています</a>ので、こちらをインストールしても良いかと思います。（もちろん自己責任でお願いします。）
</p>
<p>
  また、Another HTML-lint はテキストブラウザでの見栄えを出力してくれる機能があります。これを利用するために Lynx パッケージも入っているかどうかチェックしておいてください。
</p>
<pre class="command">
  $ rpm -q lynx
  <samp>lynx-2.8.5-11</samp>
</pre>
<p><span id="more-856"></span></p>
<h3 id="setup">設定</h3>
<p>
  解凍した中に htmllintenv というファイルがあります。これを <kbd>htmllint.env</kbd> に名前を変更した上で、開いて修正します。
</p>
<pre class="command">
  $ mv htmllintenv htmllint.env
  $ vi htmllint.env
</pre>
<pre class="config">
  <span class="comment">#コメントを外す</span>
  $KANJICODE = 'EUC';
  <span class="comment">#コメントを外してパスを修正</span>
  $LYNX = '/usr/bin/lynx -dump -nolist -force_html';
</pre>
<p>
  ほかにもプロキシサーバの設定などが必要でしたら行なってください。
</p>
<p>
  Red Hat Linux では、通常 perl のパスは /usr/local/bin/ ではなく /usr/bin/ です。htmllint（というファイルがあります）、htmllint.cgi、tagslist.cgi、および parsedtd.plファイルを開き、先頭行の Perl のパスを修正します。
</p>
<pre class="config">
  #!/usr/bin/perl
</pre>
<p>
  *.cgi ファイルのパーミッションを 755 などに変更し、<abbr title="Common Gateway Interface">CGI</abbr> が動作するようにします。
</p>
<pre class="command">
  $ chmod 755 htmllint.cgi tagslist.cgi
</pre>
<p>
  また、Lynx の設定を変更し、出力が EUC になるようにします。
</p>
<pre class="command">
  # vi /etc/lynx.cfg
</pre>
<pre class="config">
  <span class="comment">#CHARACTER_SET:iso-8859-1</span>
  CHARACTER_SET:euc-jp
</pre>
<h3 id="httpdconf">httpd.con の設定</h3>
<p>
  Red Hat Linux の Apache のデフォルト設定では、CGI が cgi-bin ディレクトリ以外では動きません。そこで htmllint ディレクトリでも CGI が動作するようにします。また、htmllint.env ファイルが第三者に見られないようにします。
</p>
<p>
  これらの設定は .htaccess ファイルで行なう方法もありますが、今回は httpd.conf ファイルに直接書いてみました。
</p>
<pre class="config">
  <span class="comment"># /etc/httpd/conf/httpd.conf</span>
  &lt;Directory "/var/www/html/htmllint"&gt;
    Options MultiViews ExecCGI
    AllowOverride None
    AddHandler cgi-script .cgi .env
    AddCharset ISO-2022-JP .html
    Order allow,deny
    Allow from all
  &lt;/Directory&gt;
</pre>
<p>
  .html に対して ISO-2022-JP の Charset を指定しないと、結果の解説ページなどが文字化けします。  設定が終わったら、Apache を再起動します。
</p>
<pre class="command">
  # service httpd configtest
  <samp>Syntax OK</samp>
  # service httpd graceful
</pre>
<h3 id="test">テスト</h3>
<p>
  ウェブブラウザで <kbd>http://サーバ名/htmllint/</kbd> にアクセスして、テストしてください。CGI のソースコードが表示されてしまう場合は、httpd.conf の設定か、パーミッションの設定に誤りがあります。CGI のエラーが発生する場合は、Perl のパスの書き換えができてないか、httpd.conf の設定に誤りがあると思います。
</p>
<h3 id="bookmarklet">ブックマークレット</h3>
<p>
  HTML-lint の動作が確認できたら、ブックマークレットを作っておきましょう。次のリンクは Mozilla Suite / Firefox 用です。他のブラウザでは確認していません。
</p>
<p>
  <a href=" javascript: var uri = location.href; var uri = uri.replace(/#.+/, %22%22); var uri =%22http://openlab.ring.gr.jp/k16/htmllint/htmllint.cgi?URL=%22 + uri + %22;V;TextView=lynx%22; window.open(uri, %22htmllint%22); eval();">Another HTML-lint でチェック</a>
</p>
<p>
  このリンクをブックマークツールバーなどにドラッグ・アンド・ドロップします。初期状態では本家のサーバにチェックに行くようになっていますので、これを<em>必ず</em>自分で設置した <abbr title="Uniform Resource Locator">URL</abbr> に<em>書き換えて</em>ください。チェックしたいページを開いた状態でブックマークレットを使います。
</p>
<h3>2009-11-12 追記</h3>
<p>
  lynx.cfg で出力コードを EUC に変更してしまうと、HTMLlint 以外の目的で Lynx を使うときに困ります。その場合は lynx.cgi を変更せずに、htmllint.env 内の <var>$LYNX</var> に文字コードの指定を追加します。
</p>
<pre class="config">
  $LYNX = '/usr/bin/lynx -dump -nolist -force_html <kbd>-display_charset=euc-jp</kbd>';
</pre>
]]></content:encoded>
			<wfw:commentRss>http://futuremix.org/2005/07/another-htmllint/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
