Web ページの仕組み【2. 最低限 HTML】

  1. 事前準備
  2. 最低限 HTML
  3. Web ページの公開
  4. 本日の課題

--- 以降付録 ---

  1. 特殊文字
  2. スタイルシート
  3. X転送

※2020 年度は 1 章 - 3 章 まで一通り行います. 節の冒頭, もしくはコマンドの実行を指示する箇所には赤字で「※2020 年度 : 」から始まる注釈をつけているので, よく確認し, 実行可能なコマンドは joho18 にて行ってください.
例年はこの資料に沿って情報実験機を使った実習をしています.


※2020 年度 : [2. 最低限 html] では, joho18 上で行う操作はありませんが, 一部手元の計算機で行う作業があります.
資料に目を通し, 注釈の付いた作業箇所は各自の計算機で実行してください.

[2.1] HTML の構造

ブラウザで閲覧できる最低限のHTML ファイルの書き方を解説します. HTML とはWeb ページを記述するための言語です.

HTML では要素 の組み合わせで文章の論理構造や表示の仕方を記述できます. 以下の図で表わされるように要素は構成されます. この内, 属性, 要素の内容, 終了タグが無い要素もあります.

html element

HTML 文書はhead 要素とbody 要素で構成されます. また, この2つを合わせたHTML の本体がhtml 要素になっています.

では簡単なHTML ファイルを作って, ブラウザで表示してみましょう.まず, エディタで hello.html というファイルを作って編集します.

$ cd ~
$ vi hello.html

HTML 文書内に, 以下のように入力します.

<!DOCTYPE html>

<html lang="ja">
 <head>
  <meta charset="UTF-8">
  <title>
    最低限html
  </title>
 </head>

 <body>
  <p>
    こんにちは
  </p>
 </body>
</html>

作成したHTML ファイルをブラウザで表示します.

$ firefox hello.html &

※2020 年度 : 各自の計算機のブラウザから以下の URL にアクセスしてください. (閲覧には elms で公開されているレクチャー動画視聴用のユーザー名とパスワードが必要です)
http://joho18.ep.sci.hokudai.ac.jp/~inex2020/hello.html

これにより以下の様な画面が表示されるはずです. 要素の説明は, [2.2] を参照してください.

hello.html

最初の <!DOCTYPE html> は、この文書がHTML5 で書かれていることを示します.

HTML にはいくつかのバージョンがあります. 初代の正式仕様は1993 年に公開されたHTML 1.0 で, 正式版としての最新バージョンは2017 年12 月14 日にW3C によって勧告されたHTML5.2 です.それぞれのバージョンでは, 文書の記述方法が一部異なります. そのため, HTML 文書を作成する際は, HTML のバージョンに気を配って文書を記述する必要があります.

[2.2] 基本的なタグ

ここでは、HTML 文書に使われる基本的なタグについて解説します.

[2.2.1] <html> 〜 </html>

<html> 〜 </html>で文章を囲むことで, この文章がHTML 文書であることを表します. また, <html lang="ja">と属性に言語を指定することで, このページが日本語で書かれていることを示すことができます.

[2.2.2] <head> 〜 </head>

ヘッダ情報(文章自身に関する情報)が入ります. 以下のmeta 要素やtitle 要素が内部に入ります.

[2.2.3] <body> 〜 </body>

本文が入ります。このタグに囲まれた内容がブラウザに表示されます

[2.2.4] <meta 属性="〜" >

文字コードの指定, 検索エンジンに利用されるこの文書の説明, 検索の際に引っかかるキーワードなど, 文書に関する情報を属性として指定します. 例えば, 属性に文字コードの指定として charset="UTF-8" を指定すると, この文章がutf-8 で記述されているということを示すことができます. これは, ブラウザがhtml 文書の文字コードを解釈するために使われます.

文字コードとは, 文字や記号一つ一つに割り当てられた固有の数字のことで, 割り当て方によってISO-2022-JP, EUC-JP, SHIFT_JIS, UTF-8 などの種類があります。 ブラウザが文字化けをおこすのは, それぞれの文字に割り当てられた数字が文字コードごとで異なるためです. HTML 文書中で文字コードの指定を間違ってしまった場合, ブラウザがその数字を間違って解釈してしまい, 表示させたい文字とは異なった文字が表示されてしまいます. そのような場合には, head 要素の直下にmeta タグを置き, <meta charset="EUC-JP"> と文書の文字コードをきちんと指定してやることで, 文字化けを防ぐことができます.

[2.2.5] <title> 〜 </title>

文書のタイトルが入ります.

[2.2.6] <h1> 〜 </h1>、<h2> 〜 </h2>、<h3> 〜 </h3>

見出しをつけます. それぞれ, 第一見出し, 第二見出し...のように数字が小さいほど重要な見出しで, より大きく強調されて表示されます. <h6> まであります.

[2.2.7] <p> 〜 </p>

段落をわけます. このタグに囲まれた範囲がひとつの段落となります.

[2.2.8] <strong> 〜 </strong>

文字を 強調 します.

[2.2.9] <em> 〜 </em>

文字を 強勢 します(strong よりは弱い強調).

[2.2.10] <a href="URL"> 〜 </a>

リンクを張ります.

上の例では, <a href="http://www.ep.sci.hokudai.ac.jp/~inex/index.html">リンク</a> として, "リンク" という文字にinex トップページへのリンクを貼っています。

[2.2.11] <ul> 〜 </ul>, <ol> 〜 </ol>

リストを作ります. このタグ内に <li> 〜 </li> とタグを入れてやることで, 項目を作成することができます. また, ul の代わりにol を用いると、番号付きになります。

以下に例をあげます.

<ul>
  <li>りんご</li>
  <li>みかん</li>
  <li>もも</li>
</ul>

このように記述した場合, 以下の用に表示されます.

以下は <ol> を用いた場合の例です.

<ol>
  <li>札幌</li>
  <li>旭川</li>
  <li>函館</li>
</ol>
  1. 札幌
  2. 旭川
  3. 函館

[2.2.12] <br>






す.

これは単一のタグで利用でき, 終了タグ(</br > のような)は必要ありません. また, 要素を入れることもできません.このような要素を空要素といいます.

[2.2.13] <img src="画像ファイル" alt="〜" >

inex_logo
画像を貼ります. alt には, 画像を表示できない場合に, 代わりに表示するテキストを指定します.
上は,

<img src="http://www.ep.sci.hokudai.ac.jp/~inex/y2017/fig/inex_logo8.png" alt="inex_logo" >

とした場合の表示例です. 上記のURL は, ファイルの存在する場所, 及びその場所との通信方法を示しています. HTML ファイルと同じ場所に画像ファイルがあるときには, src="./inex_logo8.png" のように, パスで指定することもできます.

[2.2.14] <!-- 〜 -->

コメントを入れます. わかりやすいHTML にするためには, どこでどのような操作をしているのか分かるように, 適切にコメントを入れることが肝心です.

[2.2.15] <table> 〜 </table>

表を作ります, 以下は, rm コマンドのオプション表のHTML ソースです.

    <table>
      <caption>代表的なオプション</caption>
      <tr>
        <th>オプション</th>
        <th>効果</th>
      </tr>
      <tr>
        <td>-i</td>
        <td>削除するかどうか確認してくる. </td>
      </tr>
      <tr>
        <td>-f</td>
        <td>読み取り専用ファイルでも削除. また, i オプションを無効にします. </td>
      </tr>
      <tr>
        <td>-r</td>
        <td>中にあるファイルごと, 指定されたディレクトリを削除する.</td>
      </tr>
    </table>

以下は, 上記のHTML ソースの表示例です.

代表的なオプション
オプション 効果
-i 削除するかどうか確認してくる.
-f 読み取り専用ファイルでも削除. また, i オプションを無効にします.
-r 中にあるファイルごと, 指定されたディレクトリを削除する.

[2.3] リッチなコンテンツ

単なる画像や文章の羅列ではない, 様々なタグの機能を用いて作成した表現豊かなコンテンツのことを, リッチなコンテンツといいます. では, ここまでに学んだタグを駆使して, 少しだけリッチなコンテンツを作ってみましょう.

エディタで rich.html というファイルを作成します. 使うタグの内容については, [2.2]の内容を参考にしてください.
まず, INEX トップページのロゴ画像をダウンロードしてきます.

$ wget http://www.ep.sci.hokudai.ac.jp/~inex/y2017/fig/inex_logo8.png

HTML ファイルを作成します. 日本語の部分に関しては, 各自で変えていただいて構いません.

$ vi rich.html

HTML 文書内に, 以下のように入力します.

<!DOCTYPE html>

<html lang="ja">
 <head>
  <meta charset="UTF-8">
   <title>世界の挨拶_inex情報演習</title>
  </head>

 <body>
  <h1>世界の挨拶</h1>
   <h2>アジア</h2>
    <ul>
      <li>日本
       <ul>
        <li>こんにちは</li>
       </ul>
      </li>

      <li>中国
       <ul>
        <li>ニーハオ</li>
       </ul>
      </li>
    </ul>

   <br>

   <p>
    <img src="./inex_logo8.png" alt="inexのロゴ"/>
    <br>
    <a href="http://www.ep.sci.hokudai.ac.jp/~inex/index.html"> inexトップページへのリンク </a>
   </p>
 </body>
</html>

ブラウザで表示します

$ firefox rich.html &

※2020 年度 : 各自の計算機のブラウザから以下の URL にアクセスしてください. (閲覧には elms で公開されているレクチャー動画視聴用のユーザー名とパスワードが必要です)
http://joho18.ep.sci.hokudai.ac.jp/~inex2020/rich.html

以下の様な画面が表示されるはずです.

rich.html

HTML 文法のチェックは以下の様なサイトで行うことができますので, 自分で書くときには活用すると良いでしょう.

w3cのmarkup validation service
another html-lint 5

[2.4] HTML タグ (発展編)

[2.4.1] <hr>

水平線を引きます. 意味的な段落が変わったことを示します.


[2.4.2] <pre> 〜 </pre>

通常, HTML 文章中の連続したスペース文字や改行はまとめて一つのスペース(空白) として表示されますが, pre 要素の内部では, これらがHTML 文書内で記述されたとおりに表示されます.

    このように
             改行や空白が
                     そのままに
                          表示されます.

[2.4.3] <div> 〜 </div>

<div> 〜 </div>で囲んだ範囲を一つのかたまりとして定義します. 属性を指定することでスタイルを指定したりできます.

この例では、属性を style=" background-color:black; color:white;" として, 背景色を黒, 文字色を白にしています.

[2.4.4] <blockquote> 〜 </blockquote>

引用, 転載であることを示します. 以下は, 夏目漱石「坊っちゃん」からの引用例です. 引用元の表示には, <cite> ~ </cite> タグを使用します.

親譲の無鉄砲で小供の時から損ばかりしている。小学校に居る時分学校の二階から飛び降りて一週間ほど腰こしを抜ぬかした事がある。なぜそんな無闇をしたと聞く人があるかも知れぬ。別段深い理由でもない。新築の二階から首を出していたら、同級生の一人が冗談に、いくら威張っても、そこから飛び降りる事は出来まい。弱虫やーい。と囃したからである。小使に負ぶさって帰って来た時、おやじが大きな眼をして二階ぐらいから飛び降りて腰を抜かす奴があるかと云いったから、この次は抜かさずに飛んで見せますと答えた。 夏目漱石「坊っちゃん」

現在適用されているスタイル (付録 : 6. スタイルシート参照) では, 以上のように少し字下げされて表示されます.


次ページへ
情報実験第 8 回のページへ戻る

最終更新日: 2020/07/10 関口 太郎
Copyright © 2000-2020 inex