在第一章中,我们初步了解了上网的过程,同时也明白了所谓网页,其本质就是主要用HTML语言所写的一份文档。相信大多数人在了解HTML文件前,最先接触的是利用“记事本”所写的文档或者是利用办公软件“Word”所建的文档,身为初心者的你可能会问,HTML文档与这些文档又有何差别?在回答这个问题前,让我们尝试着创建这三种文档。
创建我们熟悉的.txt文件,打开它并试着输入文本内容“学而时习之”:
创建一个.docx文件,打开并输入文本内容“学而时习之”:
好,现在让我们创建今天的主角——HTML文档。尝试着把“记事本”文档和Word文档的后缀名改为“html”:
你会发现他们“看上去”都一模一样了,那让我们打开试试:
“记事本”文档
Word文档
我们可以通过后缀名改变文件类型,当我们将后缀名改为“html”后,实际上已经创建了“HTML文档”。但是改了文档后缀名后,我们发现出现了不同情况了。当我们将后缀名为“txt”的文档改为“html”后,双击打开文本内容仍然能够正常显示出来;但是,为什么将Word文档后缀名“docx”改为“html”后,双击后文档却显示一大片乱码呢。使用过Word的人应该都明白,Word文本是带有格式的文本,即我们不仅可以输入文本,同时默认地文本已经自带了格式,如字号字体行距等(当然我们还可以主动给文本内容设置各种格式)。显然地,Word文本区别于“记事本”文档以及“html”文档——我们通常将Word这种自带文本格式的文档成为“格式文本”,而剩余的称为“纯文本”。因为Word文档内还包含关于格式的数据,将其后缀名改为“html”后,这些数据难以解释出来,最终出现了乱码。
由上我们可以知道,HTML文档便是纯文本文档。接下来,我将简单介绍HTML文档的主要结构,让我们试着写一个简单的的HTML页面吧!
<html> <head> </head> <body> </body> </html>