<< Пред. стр.

стр. 48
(общее количество: 51)

ОГЛАВЛЕНИЕ

След. стр. >>

категорий.


Может возникнуть искушение хранить файлы изображений в соответствующих пап-
ках страниц, на которых находятся эти изображения. На первый взгляд такая страте-
гия не лишена смысла. Несомненно, можно организовать сайт подобным образом, но,
скорее всего, так делать не стоит. Когда Web-сайт начнет расширяться, вы вряд ли за-
хотите помнить, в какой папке находится то или иное конкретное изображение. Луч-
ше просто хранить всю графику в одной папке. В этом случае вы всегда будете знать,
где искать файл изображения.
Наконец, для сайта необходима домашняя страница, которая загружается при наборе
посетителем в своем браузере вашего интернет-адреса. HTML-документ домашней
страницы помещается внутрь локальной корневой папки, рядом с папками основных
категорий. Не помещайте домашнюю страницу в свою собственную папку. Страница
должна находиться на одном уровне с папками категорий. Кроме того, убедитесь что
домашней странице присвоено имя index.htm. Если присвоить ей другое имя, 6p;iv;iep
может не понять, что эта страничка должна быть домашней.
Суммируя сказанное, типовую структуру сайта можно представить следующим
образом.
• Локальная корневая папка
• Документ домашней страницы (index.htm)
• Папка основной категории
• Документ основной категории
• Папка подкатегории
• Документ подкатегории
• Папка изображений
• Файлы изображений
• Файлы клипов -
• Звуковые файлы
• Другие файлы
ГЛАВА 80. Создание HTML-документов 451

Шаблон стандартного HTML-документа
Инструментарий
Данный инструментарий предоставляет стандартную структуру
HTML-документа. Используйте ее в качестве шаблона для тести-
рования примеров в этой книге или для создания с нуля своих
собственных Web-страниц.
<html>
<head>
<ЫЬ1е>Здесь располагается название страни-
цы. < / t i t l e >


<!—Здесь располагаются теги <meta> —>


<!—Здесь располагается код JavaScript между те-
гами <script> —>


<!—Здесь располагаются таблицы стилей между те-
гами <style> —>


</head>
<body>


<!—Здесь располагается тело страницы —>


</body>
</html>
ГЛАВА81.
Добавление ключевых слов
и описании страниц
Когда поисковые системы, такие, как Google и Alta Vista, каталогизируют ваш сайт, они
анализируют содержимое страниц и каталогизируют определенные слова и фразы,
которые встречаются регулярно. Когда посетитель google.com или altavista.com зы-
полняет поиск, скажем по слову shoelaces (обувные шнурки), существует большая ве-
роятность, что ваш сайт появится среди результатов поиска, если на его страницах
встречается слово shoelaces (обувные шнурки).
Что произойдет, если сайт полностью посвящен обувным шнуркам (shoelaces), но вы не
используете часто слово shoelaces (обувные шнурки) в основном тексте? Это не такой уж
маловероятный сценарий, как может показаться на первый взгляд. Как часто встречает-
ся слово book (книга) на amazon.com? Не так часто, как можно было бы ожидать.



Определение
Ключевые слова (keywords) — это тематические заголовки страни-
цы. Описание страницы (page description) — это краткая, в один аб-
зац сводка содержимого страницы.



Один из способов помочь поисковым системам более точно индексировать ваш сайт •
заключается в предоставлении ключевых слов и описаний всех страниц. Ключевые
слова — это тематические заголовки страницы, тогда как описание страницы — это
краткая в один абзац сводка содержимого страницы.
Ключевые слова и описания страниц не отображаются в браузере, таким образом,
они не влияют на внешний вид страниц. Вы облегчаете задачу поиска вашего сайта по-
тенциальным посетителям.
Для решения данной задачи применяйте мета-теги. Мета-теги — это специальное
HTML-теги, которые содержат общие сведения о странице. Эти теги находятся в раз-
деле заголовка HTML-документа вместе с названием страницы (page title) и любыми
встроенными скриптами или таблицами стилей.



Определение
Мета-теги (meta tags) — это специальные HTML-теги, в которые зак-
лючаются общие сведения о странице.



Следующий блок кода показывает типовую разметку для ключевых слов и описания
страницы:
ГЛАВА 8 1 . Добавление ключевых слов и описаний страниц 453

<head>
<title>06yBHbie шнурки и т.д. Home</title>
<meta name="Keywords" content^"обувные шнурки, кеды, кроссовки,
теннисные туфли, повседневная обувь, ботинки на шнурках, шнурки, уз-
лы, покупки">
<meta name="description" content="Домашняя страница первой в ми-
ре полноценной 24-часовой службы, предлагающей для покупки обувные
шнурки и отличающейся широким выбором товара на складе и привлека-
тельными ценами для всех знаменитых высококачественных обувных
шнурков, снабжаемых ярлыками разработчиков и знаками качества.">
</head>
В обоих случаях мета-теги одинаковы. Другими словами не существует отдельного
тега для ключевых слов и отдельного тега для описания. И ключевые слова и описа-
ния используют один и тот же общий тег <meta>. Что отличает эти типы тегов, так
это атрибут name. Чтобы создать тег <meta> для ключевых слов, задайте значение
атрибута name равным keywords. Чтобы создать тег <meta> для описания страни-
цы, задайте значение атрибута name равным d e s c r i p t i o n . Атрибут content при-
нимает в качестве значения либо список ключевых слов, либо описание страницы.


Совет
При составлении списка ключевых слов попробуйте представить, ка-
кие слова и фразы будут вводить потенциальные посетители вашего
сайта в свои поисковые системы.




Определение
Робот (robot) — это специализированный фрагмент программы, ко-
торый каталогизирует или «обнюхивает» ваш сайт для поискового ме-
ханизма.


Как в действительности работают поисковые системы, зависит от поискового меха-
низма, а реальные процедуры поиска держатся компаниями в секрете. Но, как прави-
ло, процесс поиска выполняется приблизительно так. Робот поисковой системы, или
программа Интернет-анализа, посещает сайт и просматривает его страницы. Выпол-
няется сравнение ключевых слов и описаний с фактическим содержимым страниц.
Если робот приходит к выводу, что ключевые слова и описания страниц являются точ-
ными, он учитывает их при каталогизации сайта. Однако если робот определяет, что
ключевые слова и описания не соответствуют содержимому сайта, он может поста-
вить сайт в невыгодную позицию в списке системы поиска. По этой причине следует
предоставлять точные ключевые слова и описания. Если вами приводится список
ключевых слов таких, как обувные шнурки, шнурки и узлы, убедитесь, что ваш сайт
не занимается обслуживанием... ну, скажем, других типов веревок.
ГЛАВА 82.
Блокирование частей сайта
для поисковых систем
На первый взгляд может показаться нелогичным желание ограничить доступ поисковых
систем к какой-либо части сайта. Возможно, вы прилагаете большие усилия, чтобы ваш
сайт попал в списки как можно большего числа поисковых систем. Однако попробл-йге
оценить следующие аргументы: может быть, вы хотите точно управлять тем, как посети-
тель находит ваш сайт. Скажем, вы бы предпочли, чтобы посетители заходили на началь-
ную страницу, а не на страницы, находящиеся на три уровня глубже в структуре сайта.
Или, может быть, вы не хотите, чтобы посетители заходили вначале на страницу, которая
выполняет функцию всплывающего окна, где может отсутствовать полный набор средств
навигации. Чем больше вы размышляете на эту тему, тем больше убеждаетесь, что ограни-
чение доступа поисковых систем к некоторым областям сайта вполне оправдано.


Совет
Некоторые Web-дизайнеры, отдающие предпочтение дешевым ре-
шениям, а не хорошим, полагают, что методы, излагаемые в этой гла-
ве, предоставляют им надежный способ защиты важных сведений на
их сайтах. Эти Web-дизайнеры поступят правильно, если полностью
пропустят данную главу. Лучшее решение по безопасности — не дер-
жать конфиденциальную информацию на Web-сервере, и точка. Если
вы не можете себе этого позволить, следует исследовать и реализо •
вать действующие протоколы безопасности и авторизации, напри-
мер, каталоги, защищаемые паролем.

Существует относительно простой и надежный способ передачи своих предпочтений
по индексированию роботам — программам, которые поисковые системы посылают
для каталогизации вашего сайта. Вы добавляете специальный текстовый файл с именем
robots.txt на верхний уровень своего удаленного (remote) сайта прямо внутрь удаленной
корневой папки. Файл robots.txt предписывает посещающим поисковым механизмам
игнорировать специальные каталоги или файлы, которые в нем перечисляются.


Совет
Удостоверьтесь, что вы используете текстовый редактор при созда •
нии файла robot.txt для своего сайта, и сохраните результат с расши-
рением .txt. Вы сделаете неправильно, если создадите HTML-файл, а
затем измените его расширение на . txt.


Здесь есть загвоздка: чтобы описанная процедура работала, роботы должны удовлет-
ворять требованиям стандарта исключения роботов (Robots Exclusion Standard), ко-
торый является малоизвестным следствием из стрех законов робототехники (Three
Laws of Robotics) писателя-фантаста Азимова (Asimov). Стандарт исключения роботов
ГЛАВА 82. Блокирование частей сайта для поисковых систем 455

попросту утверждает, что робот должен подчиняться инструкциям, приводимым в
файле robot.txt. Однако этот стандарт не является законом. Он больше похож на пра-
вила хорошего поведения. Разработчики роботов для поисковых систем не обязаны
программировать свои творения в соответствии со стандартами, и действительно, су-
ществуют роботы-ренегаты, бешено носящиеся по Интернету в точности так, как опи-
сано в произведении «Я, робот» (I, Robot). Тем не менее, роботы всех основных поис-
ковых систем работают в соответствии с рекомендациями.
Простой файл robot.txt выглядит подобно следующему примеру: '
User-agent: *
Disallow: /popups/
Disallow: popup.htm
Disallow: /images/ i
Disallow: /;js/
Disallow: /ess/
Строки Disallow сообщают роботу, какие каталоги или файлы не следует посещаФь.
В предыдущем примере каталоги popups, images, js и ess заблокированы, также, как
и файл popup.htm.
Строка User-agent показывает, в отношении каких роботов действуют строки
Disallow.
Задание звездочки (*) в качестве значения User-agent означает, что инструкции
Ъхsal low действуют для всех роботов. Можно также указать отдельных роботов и за-
дать для каждого из них разные уровни доступа:
User-agent: googlebot
Disallow: /popups/
Disallow: popup.htm


User-agent: Roverdog
Disallow: /popups/
Disallow: popup.htm
Disallow: /images/
Disallow: /js/
Disallow: /ess/
В этом скрипте робот googlebot поисковой системы google не должен просматривать
каталог popups и файл popup.htm, тогда как робот Roverdog кроме папки popups и
файлу popup.htm не должен заходить в каталоги images, js и ess. _,
Между прочим, значения в строках Disallow являются относительными путями, ука-
зываемыми относительно корня. Таким образом, если вы хотите скрыть подпапку, а
не папку верхнего уровня, убедитесь, что указан полный путь к подпапке:
User-agent: Roverdog
Строим Web-сайты
456

Disallow: /swf/sourcefiles/
Если требуется скрыть абсолютно все (в этом случае от всех роботов), используйте
следующую запись:
User-agent: *
Disallow: /


Совет
Знак «звездочка» в файле robots.txt не является подстановочным
знаком. Поэтому вы не можете записать, например, Disallow: *.gif,
чтобы запретить поисковым системам сканировать все файлы изоб-
ражений с расширением GIF — для этого следует поместить все GIF-
файлы в папку и затем запретить доступ к этой папке. Звездочка ра-
ботает только в строке User-agent и только как сокращение, обоз-
начающее всех роботов.




Совет
Дополнительные сведения о файле robots.txt, а также имена
различных роботов, не упомянутых здесь, см. на сайте
www. robots txt. org/.



В следующем примере показано, как полностью запретить доступ для робота google и
разрешить полный доступ для всех других роботов:
User-agent: googlebot
Disallow: /
Если вы хотите сделать доступным все для всех роботов, используйте такую запись:
•"User-agent: *
Disallow:
А если вы хотите разрешить доступ только одному роботу (в данном примере, pofio гу
поисковой системы google), воспользуйтесь текстом:
User-agent: googlebot
Disallow:


User-agent: *
Disallow: /
Теперь вернемся к примеру в начале данной главы, где вы хотели попробовать заста-
вить новых посетителей заходить на сайт через начальную страницу. Допустим, ваш
ГЛАВА 82. Блокирование частей сайта для поисковых систем 457

сайт содержит пять каталогов верхнего уровня: products (продукты), services (услу-
ги), aboutus (о нас), images (изображения) и apps (приложения) наряду с HTML-фай-
лом contact.htim. Ваш файл robots.txt выглядит следующим образом:
User-agent: *
Disallow: /products/
Disallow: /services/
Disallow: /aboutus/
Disallow: /images/
Disallow: /apps/
Disallow: c o n t a c t . h t m
Поместите этот файл в каталог верхнего уровня удаленного (remote) сайта, и поиско-
вые системы будут индексировать только вашу домашнюю страницу (index.htm).
ГЛАВА 83.
Тестирование сайта
Для тестирования Web-сайта не обязательно быть подключенным к Интернету.
В действительности для этого вообще не нужна Web-служба. Web-браузеры отлично
справляются с чтением HTML-файлов, хранящихся на персональном компьютере


Определение
На Web-сайте локальные файлы (local files) — это файлы, которые
хранятся на персональном компьютере в целях их разработки и тес-
тирования. Удаленные файлы (remote files) — это файлы, которые
публикуются на Web-сервере. Именно удаленные файлы видят посе-
тители, когда заходят на ваш сайт.


Тестирование сайта с помощью персональных или локальных файлов вполне оправ-
данно. Одна из причин — нет необходимости подключаться к сети для тестирования
сайта и можно вносить любые изменения в код Web-страниц, не оказывая воздей-
ствия на опубликованную версию сайта. Выполненные изменения не действуют до
тех пор, пока вы не загрузите модифицированные страницы на Web-сервер. По этой
причине локальное тестирование помогает улучшить контроль качества. Нет необ-
ходимости размещать плохо кодированные страницы или страницы с ошибками,
чтобы весь мир увидел их. Вместо этого вы устраняете недочеты в автономном режи-
ме и загружаете свои Web-страницы после того, как все будет функционировать над-
лежащим образом.
Для тестирования сайта в автономном режиме запустите Web-браузер. Откройте ме-
ню File (Файл) и выберите команду Open (Открыть). В Netscape используется команда
Open File (Открыть файл). Появится диалог с запросом на выбор открываемого фай-
ла. Перейдите в локальную корневую папку и выделите домашнюю страницу сайта.
Страница загрузится, но помните, что это локальная версия, а не удаленная (remote)
версия и не версия в Интернете.


Часто задаваемые вопросы
Какие ТИПЫ ссылок работают при тестировании сайта в автоном-
ном режиме?
При тестировании локальной версии сайта без проблем работают от-
носительные ссылки, указываемые относительно документа. Тем не
менее, абсолютные ссылки нуждаются в подключении к Интернету, а,
относительные ссылки, указываемые относительно корня, функцио-
нируют только на Web-сервере. См. главу 61, в которой обсуждаются
различные типы путей, применяемых в ссылках.
ГЛАВА 83. Тестирование сайта 459

В целях тестирования рекомендуется загрузить последние версии нескольких разных
браузеров. Даже если вы пользуетесь исключительно Internet Explorer или являетесь в
повседневной жизни яростным поклонником Netscape, будучи Web-дизайнером, вы
должны думать также, как ваши посетители. Никогда не известно, каким браузером бу-
дет пользоваться тот, кто посетит ваш сайт. Поскольку разные браузеры отображают
одну и ту же Web-страницу по-разному — и различия могут быть значительными — вы
хотите предусмотреть любые потенциальные проблемы, прежде чем загрузить стра-
ницу в Интернет.



Часто задаваемые вопросы
Как насчет Mac-браузеров? Как насчет Linux-браузеров? Как
насчет других браузеров для Windows?
Как бы это жестоко не звучало, в Интернете попросту нет достаточно-
го количества компьютеров, которые бы не относились к Windows,
Microsoft или Netscape, чтобы говорить о какой-либо статистической
разнице. Если вы создаете сайт общего назначения, не считайте се-
бя обязанным тестировать сайт, например, в браузере Macintosh. Ес-
ли у вас есть доступ к браузеру платформы Мае, конечно же, протес-
тируйте сайте нем. Но не думайте, что вам надо покупать Мае, только
чтобы убедиться в работоспособности сайта с Мас-браузерами.
Netscape и Opera — значительные альтернативы для браузера корпо-
рации Майкрософт, но они не являются единственными. Альтерна-
тивные браузеры — в особенности любимая Mozilla, форма проекта
Netscape, которую он принял по окончании войны браузеров — ориен-
тируются на стили жизни и философии слишком маленьких групп лю-
дей, являющихся прежними поклонниками, оригиналами-интернет-
чиками или лицами, продвигающими программный продукт.
Если бы Интернет не развился в заметное информационное сред-
ство, возможно, вам бы требовалось разрабатывать сайты и для этих
альтернативных браузеров. Однако так сложились обстоятельства
(или, скорее всего, рынок), что Интернет стал популярной средой, и
огромное большинство его пользователей знают о технической сто-
роне его работы не намного больше того, что телезрители знают о
работе телевизора. В наши дни нужно быть серьезным и преданным
знатоком Интернета, чтобы искать пользователей других програм-
мных продуктов помимо программного обеспечения корпорации
Майкрософт. Несомненно, проект Mozilla возник благодаря Time
Warner, корпоративным собственникам марки Netscape, поэтому если
вы страстно желаете найти действительно альтернативный Web-бра-
узер, поищите где-нибудь еще.

Тем не менее, факт остается фактом: опять же, к сожалению, ре-
альности Интернета на сегодняшний день таковы, что для сайтов
общего назначения требуется брать в рассмотрение главным об-
разом Internet Explorer. Однако, на всякий случай, посетите сайт
www. mozilla. org/.
Строим Web-сайты
460

Самым распространенным браузером является Microsoft Internet Explorer для
Windows. Чтобы вы ни делали, убедитесь, что ваш сайт хорошо работает в этом бра-
узере. Вторым по популярности браузером, намного отстающим от Internet Explorer,
является Netscape для Windows. Хотя можно разработать эффективный сайт, ориен-
тируясь исключительно на его вид и работу в браузере корпорации Майкрософт,
большинство дизайнеров считают свои сайты не завершенными до тех пор, пока
страницы не будут нормально выглядеть как в Internet Explorer, так и в Netscape.
В Европе достаточно широко распространен браузер Opera для Windows, поэтому
желательно, чтобы сайты с большой международной аудиторией работали и с бра-
узером Opera.
Посетите сайт www.netscape.com/, чтобы загрузить бесплатную копию браузера

<< Пред. стр.

стр. 48
(общее количество: 51)

ОГЛАВЛЕНИЕ

След. стр. >>