НЬЯННА Научный руководитель – С.М. Садчиков, к.т.н., доцент Московский инженерно-физический институт (государственный университет), ИССЛЕДОВАНИЕ СОЗДАНИЯ МНОГОЯЗЫКОВЫХ САЙТОВ Современный разработчик сталкивается с необходимостью поддержки разных языков в рамках одного проекта. Под языком подразумеваем любой естественный язык, в алфавите которого присутствуют символы. В докладе рассматриваются многоязычные приложения на сайте в самых различных аспектах. Приводятся примеры использования языка Мьянмы на подобных сайтах. Рассмотрим аспекты сайтов, где может возникнуть потребность в различных языках: неструктурированный текст на естественном языке; структурированные данные; изображения, содержащие текст или другие языковонациональные или государственные особенности; цифры (например, в языке Мьянмы). Кроме языкового аспекта часто возникают близкие по смыслу «региональные» аспекты, например, такие как текущее время и его формат, географическо-адресная информация и другое. Большинство современных сайтов содержат динамическое наполнение, которое, как правило, хранится в базах данных или XMLфайлах. Эти данные появляются на веб-страницах, благодаря серверным языкам (скриптам), таким как PHP, Java, VBScript, Jscript, Perl и др. Одна из проблем при создании многоязыковых сайтов – это отображение данных различными шрифтами на различных языках на вебстранице и хранение информации на различных языках на сервере. Эта проблема решается использованием кодировки “Юникод” UTF-8 [1]. Юникод UTF-8 – это стандарт, созданный консорциумом Unicode – организацией, содействующей использованию единого набора символов для любых языков. Принцип работы Юникода заключается в том, что для каждого символа, независимо от платформы, программы или языка, предусмотрена уникальная кодовая позиция. Программа, поддерживающая Юникод, может обрабатывать данные на любом языке. Простейший способ работы с символьными данными в многоязычных базах данных заключается в том, чтобы всегда применять основанные на Юникоде типы данных nchar, nvarchar и nvarchar, а не соответствующие им типы char, varchar и text, использующие другие кодировки. Если страница на естественном языке может просто быть переведена и храниться практически независимо, то структурированные данные, как правило, сильно связаны друг с другом, например, представляют собой классическую базу данных (реляционную, постреляционную или др.). Для многоязыковых сайтов нужно работать с базами данных, которые достаточно удобны для работы с терминологическими словарями на многих языках (создание, изменение, представление в удобном виде). При этом понятие словаря мы расширяем на любые данные: фамилии, имена, географические данные, любые названия и др., перечень которых не зафиксирован, а может постоянно меняться по мере наполнения или изменения сайта. В силу использования большого количества языков, вводимые данные не всегда могут быть переведены сразу на все языки. В настоящее время для создания многоязыковых сайтов веб-мастеры часто используют системы CMS. (Content Management System, система управления содержанием сайта). С помощью CMS легко создать вебсайты, в том числе многоязыковые. Сердце любой CMS – хранилище информации, как правило, это некая база данных. Одни из популярных CMS-систем для создания многоязыковых сайтов – это Joomla, Mambo, OpenCMS, Drupal, "Битрикс", свзяка Microsoft SharePoint Portal Server (CMS) и Microsoft Content Management Server 2001 (SPPS) и т.д. Обозреваемые системы не включают поддержку языка Мьянмы. В результате проведенного исследования в CMS Joomla и Mambo была включена поддержка языка Мьянмы. Соответствующее дополнение было предложено на рассмотрение разработчикам CMS. Для работы многоязыковых сайтов, в базе данных нужно создать таблицу языков со своими индексами. Для каждого поля данных, требующего перевода, необходимо обеспечить возможность хранения информации на всех языках. Если на веб-странице должна появиться информация на некотором языке, мы делаем SQL-запрос с соответствующим параметром языка. Если отсутствует перевод на некоторый язык, выводятся данные языка по умолчанию, о чем появляется соответствующее предупреждение на странице В результате исследования был создан учебно-информационный сайт кафедры с поддержкой различных языков, включая язык Мьянмы Список литературы 1. Поддержка языков в MS SQL Server. http://www.interface.ru/home.asp?artId=6041