Русский язык в URL. Русский язык в URL Кириллические url seo

Самостоятельный

1. Купить кириллическое доменное имя.
2. Заказать хостинг.
3. Привязать это доменное имя к этому хостингу.
4. Создать сайт, содержащий страницу «контакты». Проще всего создать директорию «контакты» и в ней файл «index.html».
5. Залить созданный сайт на хостинг.

Только учти, что на хостинге директория сайта будет называться не «сайт. рф», а «xn--80aswg.xn--p1ai» (да и по сети адрес будет передаваться в таком виде): для обеспечения совместимости с любыми браузерами доменные имена кодируются вhttps://ru.wikipedia.org/wiki/Punycode. Поиграться с кодировкой:https://www.punycoder.com

Так что Сфера ниже ошибается: домен будет доступен в любой точке мира и поисковики его прекрасно проиндексируют. Андрей 2

Всего 3 .

с точки зрения SEO — замена URL входящей ссылки?

Андрей Ш. 4

При условии изменения контента и/или отсутствия 301 редиректа эффект может быть как положительным, так и отрицательным в зависимости от многих факторов, в первом ряду которых контент новой страницы, входящие внутренние ссылки сайта-донора и входящие внешние ссылки на страницу-донор.

Евгений Ю. 3

Если вы сменили URL входящей ссылки, оставив тот же анкор, что и был ранее, то скорее всего ссылочный вес, который передавался ранее не будет такой же, как с со страницы с новым URL. Т.е. новая входящая ссылка будет передавать минимальный вес на сайт-акцептор и лишь со временем наберет «вес».Благодаря факторам, например:возраст страницы, количество трафика на нее, количество ссылающихся на нее внутренних страниц сайта, анкоры внутренних ссылок,количество внешних ссылок и виды анкоров на данную страницу и т.д. Антон Величко -1

Всего 2 .

Какой смысл в кириллическом домене «.рф», если есть такие домены как «.ru» и «.su»?

Gent. Regger. 7

Я считаю, что это было первым шагом для создания нашего, уникального, высокодуховного интернета с Спортлото и комсомолками. Осталось теперь признать латиницу оскорбляющей чувства россиянина, отделить интернет от Запада, заодно и от Китая с его АлиЭкспресслм, и оставить только один сайт «в контакте», ну, разве ещё, одноклассники и сайт раша тудей с первым каналом.

Сергей Рассказов 7

Всего 4 .

Как получить галочку?

Гость 1

Чтобы мой инбокс не был забит вопросами о галочке,пишу сразу как её получить.
Не должно быть:
1.Мата
2.Игры/конкурсы (%,факты,лт)
3.Просьба о взаимных подписок/вопросов/лайков.(В ответах).
Если у тебя все с этим хорошо,то идем дальше
1.У вас должно быть больше 800 ответов.
2.Больше 1000 подписчиков,чем больше тем лучше.
3.Профиль не ваш,тк нет ваших фото и/или этот профиль сделан для других целей (размещение цитат из фильмов, жизненные советы, смешные мемы, и т. д.).Обязательно должно быть ваше фото (2 пожеланию свои)
4.Активный профиль, т.е каждый день заходишь на аск и отвечаешь на 5 и более вопросов в последнее несколько недель.
Если у тебя все это есть.
5.Переходим по ссылкеhttp://support.ask.fm/ics/support/ticketnewwizard.asp?style=classic
6.Заполняем несколько строчек о себе:Full Name -Ваше полное имя и фамилия, Email — адрес электронной почты; Inquiry Type — Account Verification;открывается еще несколько строчек Profile URL — ссылка на ваш аккаунт; Your number of followers — количество подписчиков; Subject — пишем «Верификация аккаунта» (без кавычек);* Explain in details(maximum 64,000 characters)
— пишем «Здравствуйте! Хочу получить галочку и готов пройти процедуру верификации.» (так же можно рассказать о себе где вы прославились чем занимаетесь,прикрепить ссылки на аккаунты,но это пожеланию).
7.Нажимаем финиш >>>
Далее:
8.Ждем письма от Аска, готово/отказ.Если ваш аск подходит под на галочку,то нас попросят сделать селфи с листком на бумаге,где от руки написано ваше имя пользователя и сегодняшняя дата и четко видно полностью вашу руку,что вы держите листок и ваше полное лицо (самое главное),что это вы.
Что писать на листке? Берете любой листок.Обязательно с @ ваше имя пользователя и дата,когда пришло вам это письмо.Отправляете на ответное письмо.С текстом «Вот доказательства» (без ковычек)
9.Ждем еще сутки письмо.Где нас поздравляют с получением галочки.И радуемся.
Запрос я отправлял 14 марта ночью в 0:41; и в этом день попросили сделать селфи в 16:00 ; И на следующий день получил галочку в 14:01
Надеюсь я подробно объяснил и вы сможете получить галочку,тут рассказал малейшие детали.Для её получения.
Скринhttps://pp.userapi.com/c836439/v836439430/2b55c/AnlMBXPbPWs.jpg
Если у вас возникли какие-то проблемы напишите мне помогуhttps://vk.com/maksimovde .Олег 300

Всего 1

В первую очередь, статья предназначена для тех, кто пользуется системой управления контентом CMS Joomla! 1.5, т.к. я буду объяснять все особенности использования кириллических урлов в контексте улучшения поисковой оптимизации и выдачи по поисковым запросам в основных ПС на основании технических решений, с которыми я сталкиваюсь при создании сайтов и в дальнейшей работе по их раскрутке. Тем не менее, принципы изложенные мною ниже будут актуальными для всех вебмастеров, которые не упускают из внимания в своей практической деятельности столь важную часть работы как в интернете и поисковая оптимизация сайта для улучшения выдачи в ПС Google, Yandex etc.

Весь изложенный ниже материал основан на моём практическом опыте и будет подкрепляться реальными примерами моих работ.

Итак...

Формирование кириллических урлов в joomla

CMS Joomla!, как и другие системы управления контентом имеют массу различных доработок и добавлений в виде компонентов, модулей и плагинов, которые могут отвечать за наличие и реализацию тех или иных функций. Поскольку здесь речь идёт в основном о СЕО, я, для формирования кириллических урлов использую такой компонент как sh404SEF. Задача этого компонента заключается в том, что он может формировать урлы в кириллице. Сам процесс формирования таких урлов подробно расписан на joomlaportal.ru

Есть ещё несколько подобных компонентов, однако свой выбор я остановил именно на нём, потому что с ним удобно работать и я не встречал никаких нерешаемых проблем при его использовании. Тем более, мне пришлось работать также в связке с компонентом интернет-магазина VirtueMart и могу сказать, что практически под каждый необходимый компонент есть возможность использования кириллических урлов, будь то компонент интернет-магазина или карта сайта.

Настройка кириллических урлов – что важно учитывать

При настройке кириллических урлов, важно, чтобы они не были очень длинными по нескольким причинам. Поисковая машина при формировании сниппета обрезает слишком длинные урлы, если Вы собираетесь устанавливать модули контекстной рекламы на своём сайте, учтите тот факт, что при очень длинном урле (более 30 символов), вы не сможете добавить на эту страницу модуль Google AdSense и отслеживать конверсию. Поисковая машина видит кириллический урл адрес в таком виде,


но тем не менее, отображает его в нормальном буквенном виде.

Отсюда, ниже будут описаны преимущества и недостатки таких урлов.

Преимущества кириллических урлов

1 Закладывая в такой урл ключевое слово (прямое вхождение или не прямое) вы получаете возможность вывести вашу статью выше в поисковой выдаче. Конечно, очень важно само качество материала (этого никто не отменял), однако таким образом у вас есть возможность добавить ещё один ключ – а почему бы и нет?

2 Очень важен тот факт, что при формировании сниппета поисковая система покажет кириллический урл и выделит жирным ключевые слова по поисковому запросу, как в примере видно.


Более того, статья из примера появилась сразу после её индексации в топ 10 по запросу «тренажерный зал кпи», и спустя краткий период времени стала первой в выдаче после появления первых комментариев.

3 Психологический фактор – очень важно, человек, глядя на такой красивый урл, при соответствии его тематике запроса, однозначно обратит на него внимание и кликнет, потому что сразу будет уверен в том, что он найдёт нужную ему информацию. Очень важно этот момент учесть для интернет-магазинов, особенно в том случае, когда есть существенная конкуренция по тому или иному виду товара. И с эстетической точки зрения на токой урл не сравнимо приятнее смотреть, чем на идентификаторы сессий и прочие различные значки, которые ни о чём не говорят среднестатистическому пользователю.


Недостатки использования кириллических урлов

1 Во втором пункте мы вспоминали об особенностях использования модуля контекстной рекламы от Google – AdSense и того, как видит поисковая машина кириллический урл, недостаток заключается в том что существует лимит на количество символов в урле, при добавлении их для отслеживания конверсии.

2 Поисковая машина (как и любой другой HTML-редактор видит одну кириллическую букву как совокупность таких символов, например слово поисковая-оптимизация в HTML-редакторе видится так – %D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F. По этой причине, если вы хотите оставить где-то на форуме сообщение со ссылкой, которая отображается в адресной строке браузера кириллицей, то оно будет иметь такой вид (смотри 1-й скриншот).

3 Я заметил такую особенность, что если вы к примеру меняете хостера или просто восстанавливаете сайт с бекапа, то после восстановления нужно опять включать функцию поддержки кириллических урлов в настройках соответствующего компонента. Естественно, в таких обстоятельствах ссылки могут полететь и тогда посетители увидят страницу 404 вместо искомого запроса, по крайней мере до переиндексации. Тем более ПС не любят таких вещей в принципе, да и посетители (потенциальные клиенты) вряд ли обрадуются увиденному…

4 Также, если у вас накопилось много материала (статей, товаров в интернет-магазине) то при использовании такого компонента будет неуклонно возрастать нагрузка на БД. Это чревато тем что хостер начнёт бодаться (особенно говнохостер) и тогда смотри предыдущий пункт. Во-вторых, неумолимо увеличится время загрузки сайта, а это будет вызывать раздражение у пользователей, в итоге они с меньшим азартом захотят к вам заходить ещё.

В качестве итога данной статьи хочу поведать ситуацию с моими проектами на данный момент. Лично моё решение, после взвешивания всех ЗА и ПРОТИВ состоит в том, что сайты с кириллическими урлами (как правило, это сделанные и раскрученные мною интернет-магазины) я решил оставить в прежнем виде, в виду очевидности вышеописанных «плюсов». Тем не менее, новые сайты я делаю без использования кириллических урлов, использую родной mod_rewrite, просто в качестве псевдонима страницы вписываю грамотную транслитерацию латиницей. Опять таки, с точки зрения собственной практики грамотный транслит урла или грамотное английское написание хватается ПС (по крайней мере гуглом) как ключевое слово, что не может не радовать!

Пару замечаний о том, как настроить компонент sh404SEF

Если вы приняли решение об установке этого компонента, важно знать его преимущества. Поскольку на моём сайте мы говорим о SEO, то в данном контексте и будем рассматривать этот вопрос. Компонент sh404SEF замечателен тем что:

  • создаёт большое количество технических url, которые ссылаются на главную
  • тем самым формирует семантическое ядро сайта из заголовков страниц, что определяет тематику сайта
  • в последствии ПС охарактеризовав тематику сайта, считают тематические поисковые запросы, по которым вы создаёте новые страницы релевантными вашему сайту
  • это поднимает ваш сайт в поисковой выдаче по тематическим запросам, поскольку сайт является релевантным и авторитетным в глазах ПС
  • в свою очередь, это значительно экономит ссылочный бюджет и позволяет выходить в ТОПы поисковых систем путём создания контента

Итак, для настройки sh404SEF, позаботьтесь о том, чтобы в строке url адреса значился раздел, либо категория товара. Если раздел, категория и сам товар (их названия) не занимают много места в браузере, можете сделать всех их отображаемыми. Однако это касается только не кириллических url, по выше указанным причинам.

Отсюда можно сделать вывод, что если на сайте установлен компонент sh404SEF и он был ранее настроен на формирование кириллических url, то удалять компонент не стоит. Желательно перенастроить его таким образом, чтобы урлы формировались латиницей. Переиндексация сайта ПС зависит от частоты посещения его поисковыми роботами. Если сайт обновляется чаще, то и роботы заходят на него чаще. В тот период времени, пока будет происходить переиндексация, позаботьтесь о внешнем виде 404 страницы, обеспечьте посетителей быстрым доступом к главной странице сайта, нужным категориям и разделам меню, товарам и т.д.

Данная статья не даёт однозначного ответа на вопрос – использовать кириллические урлы или нет? Однако, я надеюсь, что вышеописанные преимущества и недостатки их использования помогут вам принять правильное решение в данном вопросе.

Итак, сегодня хотела написать немного об использовании кириллицы в ЧПУ. На мой взгляд русскоязычные ссылки были бы очень хороши, если бы не... Ходят слухи что они не доступны браузерам, поисковикам и другим системам, а в адресной строке браузера отображается что-то совершенно ужасное. Вот о всех плюсах, минусах, слухах и реализации на сайтах я бы и хотела рассказать.

Итак, пример того как можно использовать русский язык в URL можно увидеть прямо в адресной строке вашего браузера. Там должно быть написано следующее:

Http://сайт/news/2009/09/08/Русский_язык_в_URL.html

Заглянем что говорит по этому поводу официальная спецификация HTML 4.01 :

B.2.1 Non-ASCII characters in URI attribute values Although URIs do not contain non-ASCII values authors sometimes specify them in attribute values expecting URIs (i.e., defined with %URI; in the DTD ). For instance, the following href value is illegal : href ="http://foo.org/Håkon" >... We recommend that user agents adopt the following convention for handling non-ASCII characters in such cases: - Represent each character in UTF-8 (see ) as one or more bytes. - Escape these bytes with the URI escaping mechanism (i.e., by converting each byte to %HH, where HH is the hexadecimal notation of the byte value). This procedure results in a syntactically legal URI (as defined in , section 2.2 or , section 2) that is independent of the character encoding to which the HTML document carrying the URI may have been transcoded.

Что примерно означает следующее:

Хотя URL (есть разница между URL и URI, но тут она не важна), дожен содержать только латинские (ASCII) символы, бывает что авторы вставляют их в значение ссылок. Например в следующем примере значение атрибута href неправомерно: href ="http://vasya.ru/Вася_Пупкин" >... Рекомендуем браузерам сделать следующее: - Заменить каждый символ кодировкой urf-8 - Кодировать эти символы побайтно экранированием url, т.е. шеснадцатиричными значениями (каждый байт будет %HH). В итоге ваш URL будет синтаксически верен.

Отметим особо, что ссылка у нас получилась в (экранированной) кодировке UTF-8 , и её длинна соответственно возрасла. Вебмастера чьи сайты используют в качестве основной кодировки win-1251 (как например этот сайт) должны обрабатывать имя ссылок особо, например можно перевести её в нужную вам кодировку.

В IE8 к сожалению чистый русский язык будет только если там адрес вбивать вручную. Но, таков уж IE =).

В яндексе русский язык в url прекрасно понимают, и даже используют для поиска.


Гугл словам в ссылках значения не даёт, кроме того, слова соединённые через подчёркивание считаются с его точки зрения одним, для разделителей лучше использовать минус (дефис). Этот факт горячо обсуждался на xpoint.ru. Однако правильно сформированные русскоязычные ссылки он тоже отображает.

Теперь время для небольшого интервью, я опросила коллег на эту тему:

если например ссылка в utf-8?
Jelu (программист): ну кракозябра сверху) вообще считаю что это плохо давно хотела спросить кое что про оптимизацию. Как влияет на оптимизацию русский язык в url? @ (оптимизатор): не знаю что даже и ответить, думаю что зависит от того что ты хочешь получить в результате, т.е. для чего делается эта ссылка. но думаю что большого траста она не придаст, а смысл передается анкором, думаю что русский язык тут не причем. @: я не знаю как конкретно поисковик относится к ссылкам на русском языке. ну если говорить в общем о том как она влияет, я склонен думать что никак. На релевантность влияет текст на странице, но никак не ссылающийся на нее урл. привет. твоё мнение о использовании русского языка в url? ov3r (программист): привет. отрицательно, хотя бы из-за различных кодировок твоё мнение о использовании русского языка в url? Джехи (программист): только что обнаружил, что бл***ая сапа обрезает урлы длиннее 255 символов, что меня огорчило. поскольку у меня урленкод на > 255 сиволов от русского языка. с**и пи***ы. в остальном длинные русские урлы красивы, приятны, удобны, всеми понимаются и повышают релеванстность. твоё мнение о использовании русского языка в url? Dark Lord (программист): шняга!

Прокоментируй статью, хотя бы пару слов!

Комментарии:

    Итак, ярослав, для того чтобы сделать url на русском, предполагается что у вас уже есть реализация url на английском, если вы сами писали себе сайт.
    В базе данных, url хранится в кодировке utf-8[u], не важно в какой кодировке сам сайт. Если сайт в кодировке 1251, то при сохранении конвертируете кодировку в Utf-8.
    Когда вы показываете ссылку на странице блога - нужно также ту часть которая содержит русский язык обработать php-функцией urlencode.
    Соответственно потом, чтобы найти новость, вы парсите url, и ищете по той части его которая содержит русский язык. sql запрос выглядит примерно так:
    SELECT ... where ... CONVERT(`caption_latin` USING utf8) = CONVERT("".$pname."" USING utf8) ..., где caption_latin имя столбца содержащего ваш url в кодировке utf8.

    я только начинающий веб-мастер, поэтому мне кое что непонятно. Если честно мне бы подошла инструкция "для чайников" по этому вопросу))
    как сохранить кодировку в Utf-8?
    как обработать русский язык php-функцией?
    что такое парсить url?
    Извеняюсь если какие то вопросы покажутся смешными, но я только учусь)
    Ещё хорошо бы было показать пример кода до и после (т.е. какие изменения в код нужно внести что бы получить русские буквы в URL), думаю новичкам таким как я так будет легче разобраться.
    Заранее спасибо.

    Прошло 2 года спустя публикации этой статьи. Народ вовсю пользует возможность задавать кириллические ссылки; Яша этому рад; саперы тоже рады; не слишком давно регистраторам разрешили раздавать IDN-домены; даже зону на кириллице ввели (хотя и выдают, как я понял, алиасы для каждого домена в уникоде)...
    Все это не может не радовать.
    А вот делать правильный редирект (имею ввиду 301) научились не все(?). Потому как header`ы не принимают кириллические ссылки. Чего только не делют похапэшники со строками перед вставкой в header("Location: ".СЮДА);

    У автора (меня т.е.) соображения конечно есть. Подготовка ссылки для 301 редиректа вообще никак не отличается от подготовки ссылки для html. Я уже писала о том мой блог поддерживает автоисправление ссылок.
    Вот ради интереса можете стереть в адресной строке год, или месяц, или вообще дату целиком. Или можете просто нажать . Вас снова поредиректит на эту статью.
    В случае если у вас движок хранит данные в win-1251 вам следует выполнить 2 действия:

    • Перевести поле отвечающее за ЧПУ ссылки в кодировку UTF8
    • Выводить это поле в ссылке, используя urlencode() в PHP. (не всю ссылку а только данную часть url).
    Если у вас движок всё хранит в utf - ну вы поняли, да? =)
  • Долго я возился с этим...

    И раньше все делал как и было сказано в статье: переводил в utf-8, потом экранировал. По-разному экспериментировал...
    А оказалось, проблема в том, что urlencode() просто экранировал слеш.

    Спасибо, из-за статьи снова взялся разбираться с функцией. Разобрался) Вот ф-ция на php:

    function redirectto($redirect_link)
    {
    $redirect_link=iconv("windows-1251", "utf-8", $redirect_link);
    $redirect_link=urlencode($redirect_link);
    $redirect_link=str_replace("%2F", "/", $redirect_link);
    header("Location: ".$redirect_link."");
    }

    День добрый. У меня такой вопрос... Обо всем по порядку. Хочу сделать, чтобы urn имел возможность быть на русском (да, вот так я выразился)).
    Собственно, что делать?)
    Пользователь пытается зайти на адрес host.domen/2011/статья-1/
    Как мне перехватить это? Ловить все запросы отправляемые на 404? Но тогда будет возвращаться код 404 вместо 200. Или сделать "мягкую ошибку 404" с кодом возврата 200? (кстати как это сделать не понимаю).
    Или настраивать.htaccess для редиректа 301? Но тогда будет делаться редирект (парадокс, да?))... А в силу того, что имена всех файлов и папок на хосте только латиницей url будет меняться на host.domen/2011/statja-1/ (это верный адрес страницы). Но я такой не хочу) Хочу чтобы в строке адреса так и отображался host.domen/2011/статья-1/ Используя ErrorDocument 404 адрес в адресной строке остается как раз таким. Что позволяет немного обмануть природу и использовать русский на сервере, где это делать нельзя) Вобщем, есть идеи?

    Буду копать пока mod_rewrite

    Таки мощный инструмент mod_rewrite. Но малость неудобно с ним работать. Можно было сделать проще. Хотя, это, судя по всему, вызвано его внутренней сложностью. Или просто влияние "старой школы". Все-таки когда он был разработан то. Ну да не суть, главное сделал я все) Но с mod_rewrite вариант оказался не таким гибким. Лучше такие всю обработку оставить на php собирая неверный запросы в 404.

    В нашем движке используется следующее правило для mod_rewrite:

    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteRule ^(.*)$ index.php?rewrite_url_query_toget=$1

    Можно использовать просто RewriteRule ^(.*)$ index.php , но в таком случае адрес страницы нужно брать из переменной $_SERVER["REQUEST_URI"] что будет не совсем верно если движок установлен в папку, а не в корень.

    Собирать страницы через обработку 404 запросов, не совсем правильно. Во-первых может быть что по умолчанию вернётся 404 статус. Во-вторых апач может попытаться отдать страницу через протокол HTTP 1.0 вместо HTTP 1.1, потому что страницу 404 нужно возвращать именно через HTTP 1.0, т.е. не используя метод chunked для выдачи, что тоже приведёт к ошибке. И т.п.
    А mod_rewrite действительно сложен именно в силу своей универсальности. При должном изучении вы сможете с помощью его делать очень многое.

    Ну первые две проблемы решаются с помощью посылки заголовка HTTP/1.1 200 Ok. Но в том, что это не совсем правильно, я, конечно, согласен) Это все-таки обходной путь. Я бы его не трогал, если бы все ровненько "склеилось" с mod-rewrite. У меня склеилось, но как-то кривовато. Ну за час этот механизм не освоить точно. Попробую поэкспериментировать с Вашими командами в mod_rewrite.

    Всем привет! Увидел просьбу прокомментить хоть на пару слов, и вот у меня сайты на WordPress, там это дело автоматизировано во всех записях и страницах использую название на русском языке, отображается во всех основных браузерах нормально. И реально для пользователя это удобно.

    Прикольная у вас страница ошибки)))))

    Вы блин не залогинились и не поставили галочку. Ваш комментарий не сохранён. На случай если вы таки не бот, то вот он, скопируйте и попробуйте снова:

    Здравствуйте!
    В ie ваша ссылка отражается закодированной. Я так понимаю для ie на русском ссылки не зделать? Если фильтровать пользователей по браузерам и генерировать ссылки на русском для всех, кроме ie и на транслите для ie, то поисковики будут воспринимать данную страницу как две. Получается, что надо все делать в транслите или есть все-таки решения?

    В адресную строку вводим например: mysite/?привет
    код php
    $chpu = $_SERVER["REQUEST_URI"];
    echo $chpu;
    код php
    выводит что-то типо того: %D0%BF%D1%80%D0%B8%D0%B2%D0%B5%D1%82
    вставляете в базу данных этот код и наслаждаетесь:)

    Влад, в ие - страница будет отображаться закодированной только до 9й версии. Это менее 5% от всех браузеров.

    Здравствуйте, очень интересная статья, многого не знал.
    Однако я не совсем понял, как всё-таки решить проблему отображения русских символов в URL.
    Я посмотрел "сырой исходник" (в Opera это Crl+U), и увидел, что у вас ссылка, на самом деле - UTF-8 после экранирования (escaped). Но при наведении в статусбаре браузера видны кракозябры, а после перехода - получается русский текст, как и надо. Уж как только не пробовал - и с экранированием, и без, и во всех кодировках (без конвертирования в UTF-8 и с оным). У меня при любом раскладе после перехода по ссылке получаются экранированные символы =(

    UPD: разобрался. Оказывается, такой фокус не проходит с параметром. Только с частью пути, но не query_string. Мне кажется, стоит дополнить этот нюанс - а то мало ли. Мне-то и нужен был как раз путь, но для теста я сдуру выбрал параметр. Интересно, к слову, чем вызвана эта особенность, и кто всё-таки преобразует неэкранированные символы в экранированный вид - браузер или же веб-сервер. Ещё было бы интересно понять, что же уходит на сервер, когда в адресной строке видны русские буквы. Украшательство ли это со стороны браузера, или они правда уходят без экранирования?

    И да, с параметрами тоже не всё так просто - ставил я однажды nginx без Apache, так там, кажется, параметры так и оставались на русском без замены... И вроде даже пришлось менять PHP код, чтобы оно заработало (хотя БД в той же кодировке была, что на девелоперском сервере). rewrite срабатывал, а данные приходили "плохие", как-то так.

    На т.н. location.hash - т.е. всё что существует после решётки существует своя спецификация. Поэтому да, браузер её увы экранирует.


В первую очередь, статья предназначена для тех, кто пользуется системой управления контентом CMS Joomla! 1.5, т.к. я буду объяснять все особенности использования кириллических урлов в контексте улучшения поисковой оптимизации и выдачи по поисковым запросам в основных ПС на основании технических решений, с которыми я сталкиваюсь при создании сайтов и в дальнейшей работе по их раскрутке. Тем не менее, принципы изложенные мною ниже будут актуальными для всех вебмастеров, которые не упускают из внимания в своей практической деятельности столь важную часть работы как в интернете и поисковая оптимизация сайта для улучшения выдачи в ПС Google, Yandex etc.

Весь изложенный ниже материал основан на моём практическом опыте и будет подкрепляться реальными примерами моих работ.

Итак...

Формирование кириллических урлов в joomla

CMS Joomla!, как и другие системы управления контентом имеют массу различных доработок и добавлений в виде компонентов, модулей и плагинов, которые могут отвечать за наличие и реализацию тех или иных функций. Поскольку здесь речь идёт в основном о СЕО, я, для формирования кириллических урлов использую такой компонент как sh404SEF. Задача этого компонента заключается в том, что он может формировать урлы в кириллице. Сам процесс формирования таких урлов подробно расписан на joomlaportal.ru

Есть ещё несколько подобных компонентов, однако свой выбор я остановил именно на нём, потому что с ним удобно работать и я не встречал никаких нерешаемых проблем при его использовании. Тем более, мне пришлось работать также в связке с компонентом интернет-магазина VirtueMart и могу сказать, что практически под каждый необходимый компонент есть возможность использования кириллических урлов, будь то компонент интернет-магазина или карта сайта.

Настройка кириллических урлов – что важно учитывать

При настройке кириллических урлов, важно, чтобы они не были очень длинными по нескольким причинам. Поисковая машина при формировании сниппета обрезает слишком длинные урлы, если Вы собираетесь устанавливать модули контекстной рекламы на своём сайте, учтите тот факт, что при очень длинном урле (более 30 символов), вы не сможете добавить на эту страницу модуль Google AdSense и отслеживать конверсию. Поисковая машина видит кириллический урл адрес в таком виде,

но тем не менее, отображает его в нормальном буквенном виде.

Отсюда, ниже будут описаны преимущества и недостатки таких урлов.

Преимущества кириллических урлов

1 Закладывая в такой урл ключевое слово (прямое вхождение или не прямое) вы получаете возможность вывести вашу статью выше в поисковой выдаче. Конечно, очень важно само качество материала (этого никто не отменял), однако таким образом у вас есть возможность добавить ещё один ключ – а почему бы и нет?

2 Очень важен тот факт, что при формировании сниппета поисковая система покажет кириллический урл и выделит жирным ключевые слова по поисковому запросу, как в примере видно.


Более того, статья из примера появилась сразу после её индексации в топ 10 по запросу «тренажерный зал кпи», и спустя краткий период времени стала первой в выдаче после появления первых комментариев.

3 Психологический фактор – очень важно, человек, глядя на такой красивый урл, при соответствии его тематике запроса, однозначно обратит на него внимание и кликнет, потому что сразу будет уверен в том, что он найдёт нужную ему информацию. Очень важно этот момент учесть для интернет-магазинов, особенно в том случае, когда есть существенная конкуренция по тому или иному виду товара. И с эстетической точки зрения на токой урл не сравнимо приятнее смотреть, чем на идентификаторы сессий и прочие различные значки, которые ни о чём не говорят среднестатистическому пользователю.


Недостатки использования кириллических урлов

1 Во втором пункте мы вспоминали об особенностях использования модуля контекстной рекламы от Google – AdSense и того, как видит поисковая машина кириллический урл, недостаток заключается в том что существует лимит на количество символов в урле, при добавлении их для отслеживания конверсии.

2 Поисковая машина (как и любой другой HTML-редактор видит одну кириллическую букву как совокупность таких символов, например слово поисковая-оптимизация в HTML-редакторе видится так – %D0%9F%D0%BE%D0%B8%D1%81%D0%BA%D0%BE%D0%B2%D0%B0%D1%8F_%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F. По этой причине, если вы хотите оставить где-то на форуме сообщение со ссылкой, которая отображается в адресной строке браузера кириллицей, то оно будет иметь такой вид (смотри 1-й скриншот).

3 Я заметил такую особенность, что если вы к примеру меняете хостера или просто восстанавливаете сайт с бекапа, то после восстановления нужно опять включать функцию поддержки кириллических урлов в настройках соответствующего компонента. Естественно, в таких обстоятельствах ссылки могут полететь и тогда посетители увидят страницу 404 вместо искомого запроса, по крайней мере до переиндексации. Тем более ПС не любят таких вещей в принципе, да и посетители (потенциальные клиенты) вряд ли обрадуются увиденному…

4 Также, если у вас накопилось много материала (статей, товаров в интернет-магазине) то при использовании такого компонента будет неуклонно возрастать нагрузка на БД. Это чревато тем что хостер начнёт бодаться (особенно говнохостер) и тогда смотри предыдущий пункт. Во-вторых, неумолимо увеличится время загрузки сайта, а это будет вызывать раздражение у пользователей, в итоге они с меньшим азартом захотят к вам заходить ещё.

В качестве итога данной статьи хочу поведать ситуацию с моими проектами на данный момент. Лично моё решение, после взвешивания всех ЗА и ПРОТИВ состоит в том, что сайты с кириллическими урлами (как правило, это сделанные и раскрученные мною интернет-магазины) я решил оставить в прежнем виде, в виду очевидности вышеописанных «плюсов». Тем не менее, новые сайты я делаю без использования кириллических урлов, использую родной mod_rewrite, просто в качестве псевдонима страницы вписываю грамотную транслитерацию латиницей. Опять таки, с точки зрения собственной практики грамотный транслит урла или грамотное английское написание хватается ПС (по крайней мере гуглом) как ключевое слово, что не может не радовать!

Пару замечаний о том, как настроить компонент sh404SEF

Если вы приняли решение об установке этого компонента, важно знать его преимущества. Поскольку на моём сайте мы говорим о SEO, то в данном контексте и будем рассматривать этот вопрос. Компонент sh404SEF замечателен тем что:

  • создаёт большое количество технических url, которые ссылаются на главную
  • тем самым формирует семантическое ядро сайта из заголовков страниц, что определяет тематику сайта
  • в последствии ПС охарактеризовав тематику сайта, считают тематические поисковые запросы, по которым вы создаёте новые страницы релевантными вашему сайту
  • это поднимает ваш сайт в поисковой выдаче по тематическим запросам, поскольку сайт является релевантным и авторитетным в глазах ПС
  • в свою очередь, это значительно экономит ссылочный бюджет и позволяет выходить в ТОПы поисковых систем путём создания контента

Итак, для настройки sh404SEF, позаботьтесь о том, чтобы в строке url адреса значился раздел, либо категория товара. Если раздел, категория и сам товар (их названия) не занимают много места в браузере, можете сделать всех их отображаемыми. Однако это касается только не кириллических url, по выше указанным причинам.

Отсюда можно сделать вывод, что если на сайте установлен компонент sh404SEF и он был ранее настроен на формирование кириллических url, то удалять компонент не стоит. Желательно перенастроить его таким образом, чтобы урлы формировались латиницей. Переиндексация сайта ПС зависит от частоты посещения его поисковыми роботами. Если сайт обновляется чаще, то и роботы заходят на него чаще. В тот период времени, пока будет происходить переиндексация, позаботьтесь о внешнем виде 404 страницы, обеспечьте посетителей быстрым доступом к главной странице сайта, нужным категориям и разделам меню, товарам и т.д.

Данная статья не даёт однозначного ответа на вопрос – использовать кириллические урлы или нет? Однако, я надеюсь, что вышеописанные преимущества и недостатки их использования помогут вам принять правильное решение в данном вопросе.

Дата публикации: 29.08.2012

О том, что для эффективного продвижения сайтов нужно использовать ЧПУ, сегодня знает любой SEO-школьник, ведь об этом говорят все тру блоггеры, пишут в книжках и даже рассказывают на SEO-конференциях… Однако стоит капнуть чуть глубже и спросить «откуда уверенность, что поисковые системы учитывают ключевые слова из URL при ранжировании?», в ответ получаешь что-то вроде «если в выдаче URL выделяется жирным, значит поисковик понимает выделенные слова, а следовательно учитывает их при ранжировании»… Чувствуете слабое звено в этом тезисе?

«Понимает» не равно «учитывает»! За примером далеко ходить не надо – meta name keywords. Понимают ли поисковые системы значение этого тега, а так же ключевые слова, которые в нем перечисляются? Бесспорно. Имеет ли влияние этот тег? К сожалению нет. Возможно так же обстоят дела с ключевыми словами в ЧПУ?

Эксперимент

Что бы не гадать на кофейной гуще, я провел небольшой эксперимент. Цель эксперимента – проверить, будет ли сайт искаться по ключевым словам, которые используется в URL, но которых нет на странице.

  • Vlad написал:
    10 Ноя 2014 в 10:50

    у гугла есть два варианта поиска все результаты и точное соответствие, при точном соответствии он ранжирует страницы по релевантности и учитывает кириллицу в урл, а если в настройках поиска стоят все значения (что включено по умолчанию) то какой запрос не вводи ты ну увидишь кириллических урл, это связано либо с тем что все поголовно используют транслит или с тем что при настройках «все значения» гугл переводит транслит в кириллицу и сравнивает с запросом, вот только это теория как ее проверить я не знаю.

  • chijkov написал:
    02 Янв 2015 в 17:25

    Здравствуйте.Интересное исследованные, но вот вопрос, раз вы теперь знаете что ценнее для ПС кириллические перевод или транслит, то почему вы сами на своих сайтах, в том числе и на это не используете такой прием?

  • Сергиус написал:
    09 Ноя 2015 в 22:14

    Классный эксперимент. Когда у вас стоит кирилица, на что оставляется ссылка? на кучу непонятных символов или или на сайт.ru/статьи??
    Если ссылки идут на кучу символов то вы запаритесь с раскруткой сайта.