Почему яндекс не показывает сохраненную копию. Что такое сохраненная копия в яндексе


Всем привет дорогие друзья! Недавно, неделю назад, я столкнулся с такой проблемой, на одном сайте, что у меня выпали все страницы из индекса поисковый системы Яндекс. Если честно, я подумал что был наложен какой-то , хотя до этого момента, все страницы попали в индекс очень быстро и сидели там 1,5 месяца отлично.

За эти полтора месяца я только и писал статьи, а больше ничего противозаконного не делал. Поэтому мне было обидно, что так со мной поступил Яндекс. Естественно, что я не хотел это все дело оставлять и как можно быстрее вернуть страницы в индекс. Я проверил свой сайт на сервисе и выявил, что мне там пишет: Отсутствует сохраненная копия в Яндексе!

Если честно, то я не понял ничего, почему копия сайта там отсутствует. Я начал искать проблему и наткнулся на один сайт, где у него была похожая проблема, то есть, тоже отсутствовала сохраненная копия сайта в поисковой системе Яндекс. Но у него страницы из-за этого не выпали, а просто просели позиции.

Я все равно надеялся, что при помощи его сайта решу проблему. Оказывается, у него отсутствовала копия в Яндексе из-за того, что на его страницах сайта присутствовал тег noarchive , который был автоматически включен при использовании плагина WordPress – Robots Meta. В настройках этого плагина была включена опция запрета делать копию в поисковых системах, то есть, прописывался тег для страниц – noarchive .

На моем сайте не был установлен данный плагин, но я все равно проверил все страницы на наличие данного тега, причем не только страницы, но и файл robots.txt. В итоге я так ничего и не нашел. То есть, данный вариант для меня отпадал, на моем ресурсе не присутствовало такого тега.

Мне ничего не оставалось, как обратиться в службу технической поддержки поисковой системы Яндекс и выяснить причину (см. как ):

В вебмастере Яндекса, для сайта ********** отображается, что в индексе 57 страниц, а на самом деле 1 страница. На сервисе xtool проверяю его и мне выдает сообщение: Отсутствует сохранённая копия в Яндексе!

Я проверил свой сайт на наличие тега noarchive и нигде его не было. Скажите, почему сайт 49 дней был полностью в индексе, а сейчас только одна главная страница сайта?

Через 1 сутки мне пришел ответ от Яндекса:

В настоящее время невозможно­ выяснить, что спровоциро­вало исключение­ страниц Вашего сайта, так как подобная информация­ не хранится. В ближайшее время Ваш сайт должен начать индексиров­аться и затем сможет появиться в поиске. Скорее всего, это произойдет­ в течение двух недель. Пожалуйста­, дождитесь окончания указанного­ срока.

То есть, у меня еще была надежда на то, что мой сайт будет проиндексирован нормально, что это какое-то недоразумение и страницы выпали из-за какой-то ошибки, ведь надежда умирает последней.

В итоге, весь следующий день я наблюдал, как мой сайт «штормило», то есть, то в индексе была 1 страница, то 8, то 57 и так каждый день, цифры менялись. Но сегодня произошел апдейт и сейчас страницы все снова в индексе, чему я очень рад. Так что, если у Вас возникла такая проблема, то причины могут быть следующими:

  • На сайте присутсвует тег noarchive
  • Тег noarchive прописан в robots.txt
  • Временные проблемы с сервисами или поисковыми системами

В общем, если у Вас возникла такая ситуация, то не стоит сразу паниковать, посмотрите все возможные причины, сделайте те моменты, которые проделал я, а затем уже делайте выводы. Удачи Вам дорогие друзья и до новых встреч!

Существует настоящая, реальная машина времени, в которой можно ненадолго вернуться в прошлое и увидеть, например, как выглядел тот или иной сайт несколько лет назад. Думаете, никому не нужны копии сайтов многолетней давности? Ошибаетесь! Для очень многих людей сервис по архивированию информации весьма полезен.

Во-первых, это просто интересно! Из чистого любопытства и от избытка свободного времени можно посмотреть, как выглядел любимый, популярный ресурс на заре его рождения.

Во-вторых, далеко не все владельцы сайтов ведут свои архивы. Знать место, где можно найти информацию, которая была на сайте в какой-то момент, а потом пропала, не просто полезно, а очень важно.

В-третьих, само по себе сравнение является важнейшим методом анализа, который позволяет оценить ход и результаты нашей деятельности. Кстати, при проведении анализа веб-ресурса очень эффективно использовать ряд методов сравнения.

Поэтому наличие уникальнейшего архива веб-страниц интернета позволяет нам получить доступ к огромному количеству аудио-, видео- и текстовых материалов. По утверждению разработчиков, «интернет-архив» хранит больше материалов, чем любая библиотека мира. Мы попали в правильное место!

Что нужно, чтобы найти копии сайтов интернета

Для того, чтобы отправиться в прошлое, нужно перейти на сайт archive.org и воспользоваться поисковой строкой.

Простой поиск в архиве сохраненных сайтов выдает нам ссылки на все сохраненные копии запрашиваемой страницы.

Из этого видно, что сайт сайт был создан в 2012 году (Кстати, важно отметить, с помощью практически идеального хостинга Спринтхост — рекомендую!). Переключаясь на нужный нам год, можно увидеть даты, выделенные кружочками, это и есть даты сохранения копии сайта. Например, в 2015 году, пока можно будет увидеть только одну копию от 7 февраля.

Конечно, это потрясающий ресурс! Ведь здесь индексируются и архивируются все сайты интернета! Это не только скриншоты… Имея в руках такой инструмент, можно восстановить массу потерянной со временем информации.

Надо заметить, что, безусловно все восстановить однозначно не получится, так как если на страницах сайта используются элементы Java Script, или скрипты или графика взяты со стороннего сервера, то на восстановление такой информации рассчитывать не придется. Поэтому к сохранению данных своего сайта нужно относиться с особенным вниманием, несмотря ни на что.

Пользуясь случаем, я сделала скриншоты и восстановила в памяти, как выглядел мой сайт, начиная с 2012 года. Любопытно посмотреть))

Сайт буквально недавно «родился»)) Январь 2012.. .

Проходит время, и хочется что-то изменить… Конец 2012-го.

Наверное, пора уже что-то менять. 2013-й. Это тема, которая и сегодня установлена на моем сайте.

К смене темы отношусь с осторожностью, так как помню последний «переезд», после которого несколько месяцев восстанавливала посещаемость сайта. Как-то не очень удачно получилось.

Надеюсь, что и моим читателям эта замечательная интернет-библиотека — «машина времени» сможет помочь перемещаться во времени, когда они этого захотят. Посмотрите, как выглядели раньше некоторые сайты, еще во времена своего зарождения. Какими раньше были google или яндекс, можно увидеть только на archive.org, аналогов у этого ресурса нет. Приятного путешествия, друзья!

Здравствуйте! Сегодня пост о наболевшем для большинства из начинающих сайтостроителей. Мне приходилось очень часто в комментариях отвечать на один и тот же вопрос — как удалить страницы из поиска , которые были проиндексированы ранее, но в силу сложившихся обстоятельств были удалены и больше не существуют, но по-прежнему находятся в индексе поисковых систем. Или же в поиске находятся страницы запрещенные к индексации.

В комментариях особо не развернешься, поэтому после очередного вопроса решил уделить данной теме отдельное внимание. Для начала давайте разберемся, каким образом такие страницы могли оказаться в поиске. Примеры буду приводить исходя из собственного опыта, так что если я что-то забуду, то прошу дополнить.

Почему закрытые и удаленные страницы есть в поиске

Причин может быть несколько и некоторые из них я постараюсь выделить в виде небольшого списка с пояснениями. Перед началом дам пояснение что подразумеваю под «лишними» (закрытыми) страницами: служебные или иные страницы, запрещенные к индексации правилами или мета-тегом.

Несуществующие страницы находятся в поиске по следующим причинам:

  • Самое банальное — страница удалена и больше не существует.
  • Ручное редактирование адреса web-страницы, вследствие чего документ который уже находится в поиске становится не доступным для просмотра. Особое внимание этому моменту нужно уделить новичкам, которые в силу своих небольших знаний пренебрежительно относятся к функционированию ресурса.
  • Продолжая мысль о структуре напомню, что по-умолчанию после установки WordPress на хостинг она не удовлетворяет требованиям внутренней оптимизации и состоит из буквенно-цифровых идентификаторов. Приходится на ЧПУ, при этом появляется масса нерабочих адресов, которые еще долго будут оставаться в индексе поисковых систем. Поэтому применяйте основное правило: надумали менять структуру — используйте 301 редирект со старых адресов на новые. Идеальный вариант — выполнить все настройки сайта ДО его открытия, в этом может пригодиться локальный сервер.
  • Не правильно настроена работа сервера. Несуществующая страница должна отдавать код ошибки 404 или с кодом 3хх.

Лишние страницы появляются в индексе при следующих условиях:

  • Страницы, как Вам кажется, закрыты, но на самом деле они открыты для поисковых роботов и находятся в поиске без ограничений (или не правильно написан robots.txt). Для проверки прав доступа ПС к страницам воспользуйтесь соответствующими инструментами для .
  • Они были проиндексированы до того как были закрыты доступными способа.
  • На данные страницы ссылаются другие сайты или внутренние страницы в пределах одного домена.

Итак, с причинами разобрались. Стоит отметить, что после устранения причины несуществующие или лишние страницы еще долгое время могут оставаться в поисковой базе — все зависит от или частоты посещения сайта роботом.

Как удалить страницу из поисковой системы Яндекс

Для удаления URL из Яндекс достаточно пройти по ссылке и в текстовое поле формы вставить адрес страницы, которую нужно удалить из поисковой выдачи.

Главное условие успешного запроса на удаление:

  • страница должна быть закрыта от индексации правилами robots или мета-тегом noindex на данной странице — в том случае если страница существует, но не должна участвовать в выдаче;
  • при попытке обращения к странице сервер должен возвращать ошибку 404 — если страница удалена и более не существует.

При следующем обходе сайта роботом запросы на удаление будут выполнены, а страницы исчезнут из результатов поиска.

Как удалить страницу из поисковой системы Google

Для удаления страниц из поступаем аналогичным образом. Открываем инструменты для веб-мастеров и находим в раскрывающемся списке Оптимизация пункт Удалить URL-адреса и переходим по ссылке.

Перед нами специальная форма с помощью которой создаем новый запрос на удаление:

Нажимаем продолжить и следуя дальнейшим указаниям выбираем причину удаления. По-моему мнению слово «причина» не совсем подходит для этого, но это не суть…

Из представленных вариантов нам доступно:

  • удаление страницы страницы из результатов поиска Google и из кэша поисковой системы;
  • удаление только страницы из кэша;
  • удаление каталога со всеми входящими в него адресами.

Очень удобная функция удаления целого каталога, когда приходится удалять по несколько страниц, например из одной рубрики. Следить за статусом запроса на удаление можно на этой же странице инструментов с возможностью отмены. Для успешного удаления страниц из Google необходимы те же условия, что и для . Запрос обычно выполняется в кратчайшие сроки и страница тут же исчезает из результатов поиска.

Всякий раз, когда мы разглядываем результаты любого запроса, на странице выводятся ссылки "Сохраненная копия" и "Еще с сайта". Разберем сначала первую из них.

Индексация , всех сайтов, информацию на которых ищет Яндекс, сопровождается созданием копии этих сайтов, которые размещаются на серверах Яндекса. Да, грубо говоря, Яндекс хранит на своих серверах весь Рунет и значительную часть Интернета. Конечно, на серверах, в кэше, размещаются не все страницы сайтов, а также не все элементы сайтов - чаще всего хранится лишь текстовое содержимое. Также не нужно представлять себе Яндекс в качестве некоего суперархива, в который попадают все странички, которые когда-либо были в сети 1Для таких задач есть другие сервисы, например, http://www.archive.org . Кэш Яндекса динамический, его содержимое постоянно обновляется по мере изменения основных сайтов.

Как это использовать? Для чего нужна ссылка "Сохраненная копия". Представим себе, что некоторая газета опубликовала скандальную статью. Поисковый бот Яндекса невозмутимо прошелся по сайту этой газеты и проиндексировал ее, сохранив копию на свой сервер . Тем временем широкая общественность, возмущенная статьей, потребовала удалить ее с сайта, а журналиста, который написал статью - уволить. Главный редактор газеты, посыпая голову пеплом, выполняет эти требования. Статьи на сайте газеты больше нет. Драматические события развиваются чрезвычайно быстро, буквально в течении утра.

Тем временем, некоторый читатель, который проснулся к обеду, заходит в сеть и видит, что форумы и блоги кипят от обсуждений этой статьи. Он набирает в Яндексе ее название, переходит по ссылке на сайт редакции и получает ошибку 404. Статьи, конечно, больше нет, но есть ссылка "Сохраненная копия", перейдя по которой читатель получает удовольствие от шокирующих подробностей копии статьи.

Когда эта ужасная статья исчезнет из кэша Яндекса? Когда поисковый бот, скажем, после обеда еще раз пройдется по сайту газеты и проиндексирует его. Статьи там больше нет, значит содержимое кэша тоже обновится и наступит полная гармония в сети.

Нам, пользователям, остается ловить промежутки времени между переиндексацией Яндекса после удаления некоторых материалов. Можно сказать, что если где-то исчезли материалы, то в течении нескольких часов их еще можно будет вытащить из кэша Яндекса по ссылке "Сохраненная копия".

Конечно, не все столь драматично и интересно. Чаще всего ссылка "Сохраненная копия" помогает, когда материалы основного сайта недоступны по причине банального падения сервера.

"Сохраненная копия" - это возможность увидеть материалы, которые были перемещены, удалены или недоступны. Работает в течение определенного промежутка времени.

Персональный поиск

Терабайтный жесткий диск - это уже не фантастика, а самая обыденная вещь. Фантастикой становится найти документ на таком жестком диске, особенно когда не очень хорошо помнится, когда он был создан, кем он был создан и вообще где он лежит.

Операционная система Windows Vista содержит средства поиска "на лету". Достаточно ввести в проводнике название файла как в окне результатов, тут же будут выведены соответствующие документы.

Яндекс предлагает Персональный поиск http://desktop.yandex.ru/ , который обеспечивает возможность находить файлы и документы на локальном компьютере. Для начала работы скачиваем программу (размером около 4,4 МБ) и устанавливаем ее. Персональный поиск должен вначале проиндексировать все документы, которые находятся на нашем жестком диске. По умолчанию, процесс полной индексации запускается автоматически, когда мы не трогаем центрального процессора не превышает 35%. Однако лучше всего сразу после установки выполнить принудительную индексацию - чтобы получить работающий локальный поиск . Для этого в системном трее (возле часов) щелкаем по иконке установленной программы и в контекстном меню выбираем пункт "Индексация \ Принудительная" ( рис. 1.32 2):


Рис. 1.32.

Скорость завершение процесса зависит от мощности компьютера, размера жесткого диска и количества документов. На двухядерном процессоре с двумя гигабайтами оперативной памяти, набитый под завязку 250 гигабайтный винчестер проиндексировался за пару часов. При этом какого-либо замедления в работе не замечалось - параллельно использовался браузер с множеством открытых вкладок, Microsoft Word , Excel , почта и т.д. Словом, индексация требует определенных затрат машинных ресурсов, но она выполняется гораздо легче, чем, скажем, антивирусное сканирование. В течении индексации иконка Персонального поиска переливается, а как только она становится статичной - значит, можно использовать поиск . Для запуска поиска дважды щелкаем по иконке - открывается браузер , в котором есть строка поиска. Но это только интерфейс - персональный поиск работает без подключения к Интернету. Вводим название файла и результаты отображаются моментально ( рис. 1.33):

Все найденные результаты группируются по вкладкам (табам), расположенным в правой части страницы. На странице помощи Персонального поиска