Парсер кэша Google

matrixid

Мой дом здесь!
Регистрация
6 Ноя 2013
Сообщения
311
Реакции
282
Ищу рабочий парсер кэша Google, на просторах интернета рабочего не нашел, может кто поделиться?
P.S: Сохранять вручную не вариант, т.к. результатов очень много, и требуется это регулярно.
 
Последнее редактирование:
берёшь контентДаунлоадер вбиваешь в него ссылки типа:
Для просмотра ссылки Войди или Зарегистрируйся УРЛ страницы(без Для просмотра ссылки Войди или Зарегистрируйся)

и парсишь

Вот кешь этой страницы темы: Для просмотра ссылки Войди или Зарегистрируйся

сложноватый вариант, это получается мне надо предварительно составить список скачиваемых стараниц? :confused:
а если в кеше 1000 страниц?

P.S.: как посмотреть единичные страницы я знаю, нужен скрипт парсер всего сайта из кеша
 
парсишь все страницы SiteMap Generator, потмо через ексель или нотепад+ подставляешь Для просмотра ссылки Войди или Зарегистрируйся
и готовые ссыли в контент даунлоадер
 
гугл по запросу SiteMap Generator выдал кучу разной дряни, что именно ты имеешь ввиду?
Карту сайта? а если ее нет на сайте? и сайт уже не работает (не существует)
 
Это уже совершенно другая задача. Скритпт тоже же не из воздуха должен брать урлы страниц, а гугл выдаёт до 1000 результатов поиска - часто меньше.
Нужен паук, чтобы он заходил на известные страницы в кэше гугла, затем считывал куда идут ссылки на них, подставлял их в запрос гугла на предмет кэша и так далее, пока все ссылки страниц которые есть в кэше не найдёт - потом список страниц уже на парсинг контента отсылать. Или в паук, накидать маски урлов, чтобы он считал выдачу какие там есть адреса страниц по ним, это проще, но не факт что всё охватить можно.
 
Я написал чем я пользуюсь, тебе не обязательно собирать ссылки с сайта таким же инструментом как и я.
С этим легко справится и Content Downloader, собери им все ссылки на страницы с сайта.

Вот эту темку посмотри: Для просмотра ссылки Войди или Зарегистрируйся

А SiteMap Generator который я юзаю можешь скачать тут: Для просмотра ссылки Войди или Зарегистрируйся
 
Последнее редактирование:
Я написал чем я пользуюсь, тебе не обязательно собирать ссылки с сайта таким же инструментом как и я.
С этим легко справится и Content Downloader, собери им все ссылки на страницы с сайта.

Вот эту темку посмотри: Для просмотра ссылки Войди или Зарегистрируйся

А SiteMap Generator который я юзаю можешь скачать тут: Для просмотра ссылки Войди или Зарегистрируйся
SiteMap Generator облазил в доль и поперек, как я понял он работает с живыми сайтами
меня же интересует мертвый (недоступный сайт), но который есть в кеше гугла
Content Downloader - весьма функциональная програмулина, пока ковыряю без результатно
Может есть еще какие решения?
 
не сочтите за археолога. правила знаю, но дабы не плодить темы, подниму вопрос: как спарсить сайт из кеша Гугла?)
не появились ли какие то готовые решения? заранее благодарю!
 
наверное проще из вебархива
 
Назад
Сверху