Помощь HELP Помогите поправить парсер.

grebovich

Гуру форума
Регистрация
19 Мар 2012
Сообщения
367
Реакции
84
Ребята помогите создать скрипт ParserMX для . все что нужно сделал а вот с описанием и атрибутами полный завал их нет просто в исходном коде страницы и не пойму как они его вообще на сайте выводят.

Буду благодарен всем за помощь!
 
Подгружается аяксом. Что к чему - смотреть в консоли браузера/инструментах разработчика. Описания можно достать курлом. Вот пример для консоли
Код:
curl "http://baby-one.com.ua/shop/item/getJSON/" -H "Pragma: no-cache" -H "Origin: http://baby-one.com.ua" -H "Accept-Encoding: gzip, deflate" -H "Accept-Language: ru-RU,ru;q=0.8,en-US;q=0.6,en;q=0.4" -H "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.132 Safari/537.36" -H "Content-Type: application/x-www-form-urlencoded; charset=UTF-8" -H "Accept: application/json, text/javascript, */*; q=0.01" -H "Cache-Control: no-cache" -H "X-Requested-With: XMLHttpRequest" -H "Proxy-Connection: keep-alive" -H "Referer: http://baby-one.com.ua/progulochnaya-kolyaska-abc-design-moving-light-avocado/g00062791/" --data "id=8185&fields"%"5B"%"5D=tab_"%"D0"%"9E"%"D0"%"BF"%"D0"%"B8"%"D1"%"81"%"D0"%"B0"%"D0"%"BD"%"D0"%"B8"%"D0"%"B5" --compressed

Там походу вообще все можно достать в готовеньком виде, без парсинга всего сайта и разбора
 
Подгружается аяксом. Что к чему - смотреть в консоли браузера/инструментах разработчика. Описания можно достать курлом. Вот пример для консоли
Код:
curl "http://baby-one.com.ua/shop/item/getJSON/" -H "Pragma: no-cache" -H "Origin: http://baby-one.com.ua" -H "Accept-Encoding: gzip, deflate" -H "Accept-Language: ru-RU,ru;q=0.8,en-US;q=0.6,en;q=0.4" -H "User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.132 Safari/537.36" -H "Content-Type: application/x-www-form-urlencoded; charset=UTF-8" -H "Accept: application/json, text/javascript, */*; q=0.01" -H "Cache-Control: no-cache" -H "X-Requested-With: XMLHttpRequest" -H "Proxy-Connection: keep-alive" -H "Referer: http://baby-one.com.ua/progulochnaya-kolyaska-abc-design-moving-light-avocado/g00062791/" --data "id=8185&fields"%"5B"%"5D=tab_"%"D0"%"9E"%"D0"%"BF"%"D0"%"B8"%"D1"%"81"%"D0"%"B0"%"D0"%"BD"%"D0"%"B8"%"D0"%"B5" --compressed

Там походу вообще все можно достать в готовеньком виде, без парсинга всего сайта и разбора
Хех ... а можно поподробней как все что вы написали сделать в parserMX :)

У меня счас вот такой простой код:
Код:
[LIST]
//AUTO LIST START - сгенерировано автоматически
products = tags_href ".product-container-name"
nextpage = tag_href ".clearfix li:nth-child(3) a"
//AUTO LIST END

[PRODUCT]
//AUTO START - сгенерировано автоматически
status = true
name = tag_text "h1"
model = tag_text ".art-text span"
manufacturer = tag_text ".brand-name a"
main_image = tag_image ".product-image"
images = tags_image ".swiper-slide img"
if (!price and !empty(noprice)) skip = true
//AUTO END

[PASS]
/* Опции прописаные Мастером Инструкций */
/**<h2 style='font-weight:normal'>Настройки парсинга</h2>**/
auto_replace = false // Применять автозамены ко всем страницам
description_images = true // Загружать изображения из описания (Изображения из описания будут загружены к вам на сервер)
site_language = "" // Язык сайта для перевода (Для автоматического перевода установите язык сайта<br/><b>Например:</b> EN - английский, RU - русский)
noprice = false // Пропускать товары без цены
update_price = false // Обновлять цену
update_description = false // Обновлять название и описание
update_images = false // Обновлять изображения
update_attributes = false // Обновлять характеристики
update_options = false // Обновлять опции

Как дописать в него чтоб захватывал и описание с атрибутами.
 
с parserMX не работал не знаю
 
Выше уже написал что стабильнее связки content downloader Для просмотра ссылки Войди или Зарегистрируйся и модуля автоматическое обновление прайс листов, для опенкарта нету
 
Выше уже написал что стабильнее связки content downloader Для просмотра ссылки Войди или Зарегистрируйся и модуля автоматическое обновление прайс листов, для опенкарта нету
Тоже очень долго его пытался настроить по мне так лучше Content Downloader освоить за недельку поскольку он очень универсален и не парится потом.
 
Последнее редактирование:
Назад
Сверху