Igorra
Создатель
- Регистрация
- 25 Ноя 2007
- Сообщения
- 45
- Реакции
- 21
- Автор темы
- #1
Собственно скрипт, который стоит 149 у.е.
Тут бесплатно =)
Тут бесплатно =)
Возможности парсера текстов (rss graber)
Простая утсановка
Выдирание контента напрямую из RSS ленты
Выдирание контента из html файлов
Сохранение и изменение размеров награбленых изображений. Рисунки можно сохранять у себя на сервере или же просто оставлять как было (hotlink)
Поддержка ArticleMS, Danneo, DataLife Engine, Seditio, Strawberry, Subdreamer, WordPress
Модерирование уже отпарсенного контента
Возможность автоматической замены текстовых блоков или слов
Фильтр ключевых слов позволяет задавать обязательные или запретные ключевые слова
Определение раздела статьи по плотности ключевых слов
Замена ключевых слов ссылками (можно использовать маски для определения ссылок от списка ключевиков).
Создание неограниченного количества парсеров позволяет тянуть контент с многих источников, тем самым повышая уникальность проекта.
Нет ограничений по времени, количество сайтов зависит от выбранного пакета.
Фильтр html тегов позволяет очистить контент от исходящих ссылок или других ненужных елементов.
Можно изменять длину превью текста. Разумное разделение текста между абзацами.
Возможность добавления копирайта в конец текста статьи
Встроеный скрипт редиректа ссылок
Простота установки и настройки
Хорошее понимание как английского так и русского текста, благодаря наличию встроенных конвертеров кодировок (UTF-8, windows-1251)
Работа с прокси серверами
Отправка напарсенного контента на e-mail администратора
Поддержка WPKeys плагина
Настройка парсера текстов
1. Создайте парсер для вашего сайта-источника, укажите ” ” (пробел) как границы парсинга.
2. Добавьте RSS или Atom ленту. Укажите раздел на сайте, куда будут вставлятся новые статьи и выберите созданный парсер.
3. Перейдите в раздел “Параметры” и включите режим debug.
4. Вернитесь в раздел “RSS ленты” и запустите тестер ленты, нажав на иконку листа с зеленой стрелкой.
5. Найдите на странице тестера ссылку на страницу-источник и откройте ее в новом окне. Скопируйте в буфер обмена несколько первых слов вначале текста статьи. Вернитесь на страницу тестера и с помощью команды “Найти на странице” (Ctrl + F) и найдите начало статьи в html коде после заголовка Trimmed spaces. Выделите верхнюю границу парсера и вставьте в настройки парсера.
Аналогично найдите нижнюю границу парсера.
6. Проверьте правильно ли парсится статья - текст под заголовком Parsed article. После чего отключите режим debug в разделе “Параметры”.
Парсер готов к работе. Запускайте парсер с помощью ссылок в разделе Действия в меню.
Заливка парсера (rss грабера) на сервер
Заливка скрипта на сервер
Скрипт парсера новостей должен быть размещен в корневой папке выбранной CMS.
Такое расположение файлов скрипта есть обязательным, так как он использует файлы настроек, параметры подключения к базе данных.
Установите права для записи файлов
Установите права на запись (777) файлов для папок cache, config и images.
На некоторых серверах установливая права на папку config, проследите, чтобы права на запись были установленные и на все вложенные файлы
Зайдите в админ панель, набрав в адресной строке Для просмотра ссылки Войдиили Зарегистрируйся (Для просмотра ссылки Войдиили Зарегистрируйся следует заменить на свой адрес сайта), начальные логин и пароль demo.
Выберите тип своей CMS и кодировку. Проверьте правильно ли задан путь к скрипту и другие настройки.
Установите базу данных с помощью пункта меню “Установить” в разделе База данных. После этого скрипт готов к работе
Добавьте RSS ленты и настройте парсеры.
Настройте планировщик задач (крон).
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.