topazz
Постоялец
- Регистрация
- 20 Фев 2007
- Сообщения
- 145
- Реакции
- 31
- Автор темы
- #1
Общий вид
Настройки
Количество текстов - определяет сколько текстов надо спарсить
Ширина строки - определяет ширину строки текста записываемого в файл
Пробелы после H1 - если стоит галка "Заголовки текстов", можно указать отступы после них
Пробелы после P - дефолтная статья имеет три параграфа, здесь можно указать их отступы
пробелы после текста - пробелы после текста ))
Заголовки текстов - если галка стоит собираются еще и заголовки, если нет текст идет сплошняком
Рандомные темы - для парсинга выбираются случайные темы, иначе есть блок правее где можно указать необходимые
Синонимизировать - синонимизирует текст встроенной базой синонимов
Перезаписывать файл - если задаются рандомные темы или выбранно больше 2-х тем то файл с текстами будет иметь префикс mix_data, если выбрана одна тема файл будет иметь ее название, например: literature_16.01.10.txt. Так вот если вы хотите что бы эти файлы перезаписывались каждый раз при начале парсинга ставьте галку.
Использовать прокси - При каждом запросе программа будет брать случайное прокси из файла. Использует прокси из файла /resurs/proxy.txt . Если хотите указать свои прокси указывайте из в файле proxy_for_chek.txt и нажимайте кнопку проверка прокси.
Потоков для проверки прокси - указывайте количество, если проксей много то лучше по больше, хотя я сознательно ограничил максимальную планку потоков, дабы не получать бан от сайта по которому они проверяются )
Таймаут для прокси - как написанно так и есть
Задержки в запросах - время в секундах, через которое будет производиться следующий запрос.
Вот собственно и все, ссыль ниже
![4d989.jpg](/proxy.php?image=http%3A%2F%2Fimg8.imageshost.ru%2Fimgs%2F100116%2F8612e354b9%2F4d989.jpg&hash=820b8dd3ecd44ec10597bebfc2cd3c5b)
Настройки
Количество текстов - определяет сколько текстов надо спарсить
Ширина строки - определяет ширину строки текста записываемого в файл
Пробелы после H1 - если стоит галка "Заголовки текстов", можно указать отступы после них
Пробелы после P - дефолтная статья имеет три параграфа, здесь можно указать их отступы
пробелы после текста - пробелы после текста ))
Заголовки текстов - если галка стоит собираются еще и заголовки, если нет текст идет сплошняком
Рандомные темы - для парсинга выбираются случайные темы, иначе есть блок правее где можно указать необходимые
Синонимизировать - синонимизирует текст встроенной базой синонимов
Перезаписывать файл - если задаются рандомные темы или выбранно больше 2-х тем то файл с текстами будет иметь префикс mix_data, если выбрана одна тема файл будет иметь ее название, например: literature_16.01.10.txt. Так вот если вы хотите что бы эти файлы перезаписывались каждый раз при начале парсинга ставьте галку.
Использовать прокси - При каждом запросе программа будет брать случайное прокси из файла. Использует прокси из файла /resurs/proxy.txt . Если хотите указать свои прокси указывайте из в файле proxy_for_chek.txt и нажимайте кнопку проверка прокси.
Потоков для проверки прокси - указывайте количество, если проксей много то лучше по больше, хотя я сознательно ограничил максимальную планку потоков, дабы не получать бан от сайта по которому они проверяются )
Таймаут для прокси - как написанно так и есть
Задержки в запросах - время в секундах, через которое будет производиться следующий запрос.
Вот собственно и все, ссыль ниже
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.