- Регистрация
- 14 Янв 2008
- Сообщения
- 368
- Реакции
- 100
- Автор темы
- Заблокирован
- #1
Вот я пишу грабилку, многопоточную, и получается так что урл-ов с пачки страниц около 1-3к. И есть таблица в БД
и есть индекс для того чтобы url был уникальным
Мне приходится подавать каждый урл чере mysql_query - сам понимаю что по идее дофига уходить ресурсов должно, так и есть данные в БД либо не доходят, либо же доходят, но медленно...
Если подавать всю пачку урлов одим, или несколькими запросами то получается если хоть 1 урл не уник, то будет ошибка то что дубликат...
Вообщем как обеспечить уникальность, при условии что подавать каждый урл через mysql_query не могу...
у меня mysql 5, PHP 5
Код:
[B]pages[/B]
Таблица со списком урлов к парстингу
Поле Тип Ноль По умолчанию Комментарии
url varchar(1000) Да Урл страницы
parse varchar(4) Да NULL Спарстилась ли?
lastparse int(100) Да NULL Дата Последнего прохода парсером
Код:
[B] Индексы:[/B]
Имя ключа Тип Количество элементов Поле
url UNIQUE 6720 url
Мне приходится подавать каждый урл чере mysql_query - сам понимаю что по идее дофига уходить ресурсов должно, так и есть данные в БД либо не доходят, либо же доходят, но медленно...
Если подавать всю пачку урлов одим, или несколькими запросами то получается если хоть 1 урл не уник, то будет ошибка то что дубликат...
Вообщем как обеспечить уникальность, при условии что подавать каждый урл через mysql_query не могу...
у меня mysql 5, PHP 5