Редактирование списка

Surprise

Мой дом здесь!
Регистрация
12 Мар 2012
Сообщения
430
Реакции
210
Вообщем у меня есть база номеров телефонов, количество - порядка 400 000. Записаны все в разных форматах:
+Х(ХХХ)1234567 / (ХХХ)1234567 / (ХХ)1234567 , а так же присутствует мусор типа 77777777 и.т.д

Что нужно:
1. Редактировать список по определенной маске, чтобы номер получится в формате ХХ1234567
2. Удалить дубли

Как реализовать?
 
Сперва в файле, например через notepad++, удаляешь все +Х.
Там должны они быть либо все +7 либо максимум 9 вариантов, думаю. +8, +6 и т.п. Так ведь?
Потом можно с помощью php и говнокода заменить в каждой строке первые 3 цифры на нужные 2.
Код:
$file = file_get_contents('baza.txt');
foreach($file as $line):
if(strlen($line) == 10):
echo mb_substr($line, 1)."<br>";
else:
echo $line;
endif;
endforeach;
Выведет на страницу нужный тебе результат из первого пункта.
Можно в файл записать результат:
Код:
$file = file_get_contents('baza.txt');
foreach($file as $line):
if(strlen($line) == 10):
file_put_contents("result.txt", mb_substr($line, 1), FILE_APPEND);
else:
file_put_contents("result.txt", $line, FILE_APPEND);
endif;
endforeach;

А для удаления дубликатов есть онлайн сервисы. Ну и готовые скрипты на пыхе тоже есть.
 
Назад
Сверху