Цитата:
Хотя эта "большая" скорость всего ~20 сек. на стр. (скрипт открывает одну стр. в буфер и потом копирует с нее анкеты со скоростью 2-3 анкеты/сек, потом еще одну стр. и т.д.).
2-3 страницы в секунды - это не нормальная скорость для человека.
Цитата:
У вас анкету, кот. не обновлялась недели две, практически невозможно увидеть.
Все анкеты доступны из главного каталога, начинающиеся с главной страницы сайта. Сначала идут анкеты, оплатившие рекламу, а за ними - анкеты, рекламирующиеся бесплатно, отсортированные по дате обновления. Зайдите на главную страницу сайта и нажмите на одну из последних страниц каталога, проверьте даты обновления анкет, размещенных на этих страницах - они не обновлялись по несколько месяцев.
Теперь вернемся непосредственно к Вашей программе. 390 уникальных анкет - это и есть неверный результат. Я не знаю как работает Ваша программа, но я написал свой аналогичный скрипт, чтобы проверить Ваше утверждение, результат: более 1700 уникальных телефонов с одного единственного прохода. Ищите ошибку в своей программе. Вот мой скрипт, можете проверить сами:
@set_time_limit(0); function getContent($url){ $handle = fopen($url, "rb"); $contents = ""; while (!feof($handle)) $contents.=fread($handle, 10000); fclose($handle); return $contents; } $phones = array(); for ($i=1; $i<=48; $i++){ $content = getContent("http://www.intimcity.ru/persons.php?type=0&style=0&news=0&updated=0&index=".(($i-1)*50)."&video=N&indoor="); preg_match_all("/alt\=\"([0-9\(\)\-]{17})\ [^\"]*\"/", $content, $matches, PREG_PATTERN_ORDER); for ($j=0; $j print($i.": ".count($phones)." "); flush(); sleep(10); }
|