Десктопный парсер Google
О бесплатном серверном парсере я уже писал, теперь поговорим о десктопном. Бесплатный многопоточный парсер Google, написанный на Delphi скачать можно здесь.
Из достоинств:
1) Бесплатность
2) Поддержка и граббинг проксей
3) Гибкие настройки парсинга (возможности расширения за счет прилагаемого к запросам списка WORDS)
4) Проверяет ПР напарсенных URL-ов
Из недостатков:
1) Страшненький интерфейс
2) Глючность с функцией Browser (вызывает броузер, который вам показывает текущий SERP)
3) Не удаляет повторяющиеся ссылки
Работа с парсером проста: запустили, добавили список запросов, добавили список слов (WORDS). Рекомендую в качестве списка words пользоваться списком topdomains.txt. Сграбили проксей и помчали 
А чтобы парсилось легко и непринужденно, вот вам в помощь база запросов для парсинга гест - guestbook-queries.txt
Пост написан красиво?
Стимулируй блога прогресс:
Не стоит покупать мне пиво,
Подпишись на RSS!
Вас также могут заинтересовать эти посты:

 Заказ 
Читать в ЖЖ
[…] 1) Страшненький интерфейс 2) Глючность с функцией Browser (вызывает броузер, который вам показывает текущий SERP) 3) Не удаляет повторяющиеся ссылки Источник […]
Посмотрим, работает уже 2 часа, результат пока 164 линка, при скорости 512 кб/с, трафика уже 12метров. Даж не заню…
Сегодня попробую на скорости 6 мегабит запустить его
А чем можно дубли удалять?..
Спасибо за информацию!
Megos отпишись потом. Прога работает 7 часов = 391 линк 70 метров трафа
AllSubmitter, Xrumer, любой обработчик баз, или сапописный скрипт
Прокси используешь?
И посмотри, не подсовывает ли тебе гугл капчу?
Le secret, 1 час работы = 142 линка, 10 метров трафа.
Достоинства переплевывают недостатки
Достоинства переплевывают недостатки с моей точки зоения
Не повезло тем владельцам гестбуков, которые вылезут по этим запросам
P.S.: Спасибо за парсер!
А ты откуда прокси берёшь? С сайтов, которые в тхт-файле в архиве?
А то я последние года 3 не могу найти хорошего источника свежих прокси, с тех пор, как shark board закрылась, всё остальное либо мусор, либо наполовину мусор, но за деньги.
Вобще, парсер сам грабит прокси. Если их надо проверить - воспользуйся прокси-чекером
Да я понимаю, что он их сам себе набирает
Но он их может набирать только по адресам, которые прописаны у него в тхт-файле. Ты в этот файл ничего не добавляешь?
А онлайн-чекеры - это обычно тоже трэш. Куда приятнее (и удобнее) пользоваться для проверки десктопными программами типа AATools.