Парсер товаров интернет-магазинов v. 8.8

Тема закрыта
 

Xoro2000

Стаж: 19 лет 4 месяца

Сообщений: 21


Xoro2000 · 01-Май-12 15:26 (13 лет 7 месяцев назад, ред. 01-Май-12 15:26)

Он вообще что то парсит? У Озона и MY другие совершенно URLы в сравнении с тем что в примере указаны.
[Профиль]  [ЛС] 

Angariya

Стаж: 16 лет 10 месяцев

Сообщений: 6


Angariya · 01-Май-12 19:46 (спустя 4 часа)

cyber01 писал(а):
Angariya по вашему такая привязка поможет?) Сомневаюсь)) Умельцы все сломают)
Да умельцы то ладно, пускай ломаю, их не так уж и много, и ломают в основном для себя а не для школоты разной...)
[Профиль]  [ЛС] 

terr66

Стаж: 17 лет 1 месяц

Сообщений: 29

terr66 · 03-Май-12 18:13 (спустя 1 день 22 часа)

Код:
Парсинг Market.yandex.ru
Fatal error: Unsupported operand types in /home/u8910/parser.ekbt.ru/www/includes.php(2) : eval()'d code(1) : eval()'d code(1) : eval()'d code on line 1147
Очередное д.....мо!
Или дайте рабочую демку
[Профиль]  [ЛС] 

lastuser

Стаж: 16 лет 11 месяцев

Сообщений: 135

lastuser · 04-Май-12 02:04 (спустя 7 часов)

Ну это один из косяков - яндекс выплюнул страницу 403, парсер попытался её разобрать, случился fail. Об этом я выше писал - там есть 1) проблемы с кукисами 2) проблемы с антикапчей. Выше я выкладывал деобфусцированную версию, глянув на сорсы, там все довольно понятно, что куда. Там только надо пару-тройку мест поправить, после ковыряний в сорцах остались ссылки на /srv/www/...cookies.txt, до имени файла надо все поскипать.
[Профиль]  [ЛС] 

JarkoLeto

Стаж: 15 лет 4 месяца

Сообщений: 530

JarkoLeto · 06-Май-12 13:52 (спустя 2 дня 11 часов)

Парсер, он и в Африке... Очень стоящий штук. Спасибо.
[Профиль]  [ЛС] 

{Old_School}

Стаж: 15 лет 3 месяца

Сообщений: 2


{Old_School} · 12-Май-12 10:25 (спустя 5 дней)

lastuser писал(а):
Провел деобфускацию кода, впечатления не самые радужные.
Во-первых, недостает папок captcha, files, images - их надо создавать руками. Без этого картинки никуда валиться не будут, каптча работать не будет.
Во-вторых, яндекс.маркет (возможно, и другие маркеты тоже) не работает с антикапчей из-за ошибки в коде: модуль parser_yamarket.php передает в парсер переменную $config['antikey'], которой просто не существует, зато есть $config['antigate']. Надо либо править переменную в коде, либо создавать в таблице pref еще одну строку antikey. С учетом того, что код обфусцирован, проще сделать второе.
В-третьих, через прокси если и работает, то через одно место: вбил 10 работоспособных проксей, на всех вываливался в fatal error (либо параметры прокси не передаются курлу, либо где-то другой косяк в коде, еще не разбирался - итог такой, что парсер вытается распарсить страницу 403, не находит кол-во страниц и делит на 0).
В-четвертых, время от времени парсер после ввода капчи залипает на первой странице: счетчик страниц растет, но парсится один и тот же список из 10 товаров.
В целом решение, хоть и написанное на коленке, рабочее, но не лишено ряда серьезных косяков. "Чистую" версию без обфускации выложил тут.
Спасибо за труд, забрал. Попробую на локали...
[Профиль]  [ЛС] 

kawerin

Стаж: 14 лет 11 месяцев

Сообщений: 42

kawerin · 15-Май-12 16:52 (спустя 3 дня)

Помогите пожалуйста!! Поставил на денвер, а как запустить не знаю.... Хельп....
[Профиль]  [ЛС] 

cyber01

Стаж: 17 лет

Сообщений: 329

cyber01 · 15-Май-12 17:44 (спустя 52 мин.)

kawerin а для кого инструкция в раздаче?
[Профиль]  [ЛС] 

Neovit

Стаж: 13 лет 6 месяцев

Сообщений: 5


Neovit · 24-Май-12 03:11 (спустя 8 дней)

Ребят трабла использую движок shopos парсёр рабить не хочет ваще что делать ?
[Профиль]  [ЛС] 

legalalternative

Стаж: 15 лет 10 месяцев

Сообщений: 6


legalalternative · 31-Май-12 16:55 (спустя 7 дней)

Почему в названии версия 8.1, в картинке 8.2 а при установке 8.1? 8.1 с датой 04.02.2011 не заработало ничего(( ну или руки кривые
[Профиль]  [ЛС] 

kawerin

Стаж: 14 лет 11 месяцев

Сообщений: 42

kawerin · 01-Июн-12 22:48 (спустя 1 день 5 часов)

cyber01 писал(а):
kawerin а для кого инструкция в раздаче?
инструкция не понятна. как его запустить? или сложно ответить?
[Профиль]  [ЛС] 

_et

Стаж: 15 лет 7 месяцев

Сообщений: 95

_et · 02-Июн-12 07:58 (спустя 9 часов)

Че там не понятного?
Создать БД и залить туда дамп.
поправить файл конфига
выставить права на папки
запустить скрипт и следовать установки
ну и соблюдать требования для работы скрипта на сервере.
[Профиль]  [ЛС] 

disgrund

Стаж: 17 лет 11 месяцев

Сообщений: 2


disgrund · 20-Июн-12 12:58 (спустя 18 дней)

привет , а что за ошибка такая при запуске парсета с яндекс.маркета :
Warning: Invalid argument supplied for foreach() in /var/www/ph86046/data/www/parser/parser_yamarket.php(2) : eval()'d code(1) : eval()'d code(1) : eval()'d code on line 54
[Профиль]  [ЛС] 

qiwifuck

Стаж: 15 лет 4 месяца

Сообщений: 62


qiwifuck · 05-Июл-12 13:35 (спустя 15 дней, ред. 05-Июл-12 13:35)

lastuser писал(а):
Провел деобфускацию кода, впечатления не самые радужные.
Во-первых, недостает папок captcha, files, images - их надо создавать руками. Без этого картинки никуда валиться не будут, каптча работать не будет.
Во-вторых, яндекс.маркет (возможно, и другие маркеты тоже) не работает с антикапчей из-за ошибки в коде: модуль parser_yamarket.php передает в парсер переменную $config['antikey'], которой просто не существует, зато есть $config['antigate']. Надо либо править переменную в коде, либо создавать в таблице pref еще одну строку antikey. С учетом того, что код обфусцирован, проще сделать второе.
В-третьих, через прокси если и работает, то через одно место: вбил 10 работоспособных проксей, на всех вываливался в fatal error (либо параметры прокси не передаются курлу, либо где-то другой косяк в коде, еще не разбирался - итог такой, что парсер вытается распарсить страницу 403, не находит кол-во страниц и делит на 0).
В-четвертых, время от времени парсер после ввода капчи залипает на первой странице: счетчик страниц растет, но парсится один и тот же список из 10 товаров.
В целом решение, хоть и написанное на коленке, рабочее, но не лишено ряда серьезных косяков. "Чистую" версию без обфускации выложил тут.
1. исходный скрипт не был обфусцирован, посему ваш "деобфусцированный" вариант некорректен в плане названия.
2. добавьте недостающие папки, в чем проблема? ясен пень, это неправильно не включать нужные папки в дистрибутив, но тут уж коли разраб лоханулся, надо самим исправлять положение.
3. элемент массива antigate работает с языковой переменной, так у разраба названо то, что надо выводить узерам на экран в качестве пояснений. antikey - это переменная, входящая в состав механизма обработки капчи. вы просто путаете апельсины с бананами.
lastuser писал(а):
Уважаемый zuziken, 8.1 изначально кривая. Баги, перечисленные выше, я выявил в оригинальных деобфусцированных скриптах, поэтому давайте не будем кидать какашки в релизера из-за отсутствия трех папок, когда ваш программист наплодил ошибок на порядок больше.
И давайте быть реалистами: с такими косяками ваше поделие не стоит этих денег. За те деньги, которые вы просите, можно купить три копии Content Downloader, который на порядок лучше отлажен и имеет на порядок больший функционал, позволяющий парсить (почти) любой магазин, на лету подгонять парсер под изменения в дизайне и не зависеть от того, выпустит ли новую версию разработчик или нет, поправит баги или нет.
как уже сказано выше, здесь скорее вы не понимаете, о чем пишете, чем разраб.
хотя, я конечно соглашусь, что скрипт написан не лучшим образом. меня, например, позабавило выставление обращений к базе в виндоузовскую кодировку, в то время как база изначально создается в утф. также требуется проведение большой работы по рефакторингу, просто огромной, иначе это слезы, а не скрипт.
далее - этот скрипт изначально подразумевает постоянные обновления, потому что приходится постоянно перенастраивать граберы по ресурсам, когда те меняются.
либо делать это самому, либо брать у разраба.
либо пользоваться универсальным грабером типа wce.
_et писал(а):
Че там не понятного?
Создать БД и залить туда дамп.
поправить файл конфига
выставить права на папки
запустить скрипт и следовать установки
ну и соблюдать требования для работы скрипта на сервере.
плюс не забыть запустить setup.php, о чем в доке не сказано, иначе будет глючить.
pressa-p1 писал(а):
не работает этот скрипт.
не работает используемый вами сценарий грабилки, либо надо обновить у разраба, либо переписать самому, тогда заработает. просто ваш донор поменял разметку страницы, и грабер перестал находить то, что нужно.
кстати, с ресурсов грабит грабер, а парсер - это то, что раскладывает (распарсивает) результаты по движкам. в данном скрипте реализован частично.
[Профиль]  [ЛС] 

vk_alvin

Стаж: 14 лет 9 месяцев

Сообщений: 2


vk_alvin · 01-Авг-12 17:31 (спустя 27 дней)

была бы возможность парсить с amazon.com
[Профиль]  [ЛС] 

gabdr

Стаж: 15 лет 5 месяцев

Сообщений: 3


gabdr · 08-Авг-12 16:58 (спустя 6 дней)

prestashop есть?
[Профиль]  [ЛС] 

Mistral65

Стаж: 14 лет 3 месяца

Сообщений: 1


Mistral65 · 27-Авг-12 22:04 (спустя 19 дней)

Приветствую, lastuser!
Подскажите пожалуйста как пользоваться этим?
lastuser писал(а):
52148456Провел деобфускацию кода, впечатления не самые радужные.
Во-первых, недостает папок captcha, files, images - их надо создавать руками. Без этого картинки никуда валиться не будут, каптча работать не будет.
Во-вторых, яндекс.маркет (возможно, и другие маркеты тоже) не работает с антикапчей из-за ошибки в коде: модуль parser_yamarket.php передает в парсер переменную $config['antikey'], которой просто не существует, зато есть $config['antigate']. Надо либо править переменную в коде, либо создавать в таблице pref еще одну строку antikey. С учетом того, что код обфусцирован, проще сделать второе.
В-третьих, через прокси если и работает, то через одно место: вбил 10 работоспособных проксей, на всех вываливался в fatal error (либо параметры прокси не передаются курлу, либо где-то другой косяк в коде, еще не разбирался - итог такой, что парсер вытается распарсить страницу 403, не находит кол-во страниц и делит на 0).
В-четвертых, время от времени парсер после ввода капчи залипает на первой странице: счетчик страниц растет, но парсится один и тот же список из 10 товаров.
В целом решение, хоть и написанное на коленке, рабочее, но не лишено ряда серьезных косяков. "Чистую" версию без обфускации выложил тут.
[Профиль]  [ЛС] 

uatara

Стаж: 16 лет 7 месяцев

Сообщений: 3


uatara · 10-Сен-12 22:09 (спустя 14 дней)

Господа, как насчет версии 8.2?
Ни у кого не завалялась?
[Профиль]  [ЛС] 

Tuz2000

Стаж: 15 лет 11 месяцев

Сообщений: 7


Tuz2000 · 10-Сен-12 23:54 (спустя 1 час 44 мин.)

С парсингом с горем пополам разобрался (удалось спарсить с ЯндексМаркета несколько десятков товаров). В результате работы скрипта имеем базу данных со спарсенными товарами, картинки и CSV-файл.
Теперь стоит задача все это имплементировать на Joomla 2.5 + VirtueMart 2.0.10 В раздаче версии скрипта 6.2 вложен компонент com_csvi_virtuemart_1.9.zip, который как я понимаю и служит для импорта товаров из CSV-файлов. Но вот почему-то сделать импорт не получается (появляются сообщения про ошибки). Буду очень благодарен за любую помощь в этом вопросе.
[Профиль]  [ЛС] 

cyber01

Стаж: 17 лет

Сообщений: 329

cyber01 · 11-Сен-12 01:10 (спустя 1 час 16 мин.)

Tuz2000 может для начала выложить эти самые сообщения про ошибки?
[Профиль]  [ЛС] 

seom

Стаж: 15 лет 10 месяцев

Сообщений: 10


seom · 11-Сен-12 17:08 (спустя 15 часов, ред. 11-Сен-12 17:08)

Tuz2000 писал(а):
55143405С парсингом с горем пополам разобрался (удалось спарсить с ЯндексМаркета несколько десятков товаров). В результате работы скрипта имеем базу данных со спарсенными товарами, картинки и CSV-файл.
Теперь стоит задача все это имплементировать на Joomla 2.5 + VirtueMart 2.0.10 В раздаче версии скрипта 6.2 вложен компонент com_csvi_virtuemart_1.9.zip, который как я понимаю и служит для импорта товаров из CSV-файлов. Но вот почему-то сделать импорт не получается (появляются сообщения про ошибки). Буду очень благодарен за любую помощь в этом вопросе.
К примеру, потому что CSV Improved не совместим с этой связкой.
Joomla! 1.5
VirtueMart 1.1.x - CSVI 1, CSVI 3
VirtueMart 2.x - Not Supported
Joomla! 2.5
VirtueMart 1.x - Not Supported
VirtueMart 2.x - CSVI 4/5
[Профиль]  [ЛС] 

Tuz2000

Стаж: 15 лет 11 месяцев

Сообщений: 7


Tuz2000 · 13-Сен-12 02:05 (спустя 1 день 8 часов, ред. 13-Сен-12 02:05)

Спасибо за помощь, господа!
После десятка переустановок сайта с вероятностью 99% удалось установить что причина ошибок в работе CSV Improver была толи в русификаторе Joomla 2.5 толи в русификаторе virtuemart 2.0.10
А вообще было бы не плохо если б был расписан весь процес импорта по шагам (понимаю что прошу слишком многого).
Кстати картинки товаров после импорта не отображаются. Так и должно быть? (Папку images, следуя подсказке lastuser создал, и фотографии с ЯндекМаркета туда записываются)
Кому-нибудь на Joomla 2.5 удалось импортировать картинки?
[Профиль]  [ЛС] 

mika_phaeton

Стаж: 16 лет 6 месяцев

Сообщений: 40


mika_phaeton · 14-Сен-12 23:23 (спустя 1 день 21 час)

а что может означать сообщение
"Парсинг прерван по запросу пользователя." ?
[Профиль]  [ЛС] 

Tuz2000

Стаж: 15 лет 11 месяцев

Сообщений: 7


Tuz2000 · 15-Сен-12 09:42 (спустя 10 часов)

Цитата:
а что может означать сообщение
"Парсинг прерван по запросу пользователя." ?
обыно оно появляется после того как вы нажмете кнопку "Остановить"
[Профиль]  [ЛС] 

mika_phaeton

Стаж: 16 лет 6 месяцев

Сообщений: 40


mika_phaeton · 15-Сен-12 12:00 (спустя 2 часа 17 мин.)

странно, ведь пункт меню "Остановить" я не нажимаю.
Может быть я что то не так делаю?
Я просто в окно "URL-ы категории:" вставляю url интересующий меня категории и нажимаю кнопочку
"Начать парсинг"
через пару секунд появляется сообщение "Парсинг прерван по запросу пользователя."
Никаких дополнительных настроек не делал.
Каталоги создал, права дал. Всё это проделывалось на FreeBSD.
cURL support enabled
cURL Information 7.24.0
[Профиль]  [ЛС] 

Banifaki

Стаж: 16 лет 8 месяцев

Сообщений: 358

Banifaki · 15-Сен-12 13:38 (спустя 1 час 37 мин., ред. 16-Сен-12 07:21)

При парсинге не отображается состояние процесса, то есть в окне пустое, хотя процесс парсинга идет. И только когда оканчивается парсинг, появляется отчет о том что товары спарсены. Как это можно исправить? А то порой не понимаешь работает он или нет, и сколько уже позиций спарсил.
[Профиль]  [ЛС] 

rombi

Стаж: 15 лет 11 месяцев

Сообщений: 9

rombi · 10-Окт-12 01:41 (спустя 24 дня)

Banifaki, купи лицуху, поставь на локальный серв и не мучайся)
[Профиль]  [ЛС] 

cyber01

Стаж: 17 лет

Сообщений: 329

cyber01 · 10-Окт-12 12:45 (спустя 11 часов)

zuziken эмм в чем проблема поправить .htaccess под nginx?
[Профиль]  [ЛС] 

WERTER_BOY

Стаж: 15 лет 7 месяцев

Сообщений: 16


WERTER_BOY · 13-Окт-12 18:43 (спустя 3 дня)

zuziken писал(а):
51917306
_et писал(а):
Вы же давно отбили свой скрипт по деньгам. Его же не один человек купил, правильно.
Что жалеть то? Или Вы планировали всю жизнь на нем зарабатывать?))
Мухахахахахаах
Скажите это директору АвтоВАЗ: "На ваших машинах уже столько народу ездит. Что жалеть-то? Раздавай бесплатно или Вы планировали всю жизнь на нем зарабатывать?"
Вот такой тупости я ещё не встречал.
Автоваз, по вашей тупой логике, за проданную однажды машину дерёт деньги всю оставшуюся жизнь? или всё-таки с каждой новой, выпущенной?
Перефразируя вашу тупень, делаю вывод что вы как автоваз каждый день в поте лица по новой одну и туже программу стряпаете? Тады да, тады вам положен гонорар..
Почему-то вы за одно и туже, однажды проданную вам булку хлеба, не платите в магазин. Надеюсь, очень надеюсь что ход мыслей понять сможете, иначе с логикой у вас действительно швах судя по вашему тупому сравнению с автовазом
[Профиль]  [ЛС] 

probeprobe

Стаж: 15 лет 6 месяцев

Сообщений: 13


probeprobe · 15-Окт-12 23:43 (спустя 2 дня 4 часа)

а для джумлы как? через зеброид?
[Профиль]  [ЛС] 
 
Тема закрыта
Loading...
Error