Парсеры товаров - что, как и для чего.

12 октября 2011 | Автор: 4udak | Теги: , ,

Парсер?! - а что это такое, что с ними можно сделать... примерно такой вопрос и меня был несколько лет назад.

В этой статье хотелось бы немного изложить свое видение и мнение о парсерах контента, с уклоном к парсерам товаров для интернет-магазинов.

Для чего они нужны? Нужны они, прежде всего,  для автоматизации процессов работы с информацией (копирование, перенос, наполнение). Так же возможно применить его как средство постоянного обновления и актуализации информации из источника, быстрого (мгновенного) наполнения сайта информацией из другого сайта, мониторинга изменений и сравнения с другими данными (например сравнение цен на что-либо на нескольких источниках).

У парсеров, как и у всего остального в этом мире, не могут быть только хорошие и положительные свойства.

Положительное в парсерах. Это в первую очередь мощный инструмент, который позволяет быстро и в больших количествах извлекать информацию из различных источников. Кроме банального извлечения, эту информацию возможно всячески анализироваться, редактировать, систематизировать и т.п. - так же в автоматическом режиме.

Не очень хорошее. Уникальность информации (контента) при работе с парсером отсутствует, т.к. она скопирован у кого-то. Но стоит заметить(уже писал как то ранее), что не всякую информацию можно сделать уникальной, например описание товара в интернет-магазине - это, как правило, технические характеристики изделия, и они у всех будут одни и те же, т.к. техническая характеристика например iphone - "она и в Африке будет такой же". Поэтому считаю допустим копировать описания товаров (технические хар-ки) из общедоступных источников, т.к. сделать его уникальным практически невозможно. В дополнение к стандартным характеристикам можно добавить свое мнение о данном товаре, что не будет лишним. Больше из не очень хорошего затрудняюсь назвать.

Итого. В результате мы получаем, что уникальность контента для товаров интернет-магазинов достичь довольно таки сложно (и дорого), если только в "ручном режиме". Но если говорить о ручном наполнении, то сложно предположить сколько времени будет наполняться сайт с количеством товаров хотя бы в 1-5тыс, дальнейшее обновление ассортимента так же будет соответствующим, затраты конечно же здесь будут выше нежели при автоматическом, т.к. "ручная" работа всегда на порядок  дороже "автоматической" (работы "машины").

Приближаясь к этапу наполнения необходимо все взвесить, подумать, и решить, какой путь наполнения и обновления информации в своем интернет-магазине Вы будете использовать: автоматическое наполнение (парсер товаров) или ручками.

Заказывая автоматическое наполнение, за относительно не большие деньги вы получаете готовый контент в максимально короткие сроки (от 1 дня), заказывая ручное наполнение сроки увеличиваются, увеличивается влияние человеческого фактора (вероятность ошибок выше), финансовые затраты выше (нужны дополнительные работники).

Буду рад услышать Ваше мнение на данную тему.



Понравилась статья? Подпишись на RSS моего блога!

Комментарии (8) на "Парсеры товаров - что, как и для чего."

  1. Анастасия:

    Это интересно!
    А как установить парсер в престашоп (в какую папку)?

    • Парсер, как правило, это отдельный скрипт или программа, которые работают независимо от интернет-магазина. Они в результате работы генерируют csv-файл, который уже можно импортировать в PrestaShop через стандартный импорт.

      • Анастасия:

        Скачала ymp v.1. (яндекс-маркет парсер) там в руководстве установки указано, что нужно скопировать архив в административную директорию сайта... как быть

        • Где Вы его скачали, можно посмотреть? Я не сталкивался с такими парсерами, поэтому не могу что-то советовать.
          Если есть инструкция, то делайте согласно ей.

  2. Сергей:

    Добрый день, а какой парсер вы посоветуете для работы с ВертуалМартом ?

  3. Alex:

    Воровство, оно и в Африке воровство...
    Кто-то трудился, вбивая ручками те самые "одинаковые технические характеристики", а тут раз, и всё моментом своровали ...

    Чтобы сделать хорошую картинку, надо посидеть минимум пару часов,
    и далеко не у каждого получится. Своровать и проще, и дешевле.

    Удивительное дело, - воровство спокойно и открыто обсуждается,
    для него ищутся технические решения, способы повышения
    "эффективности" и проч.

    Недавно, один знакомый иностранец с изумлением рассказывал,
    что картинки из его магазина увидели на "русском сайте"...
    Он никак в толк взять не мог - "зачем они это сделали",
    и всё пытался понять "неужели сами нарисовать не могут ?".
    Я комментировать особо не стал, свёл к дежурному
    "в семье не без урода", но было реально стыдно.

    Словом, как говорится, "O tempora, o mores!"...

    • Откровенно - жалко тех, кто ручками вбивает, им не много светит в интернет-торговле, т.к. с каждым днем все больше конкуренция и меньше маржа и решает автоматизация и уменьшение с ее помощью всевозможных издержек бизнеса.

      Про уникальность контента и др. написано в статье и я не буду просить сделать уникальным характеристику "Мощность" - "500 Вт." - это невозможно, тогда в чем смысл набивать руками? Чтобы потом написать коммент, что все воруют, а я хороший руками набиваю? - если больше нечем заняться - продолжайте, осталось не много и не долго.

      Кроме того, все больше поставщиков дают доступ ко всей информации о товарах по API, в виде файлов csv, xml, xls - это позволяет синхронизировать все, вплоть до заказа товара у поставщика, когда закажут его у Вас. И кто первым этим воспользовался - тот и в лодке. Взгляните например, на поставщиков товаров для взрослых и какие условия и данные они дают партнерам, на электронику посмотрите, детские товары.

      Про англ.яз. рынок - гугл в помощь, Вы будете удивлены.

      Я не собираюсь Вас переубеждать, но советую открыть глаза и посмотреть вокруг. Успехов.

Отправить комментарий

Подпишись и получай новости по RSS