myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Computer & Technik > Programmierung
Seite neu laden

Suche Crawler für Amazon / Liste aller Amazonhändler

Willkommen

myGully

Links

Forum

 
Antwort
Themen-Optionen Ansicht
Ungelesen 25.05.17, 09:49   #1
jamalschauen
Anfänger
 
Registriert seit: May 2017
Beiträge: 1
Bedankt: 0
jamalschauen ist noch neu hier! | 3 Respekt Punkte
Standard Suche Crawler für Amazon / Liste aller Amazonhändler

Hallo,

ich brauche die Mail Adressen aller Amazon Marktplatzhändler. Diese kann man sich beispielsweise einfach per Hand einfach aus den kompletten, öffentlich zugänglichen Listen herauskopieren. Da dies aber aufgrund der unglaublichen Masse sehr umständlich ist, würde ich das ganze gern automatisiert ablaufen lassen.

Meine frage ist ob hier evtl. jemand schonmal einen derartigen Crawler geschrieben hat, oder evtl. auch einfach eine Liste mit den Händlern inkl. Mailadressen besitzt und gegen eine Entlohnung zur Verfügung stellen würde.

Bei Interesse bitte ich um Kontaktaufnahme per eine PN.

LG
jamalschauen ist offline   Mit Zitat antworten
Ungelesen 30.05.17, 11:08   #2
Osiris1983
Chuck Norris
 
Benutzerbild von Osiris1983
 
Registriert seit: Jun 2010
Ort: /users/osiris
Beiträge: 3.682
Bedankt: 4.295
Osiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt PunkteOsiris1983 leckt gerne myGully Deckel in der Kanalisation! | 1140215 Respekt Punkte
Standard

Wüsste gerne was du damit vorhast
__________________


Bitte keine Supportanfragen per PN! Dafür ist das Forum doch da.

[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]|[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]|[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ][ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]

Osiris1983 ist offline   Mit Zitat antworten
Ungelesen 04.06.17, 14:24   #3
Alex12222
Anfänger
 
Registriert seit: Mar 2010
Beiträge: 7
Bedankt: 5
Alex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt PunkteAlex12222 leckt gerne myGully Deckel in der Kanalisation! | 28633460 Respekt Punkte
Standard

Hi,

hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'

qid = nil
100.times do |i|
  search_doc = Nokogiri::HTML(open(
    "https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
  qid = search_doc.css('input[name=qid]').first['value']
  search_doc.css('h3 a').
    each do |a|
      doc = Nokogiri::HTML(open(a['href'] ))
      seller_name = doc.css('#sellerName').text
      doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
        if list.text =~ /Geschäftsadresse/
          puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
        end
      end 
    end
end
Grüße,
Alex.
Alex12222 ist offline   Mit Zitat antworten
Folgendes Mitglied bedankte sich bei Alex12222:
ducki70 (24.03.25)
Ungelesen 24.03.25, 22:15   #4
ducki70
Anfänger
 
Benutzerbild von ducki70
 
Registriert seit: Nov 2010
Beiträge: 5
Bedankt: 3
ducki70 ist noch neu hier! | 0 Respekt Punkte
Standard

Zitat:
Zitat von Alex12222 Beitrag anzeigen
Hi,

hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'

qid = nil
100.times do |i|
  search_doc = Nokogiri::HTML(open(
    "https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
  qid = search_doc.css('input[name=qid]').first['value']
  search_doc.css('h3 a').
    each do |a|
      doc = Nokogiri::HTML(open(a['href'] ))
      seller_name = doc.css('#sellerName').text
      doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
        if list.text =~ /Geschäftsadresse/
          puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
        end
      end 
    end
end
Grüße,
Alex.
.... wie m?sste das Scipt, denn ausschauen wenn ich diese Daten alle "auslesen" wollen w?rde:

Code:
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ][adults]=2&pax[children]=0&pax[juveniles]=0&region=&ship=&ta=&to=
PS: Das AMAZON Skript hatte ich versucht mal hier zu starten: ttps://www.jdoodle.com/execute-ruby-online ...

Leider ohne Erfolg .... bin komplett neu in der Materie und w?rde mich da gerne mal rantasten. Danke Dir.
ducki70 ist offline   Mit Zitat antworten
Antwort


Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 05:23 Uhr.


Sitemap

().