Willkommen |
|
myGully |
|
Links |
|
Forum |
|
|
|
 |
25.05.17, 09:49
|
#1
|
Anfänger
Registriert seit: May 2017
Beiträge: 1
Bedankt: 0
|
Suche Crawler für Amazon / Liste aller Amazonhändler
Hallo,
ich brauche die Mail Adressen aller Amazon Marktplatzhändler. Diese kann man sich beispielsweise einfach per Hand einfach aus den kompletten, öffentlich zugänglichen Listen herauskopieren. Da dies aber aufgrund der unglaublichen Masse sehr umständlich ist, würde ich das ganze gern automatisiert ablaufen lassen.
Meine frage ist ob hier evtl. jemand schonmal einen derartigen Crawler geschrieben hat, oder evtl. auch einfach eine Liste mit den Händlern inkl. Mailadressen besitzt und gegen eine Entlohnung zur Verfügung stellen würde.
Bei Interesse bitte ich um Kontaktaufnahme per eine PN.
LG
|
|
|
30.05.17, 11:08
|
#2
|
Chuck Norris
Registriert seit: Jun 2010
Ort: /users/osiris
Beiträge: 3.682
Bedankt: 4.295
|
Wüsste gerne was du damit vorhast
|
|
|
04.06.17, 14:24
|
#3
|
Anfänger
Registriert seit: Mar 2010
Beiträge: 7
Bedankt: 5
|
Hi,
hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'
qid = nil
100.times do |i|
search_doc = Nokogiri::HTML(open(
"https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
qid = search_doc.css('input[name=qid]').first['value']
search_doc.css('h3 a').
each do |a|
doc = Nokogiri::HTML(open(a['href'] ))
seller_name = doc.css('#sellerName').text
doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
if list.text =~ /Geschäftsadresse/
puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
end
end
end
end
Grüße,
Alex.
|
|
|
Folgendes Mitglied bedankte sich bei Alex12222:
|
|
24.03.25, 22:15
|
#4
|
Anfänger
Registriert seit: Nov 2010
Beiträge: 5
Bedankt: 3
|
Zitat:
Zitat von Alex12222
Hi,
hier mal ein Vorschlag umgesetzt in Ruby:
Code:
require 'open-uri'
require 'nokogiri'
qid = nil
100.times do |i|
search_doc = Nokogiri::HTML(open(
"https://www.startpage.com/do/search?query=host%3Aamazon.de+\"Amazon.de+Verk%C3%A4uferprofil\"&cat=web&startat=#{ i * 10 }&qid=#{ qid }"))
qid = search_doc.css('input[name=qid]').first['value']
search_doc.css('h3 a').
each do |a|
doc = Nokogiri::HTML(open(a['href'] ))
seller_name = doc.css('#sellerName').text
doc.css('ul.a-unordered-list.a-nostyle.a-vertical li').each do |list|
if list.text =~ /Geschäftsadresse/
puts "Name: #{ seller_name }, Adresse: #{ list.css('li').map { |li| li.text }.join(', ') }"
end
end
end
end
Grüße,
Alex.
|
.... wie m?sste das Scipt, denn ausschauen wenn ich diese Daten alle "auslesen" wollen w?rde:
Code:
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ][adults]=2&pax[children]=0&pax[juveniles]=0®ion=&ship=&ta=&to=
PS: Das AMAZON Skript hatte ich versucht mal hier zu starten: ttps://www.jdoodle.com/execute-ruby-online ...
Leider ohne Erfolg .... bin komplett neu in der Materie und w?rde mich da gerne mal rantasten. Danke Dir.
|
|
|
Forumregeln
|
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren
HTML-Code ist Aus.
|
|
|
Alle Zeitangaben in WEZ +1. Es ist jetzt 12:11 Uhr.
().
|