myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Netzwelt & Internet > Filesharing & Datenaustausch
Seite neu laden

JDownloader Captchas

Willkommen

myGully

Links

Forum

 
 
 
Themen-Optionen Ansicht
Prev Vorheriger Beitrag   Nächster Beitrag Next
Ungelesen 07.11.10, 08:54   #2
whirpool
Anfänger
 
Registriert seit: Jun 2010
Beiträge: 27
Bedankt: 15
whirpool ist noch neu hier! | 0 Respekt Punkte
Standard

moinmoin

ist ja eine nette Idee, aber hast du dich mal schlau gemacht was das für captchas sind die du horten möchtest?

das system nennt sich reCAPTCHA.
Zitat:
...Der Informatiker Luis von Ahn hat dazu ein System namens reCAPTCHA programmiert, das bei der Buch-Digitalisierung eingescannte Wörter, die die Texterkennungssoftware nicht erkennt, durch die Eingabe von CAPTCHAs optimiert. Auf jedem CAPTCHA sind zwei Wörter abgebildet: Eines, das dem System bereits bekannt und bestätigt ist, das andere ist ein unerkanntes Wort aus einem Buch....
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]

Da man davon ausgehen kann das;
1. dort nicht nur 1-2 Bücher in der Datenbank schlummern sondern zig tausende
2. die angezeigten Wörter mehrfach, und in verschiedenen Kombinationen, angezeigt werden
Denke ich das man sich ein Projekt auf Basis des sammlens der Bilder getrost schenken kann da der Nachschub quasi unendlich ist ^^

Und fals doch mal die Bücher ausgehen sollten, dann nimmt Google einfach seine Datenbank her und klaut sich dort zufällige Wörter die verfremdet dargestellt werden. (sofern dies bei dem einen, dem System bekannten, Wort nicht schon der Fall ist).

sry wenn ich da einen dämpfer geben muss /
Gruß,
whirpool
whirpool ist offline   Mit Zitat antworten
 


Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 03:40 Uhr.


Sitemap

().