Aufgrund aktueller Medienberichte zum Thema Daten-Crawling möchten auch wir über diese Materie informieren und auf wesentliche Fragen eingehen.
Crawling – automatisiertes Durchforsten und Auslesen
Den bekanntesten Crawler haben Sie selbst heute wahrscheinlich schon ein paar Mal benutzt – Google, Bing oder eine andere Suchmaschine. Diese schicken tagtäglich ihre Server um die Welt, um Webseiten zu inspizieren und auffindbar zu machen.
Grundsätzlich können die Crawler, wie die Online-Spürhünde heißen, nur solche Informationen einsehen, die ohnehin öffentlich sichtbar ist. Mit einer einfachen Textdatei kann man die eigene Homepage auch gänzlich zum Sperrgebiet erklären – aber oft wollen Personen oder Unternehmen ja gefunden werden.
Was kann ich bei XING tun?
Auf XING können Sie selbst Ihre Sichtbarkeit und damit die „Crawlbarkeit“ Ihrer Daten einstellen – wollen Sie auch von Google & Co. gefunden werden und somit Ihre Sichtbarkeit verbessern, aktivieren Sie das entsprechend in Ihren Privatsphäre-Einstellungen, anderenfalls entfernen Sie das Häkchen. Ein Crawler erkennt in diesem Fall nur die auch außerhalb des Netzwerks sichtbaren Daten, also nicht einmal Ihre Firmenzugehörigkeit, geschweige denn Ihre Kontaktdaten. Sie können das auch selber überprüfen, indem Sie sich kurz ausloggen und dann Ihr Profil aufrufen.
Eine zweite Möglichkeit – die auch Gegenstand der aktuellen Diskussion ist – wäre das automatische Auslesen von Mitgliederdaten durch ein eingeloggtes Mitglied. XING trifft natürlich Maßnahmen, um das zu verhindern.
In jedem Fall können Nicht-Kontakte grundsätzlich Ihre Kontaktdaten nicht einsehen – das geht nur individuell mit einer Datenfreigabe, nicht pauschal für alle Nicht-Kontakte. Dementsprechend können Ihre bei XING angegebene E-Mail-Adresse und Telefonnummer nicht automisch ausles- und kopierbar sein. In den Privatsphäre-Einstellungen können Sie außerdem noch die Sichtbarkeit Ihrer Kontaktliste individuell einstellen.
Bei XING haben Sie Ihre Datensicherheit selbst unter Kontrolle – und wir werden weiterhin alles dafür tun, unsere Sicherheitsmechanismen auf dem höchstmöglichen Stand zu halten. Bei weiteren Fragen können Sie gerne einen Kommentar hinterlassen oder in der XING-Gruppe schreiben.
Sie können diesen Artikel verlinken:
http://blog.xing.com/2009/10/informationen-zu-crawlern-und-datensicherheit/trackback/



Der offizielle XING Twitter-Account
kommentieren
Das bei den *VZ zu beobachtende Procedere ist bei xing nicht in diesem Umfang möglich, dennoch verstehe ich nicht, dass xing letzte Woche einen crawl-Magneten gestartet hat: das Personenverzeichnis auf der Startseite.
War es bisher nicht möglich ein vollumfassendes Abbild der xing-Mitgliederliste (wohlgemerkt: nur Name, Firma, Funktion, PLZ, Ort, Land und ggf. Profilbild sowie weiteren freigegebenen Daten – sofern der Datensatz in Suchmaschinen und unangemeldet sichtbar ist), so erhält man diese Daten mit den oben erwähnten Crawler nun auf einem Tablett.
Dabei tritt eine Besonderheit auf: im öffentlichen Profil wird die Firma nicht genannt – im Personenverzeichnis schon. Gewollt?
Zusätzlich kann der Crawler dann gleich zeitnah die genau Mitgliederanzahl bei xing berechnen und die geographische Verteilung aus den freigegebenen Daten ermitteln.
Auch werden sich jetzt 123people und yasni freuen, da sie mit einfacheren Algorithmen auf den xing-Datenbestand losgehen können.
nochmal wiederholt, es ist nicht vergleichbar mit *VZ, aber es werden mehr Daten als zuvor und diese einfacher abgreifbar im Netz präsentiert.
Na ja, ich bin da etwas kritischer, und habe mal was geschrieben zum Thema Daten und Xing. Der letzte Absatz ist ein kleiner Appell zur Sachlage bei Euch. Nix für ungut: http://www.blogh.de/934/datenklau-so-geht-es-bei-xing.html
Hallo Herr Schink, hallo Herr Delzepich,
vielen Dank für Ihr Feedback, auf das ich im Folgenden gerne eingehen möchte. Grundsätzlich gilt dabei: Menschen, die ihr Profil “öffentlich” sichtbar gemacht haben wie in meinem Beitrag geschrieben, wollen auch gefunden werden, eben um sich als Dienstleister, Freiberufler oder potenzieller Mitarbeiter zu positionieren. Wir informieren unsere Mitglieder regelmäßig – hier im Blog, aber auch in unserem wöchentlichen Newsletter oder in den auf der Login-Startseite eingeblendeten News. Zudem sind bei allen Profileinstellungen, die Privatsphäre betreffen, erklärende Hilfetexte.
Gerade die von Ihnen genannten Beispiele, Herr Schink, sind eher Beispiel für Mitglieder, die sehr bewusst auf sich aufmerksam machen möchten (und sogar auf Ihre Telefonnummern). Wenn jemand in seinem/ihrem Titel bei XING (also einem klar nicht dafür vorgesehenen Feld, das besonders prominent in plattforminternen wie -externen Suchen auftaucht) bereits seine/ihre Telefonnummer angegeben hat, will er/sie auch entsprechend gefunden werden. Das ist eine völlig bewusste Entscheidung und aus unserer Sicht kein Beispiel für Datenklau.
Jedes Mitglied hat außerdem die Gelegenheit, sich das eigene Profil sowohl in einer Vorschau-Ansicht als auch in ausgeloggtem Zustand anzusehen, eben um zu erkennen, was er/sie von sich preisgibt. Wir bieten ein Tool, das Geschäftsleuten und Berufstätigen die Möglichkeiten gibt, ihr eigenes Personal Branding zu kontrollieren, und geben dementsprechend die Option, selbst darüber zu entscheiden.
Herr Delzepich, danke noch einmal für Ihr Feedback. Auch im öffentlichen Profil war bisher schon die Postleitzahl, der Ort und das Land sichtbar, das Verzeichnis fügt dem lediglich die gegenwärtige Firma hinzu. Aber, auch hier sind wieder nur die Profile “crawlbar”, bei denen Mitglieder dies offensichtlich auch wünschen.
Beste Grüße
Christian Burtchen.
Hallo Herr Burtchen,
natürlich geht das nur mit den freigegebenen Daten – wobei das Hinzufügen der Firma so ganz ohne Information zu den öffentlichen Daten vielleicht einer Nachricht bedarf. Einige wollen dies sogar, andere gehen vom status quo aus: sie sind öffentlich nicht zu sehen.
> site:xing.com/profile ‘Familienstand: ledig’
liefert 802 Mitglieder, die vieles freigeben. freiwillig. zum jetzigen Zeitpunkt gewollt.
Ändern diese Personen irgendwann ihre Sichtbarkeit oder reduzieren die Angaben, bleiben diese Daten bei Google. Auch das ist jedem der Personen (hoffentlich) bewußt.
Da Dritte jetzt mit crawlern das Personenverzeichnis von xing _gezielt_ abarbeiten können (die eindeutige Personen-Id gehört bei allen mit hochgeladenem Bild zum crawlbaren Datensatz dazu) ermöglicht es diesen, von den öffentlichen xing-Profilen eine Datenbank anzulegen – bei den 802 durchaus mit vielen Details, die sie aus den Datenbeständen nie wieder entfernen können.
Natürlich ist das alles freiwillig – selbst schuld werden jetzt einige sagen/schreiben. Aber xing hat durch die Einführung des Verzeichnisses (was nirgendwo bekanntgegeben wurde) ein wenig die Spielegeln verändert. Vielleicht weisen Sie daher auf das Personenverzeichnis für alle Mitglieder sichtbar nochmal hin.
Viele Grüße,
Ralph Delzepich
Ich persönlich habe nichts gegen die Möglichkeit, dass Suchmaschinen-Crawler mein XING-Profil scannen. Meine Kontaktdaten habe ich ganz bewusst auch auf der Über-mich-Seite angegeben – schließlich möchte ich gefunden werden und es so potenziellen Neukunden leicht machen, Kontakt mit mir aufzunehmen.
Was mich jedoch irritiert ist, dass die für Suchmaschinen freigegebenen Profile auch im Google-Cache landen. Das war m.E. nicht immer so. Und das ist in der Tat bedenklich, denn wenn man sein Profil aus welchen Gründen auch immer ändert oder aktualisiert, dann verbleibt der alte Status für unbestimmte Zeit im Cache. Das kann fatale Folgen haben…
Meine Bitte an XING: ‘noarchive’ hier hinzufügen:
>meta name=”robots” content=”index,follow” /<
(Irgendwie seltsam: wenn ich bei XING eingeloggt bin, dann sieht die ROBOTS-Anweisung so aus:
>meta name=”robots” content=”noindex,noarchive,follow” /<
Wenn ich ausgeloggt bin, dann so:
>meta name=”robots” content=”index,follow” /<
Ein Bug?)
Oha, da habe ich die eckigen Klammern < und > vertauscht…
Herr Herr Delzepich,
vielen Dank noch einmal für Ihre guten Hinweise. Ich habe Ihr Feedback an unser Produkt- und Entwicklungsteam weitergeleitet, wir werden uns umgehend damit befassen und halten Sie selbstverständlich auf dem Laufenden.
Beste Grüße
Christian Burtchen.
Lieber Herr Delzepich,
ihre Annahme, geänderte Xing-Profile würden bei Google unbeachtet bleiben, ist nicht ganz korrekt. Google scannt auch den aktuellen Index nach Veränderungen, wie sonst sollten Startseiten von Blogs aktuell indexiert sein? Wenn Sie morgen ein neues Profilbild hinzufügen, ist dieses irgendwann auch bei Google zu finden, das alte nicht mehr. Mit dem “Über mich”-Feld und etwaigen Änderungen in diesem verhält es sich genauso.
Lieber Herr Weißenfels,
google macht das, da haben Sie selbstverständlich Recht. Die wayback machine z. B. aber nicht. Und ich denke auch yasni und 123people nicht. Sowie jeder, der einen crawler einsetzt.
beste Grüße,
Ralph Delzepich
Hallo Herr Delzepich,
wir haben, wie angekündigt, Ihren Vorschlag diskutiert, angenommen – und umgesetzt. Das Personenverzeichnis listet ab sofort keine Firmen mehr auf.
Beste Grüße
Christian Burtchen.