@Alexandra_sa folgen
Twittern

Dienste im Marketing- und Softwarebereich

Kontakt // Impressum
 
Über uns
  • Über uns
  • Digitale Marketing Dienste
    • Digitale Kommunikation
    • Suchmaschinenmarketing
      • Bezahlte Anzeigen (AdWords)
      • SEO
    • Affiliate Marketing
    • Benutzerfreundlichkeit
    • Webentwicklung
  • Softwaredienste
    • Verteilte Systeme
    • Content Management
      • Joomla!
      • MeshCMS
      • TYPO 3
    • IT-Infrastruktur
    • Softwareentwicklung
    • IT-Beratung
    • Onlineshop Entwicklung
  • Produkte
  • Referenzen
  • SEO Tool
  • Blog
Blog
 

Januar 06, 2008

Echtzeitdaten im Suchmaschinenindex durch ereignisorientiertes Crawling

« URL Rewrite API's (3) | Main | Installation phpMyVisites  »
Sind aktuelle Daten in Suchmaschinen heutzutage wirklich möglich? Das grundsätzliche Problem einer Suchmaschine aktuelle Daten im Index zu haben liegt vor allem im aktuellen Crawling-Mechanismus der Suchmaschinen.

Die Suchmaschinen-Crawler stellen nämlich so genannte Poller dar. Das bedeutet, dass die Kommunikation bei der Indizierung nur in eine Richtung geht. Je nach Wichtigkeit der Suchmaschine indiziert die Suchmaschine in kürzeren oder längeren Zeitintervallen. Die Dauer der Abtastintervalle hängt von der Priorität (Pagerank, Sitetype, ...) einer Website ab. Das hat zur Folge, dass Suchmaschinen riesige Computerfarmen unterhalten müssen, welche diese Arbeit automatisiert durchführen und eigentlich nie wirklich zeitnahen Content enthalten können. Denn Sie wissen nie genau wann die Website und welcher Teil verändert wird. Sie können es nur basierend auf bereits durchgeführten Crawlings schätzen.

Folgende Abbildung stellt diesen Mechanismus dar: 

crawler mechanism
 

Wäre es nicht besser wenn der Verantwortliche für eine Webpräsenz direkt oder automatisiert der Suchmaschine mitteilen könnte wann sich der Content der Seite verändert. Letztendlich würde es den Aufwand der Suchmaschine verringern. Diese würden dann nämlich nur Crawlen wenn man sie dazu auffordert und könnten so aktuellste Daten im Index stehen haben. Vor allem interessant wäre dieser Ansatz für Magazine, Blogs, Foren, usw. . Hierzu wäre natürlich eine neue API erfoderlich. Mit der man manuell oder die Webapplikation selbst sogenannte Content Change Events Suchmaschinen mitteilen könnte. 

 

event oriented crawler mechanism

 

Natürlich müsste das Intervall basierte Crawling weiter bestehen bleiben. Denn die Suchmaschinen können nicht davon ausgehen, dass Sie immer über Änderungen informiert wird. Allerdings wäre eine Mischung aus beiden Mechanismen recht interessant und ich denke auch sehr nützlich für die Suchmaschinen wie auch für die Webseitenbetreiber.

Viele Grüße

Alexandra

 

Technorati Tags: searchengine searchengine mechanism

Posted by default at 11:55 AM in Ideen zu klassischen Marketing, Onlinemarketing, Suchmaschinen und Softwarethemen
Responses (4)

 

[Trackback URL for this entry]

Comment: Michael at Sun, 6 Jan 1:33 PM

Diese Events gibt es bereits (vgl. Blog&Ping).

Comment: Alex at Sun, 6 Jan 3:48 PM

Blogs bilden durch Trackbacks und Pingbacks semantische Netzwerke. Und es stimmt es handelt sich hierbei um eine Art von ereignisorientierter Verlinkung von Inhalten.

Mit meinen Artikel möchte ich ausdrücken, dass eine ähnliche Technik z.B. per XML-RPC oder Webservices sich ebenfalls bei Suchmaschinen als nützlich erweisen würde.

Grüße

Alexandra

Comment: Constantin at Sun, 6 Jan 3:57 PM

Im Grunde gibt es soetwas ja schon. RSS-Feeds werden von Google genutzt, um neue Seite zu erkennen und recht zeitnah zu indexieren.

Wird allerdings nur ein Teil der Website verändert, scheitert dies natürlich, es sei denn, man sendet einen neuen Feed.

Feeds lassen sich inzwischen als nicht nur als Kundenbindungsinstrument, sondern auch als Schnittstelle zu den Suchmaschinen benutzen.

Ich befürworte des allerdings nicht. Dadurch werden nämlich wieder Webmaster, die sich mit Suchmaschinenoptimierung & Co beschäftigen bevorzugt und nicht die Inhaltsexperten auf einem Gebiet.

Comment: Herbert at Tue, 8 Jan 4:21 PM

Interessanter Denkansatz; mit der Aussage "die Suchmaschinen können nicht davon ausgehen, dass Sie immer über Änderungen informiert werden" ist aber schon auf den Haken an der ganzen Sache hingewiesen worden.

Die derzeitige maschinelle Google-Lösung, bei der Webseiten mit hoher Postingfequenz (Google Reader ist sogar so nett, bei jedem RSS-Feed dessen Postingintervall anzuzeigen ...) einen beinahe stündlichen Besuch der Crawler erhalten, ist (vorerst) eindeutig sinnvoller.

Kalender
 
« Januar »
MoDiMiDoFrSaSo
 123456
78910111213
14151617181920
21222324252627
28293031   
       

Über die Autoren
 

Alexandra Sobek


Kategorien
 
  • Ideen
  • Onlinemarketing
  • Onlinemarketingmethoden
  • SEO Tool
  • sobek agency
  • Social Media Marketing
  • Suchmaschinenoptimierung
  • Usability
  • Verschiedenes

Abonnieren
 

XML RSS ATOM