@Alexandra_sa folgen
Twittern

Dienste im Marketing- und Softwarebereich

Kontakt // Impressum
 
Über uns
  • Über uns
  • Digitale Marketing Dienste
    • Digitale Kommunikation
    • Suchmaschinenmarketing
      • Bezahlte Anzeigen (AdWords)
      • SEO
    • Affiliate Marketing
    • Benutzerfreundlichkeit
    • Webentwicklung
  • Softwaredienste
    • Verteilte Systeme
    • Content Management
      • Joomla!
      • MeshCMS
      • TYPO 3
    • IT-Infrastruktur
    • Softwareentwicklung
    • IT-Beratung
    • Onlineshop Entwicklung
  • Produkte
  • Referenzen
  • SEO Tool
  • Blog
Blog
 

Januar 06, 2008

Echtzeitdaten im Suchmaschinenindex durch ereignisorientiertes Crawling

Sind aktuelle Daten in Suchmaschinen heutzutage wirklich möglich? Das grundsätzliche Problem einer Suchmaschine aktuelle Daten im Index zu haben liegt vor allem im aktuellen Crawling-Mechanismus der Suchmaschinen.

Die Suchmaschinen-Crawler stellen nämlich so genannte Poller dar. Das bedeutet, dass die Kommunikation bei der Indizierung nur in eine Richtung geht. Je nach Wichtigkeit der Suchmaschine indiziert die Suchmaschine in kürzeren oder längeren Zeitintervallen. Die Dauer der Abtastintervalle hängt von der Priorität (Pagerank, Sitetype, ...) einer Website ab. Das hat zur Folge, dass Suchmaschinen riesige Computerfarmen unterhalten müssen, welche diese Arbeit automatisiert durchführen und eigentlich nie wirklich zeitnahen Content enthalten können. Denn Sie wissen nie genau wann die Website und welcher Teil verändert wird. Sie können es nur basierend auf bereits durchgeführten Crawlings schätzen.

Folgende Abbildung stellt diesen Mechanismus dar: 

crawler mechanism
 

Wäre es nicht besser wenn der Verantwortliche für eine Webpräsenz direkt oder automatisiert der Suchmaschine mitteilen könnte wann sich der Content der Seite verändert. Letztendlich würde es den Aufwand der Suchmaschine verringern. Diese würden dann nämlich nur Crawlen wenn man sie dazu auffordert und könnten so aktuellste Daten im Index stehen haben. Vor allem interessant wäre dieser Ansatz für Magazine, Blogs, Foren, usw. . Hierzu wäre natürlich eine neue API erfoderlich. Mit der man manuell oder die Webapplikation selbst sogenannte Content Change Events Suchmaschinen mitteilen könnte. 

 

event oriented crawler mechanism

 

Natürlich müsste das Intervall basierte Crawling weiter bestehen bleiben. Denn die Suchmaschinen können nicht davon ausgehen, dass Sie immer über Änderungen informiert wird. Allerdings wäre eine Mischung aus beiden Mechanismen recht interessant und ich denke auch sehr nützlich für die Suchmaschinen wie auch für die Webseitenbetreiber.

Viele Grüße

Alexandra

 

Technorati Tags: searchengine searchengine mechanism

Posted by default at 11:55 AM in Ideen zu klassischen Marketing, Onlinemarketing, Suchmaschinen und Softwarethemen
Responses (4)
 
Kalender
 
« Januar »
MoDiMiDoFrSaSo
 123456
78910111213
14151617181920
21222324252627
28293031   
       

Über die Autoren
 

Alexandra Sobek


Kategorien
 
  • Ideen
  • Onlinemarketing
  • Onlinemarketingmethoden
  • SEO Tool
  • sobek agency
  • Social Media Marketing
  • Suchmaschinenoptimierung
  • Usability
  • Verschiedenes

Vor kurzem
 
  • Echtzeitdaten im
    Suchmaschinenindex durch
    ereignisorientiertes Crawling

Abonnieren
 

XML RSS ATOM