Webstatt.org - Community seit 2006 - 2012 (2024?)

Google API mit PHP

Avatar user-124
12.11.2007 16:27

Hallo zusammen,

kann mir jemand mit der Google- API helfen? Ich möchte eigentlich nur mit Hilfe dieser API abfragen, wieviele Treffer es zu einem bestimmten Begriff gibt.

Die im Netz kursierenden Beispiele und nusoap habe ich mir zwar angesehen bzw. umgesetzt, aber irgendwie krankt das Ganze noch ziemlich.

Vll. hat ja jemand einen kleinen Google- Client, den er mir einfach reinstellen kann.

lG

brb

user-152
12.11.2007 17:16

Ein Vorschlag wäre mit Regex die Seite auslesen.
Also was dann bei „Ergebnisse 1 - 20 von ungefähr 2.290.000” angezeigt wird.
Den Link kennst du ja, die Seite dann mit file_get_contents() oder CURL() einlesen, und die gesuchte Stelle rausfiltern.

Avatar user-124
12.11.2007 19:10

danke, diese Methode ist mir bekannt, produziert aber m.E. zuviel Traffic und ist zu fehleranfällig, da sich der Seitenaufbau ja gerne mal verschiebt.
Letztendlich versucht Google auch genau sowas eigentlich zu unterbinden, wer sich beispielsweise die Bildersuche ansieht wird feststellen, dass da alle Bild- URLs durch JS- Maßnahmen unkenntlich gemacht werden (der FF zeigt zwar valide URLs an, das hängt aber damit zusammen, dass der FF dummerweise nicht den Quelltext, wie er auf dem Server liegt anzeigt, sondern so, wie er nach Ausführung von JS etc. aussieht.

whatever

brb

Avatar user-271
12.11.2007 19:55

und was gibt es für probleme mit SOAP? dass ist doch genau auf sowas ausgerichtet und damit sollte das doch gehen?

#!/bin/bash
traurig){ neutral:& };:
user-152
12.11.2007 23:03

@Barabbas

Jo dein Gedanke ist natürlich richtig, wenn du gleich mehrere Anfragen stellst.
Ansonsten kenne ich keine API von Google, die dazu gedacht ist.

Etwas ähnliches hab ich aber schon ne ganze Weile im Einsatz, wo wird es per Cronjob täglich gemacht wird. Aber dabei benutze ich CURL() und sende auch ein User_Agent mit.

Avatar user-124
15.11.2007 12:21

Tatsächlich gibt es eine Google Api, die mittels SOAP (wie user-271 auch erwähnt) mit PHP genutzt werden kann. Allerdings ist das Problem, dass SOAP bei mir zu wirren, ärgerlichen und kaum debugbaren Fehlern führt, mit denen ich mich einfach nicht herumschlagen möchte.

Das Projekt http://xn--ngel-5qa.de/gstat soll halt in entsprechenden Abständen die Anzahl an Treffern zu einem bestimmten Begriff abfragen. Ich habe mich aber jetzt dazu entschieden, diese Abfrage manuell vorzunehmen, da ich ohnehin noch mindestens zwei weitere Maschinen abfragen möchte, für die es ohnehin keine mir bekannte API gibt. So gesehen werde die automatisierte Google- Abfrage auch keine nennenswerte user-174eichterung.

Aber wenn ihr Bock habt, könnt ihr hier oder auf der oben genannten Seite noch ein paar Wortvorschläge einstellen zwinkern

//edit: Habe den Thread mal in den Smalltalk- Bereich verschoben, so können wir ein wenig über gstat plaudern zwinkern

user-152
16.11.2007 17:16

Ist ja interessant, muss ich mir mal angucken ...

EDIT:

Also wenn ich mir diese NuSOAP mal näher anschaue ist es nicht viel anderes als REGEX lächeln Und ob das geschaufel mit dem XML schneller geht, als direkt von der Seite mit Regex zu holen, kann ich gar nicht so recht glauben.

user-303
16.11.2007 18:15

Aber die XML Schnittstelle ist beschrieben und wird aufgrund Kompatiblitäten nicht so einfach verändert. Das HTML der Seite kann ohne "bösen Gedanken" verändert werden und schon greift dein Regex nichtmehr.
Deswegen: Immer lieber beschriebene Schnittstellen verwenden, anstatt wild auf GUI-Ausgaben loszu regexen