5 Internetsuche

Hossa! Diesmal keine Folien, wie geht das zu?^^ Vielleicht weil das Thema der nächsten (und letzten) Veranstaltung eins von diesen Sachen ist, mit denen jeder schonmal in Berührung gekommen ist. Es geht um die Suche von Informationen im Internet. Dazu folgen einige interessante Inhalte zu den Themen
Erschließung des Web

  • Suchmaschinen
  • Webkataloge
  • Metasuchmaschinen
  • Deep Web
  • Beurteilung von Webseiten

Was durchaus vertraut klingt smile Hierzu noch folgende Gretchenfragen:

Nachtrag: Mittlweile stehen 3 PDFs und 3 Videos online, Phänomen^^. Ich war ja ein bisschen irritiert als in Inf_12_1_10347271.wmv Folien aufgetaucht sind, die nicht im zugehörigen PDF waren, aber im Großen und Ganzen haben beide Dateitypen in der Regel denselben Inhalt. Inf_12_1_10347264.pdf erläutert hauptsächlich definitorische Grundlagen von Suchmaschinen und deren Arbeitsweise anhand des Branchenprimus Google als Einführungsbeispiel. Eingegangen wird vor allem auf Basiskenntnisse wie die Manipulation von Suchstrings mittels spezifischer Operatoren wie “OR”, “AND” oder einer Wildcard (“*”) sowie das Nutzen der erweiterten Funktionalitäten, die von Google unter einem gleichnamigen Link neben dem Suchfeld bereitgestellt werden und komplexe Anfragebildung mit Ergebnismengenverknüpfungen u.ä. unterstützen, eine Erklärung zum angesprochenen “Auf gut Glück!” Button blieben die Folien, trotz Erwähnung allerdings schuldig wink btw:

Bild 2

Inf_12_2_10347257.pdf erschließt das reichhaltige Tool Angebot Googles noch weiter und stellt unter anderem Dinge vor wie Google Insight, dass zur statistischen Auswertung von Suchanfragen herangezogen werden kann und für Forschungs- sowie Meinungsbildungszwecke durchaus herangezogen werden kann. Exemplarisch wurde z.B. gezeigt, wie die Anfragen nach Michael Jackson am Tage seines Todes und direkt danach in der Bundesrepublik einen ungewohnten Peak erreichten, was man schon als Vorbote des “Elvis-Effekts” formulieren könnte. Im Bezug auf wissenschaftliche Trends raten die Dozenten allerdings eher zu spezialisierten Diensten wie Science Watch, die auch mit netten Gimmicks wie Zitationsgraphen aufwarten können, welche ein gutes Werkzeug darstellen um das Einsickern bestimmter Beiträge in die Fachwelt zu verfolgen. Bei dieser Folie vermisst habe ich das Thema Google Trends, was sich ähnlich wie Google Insights, was sich wie der Name schon sagt explizit auf qualitative Aussagen zur Quantität von Suchanfragen eingeschossen hat. Evtl. stellt Google Insights auch nur die Weiterentwicklung dar, Trends ist jedoch in der Internet Community durch die interessanten Einblicke die es bietet, sehr beliebt. Siehe hierzu auch: http://www.somethingawful.com/d/comedy-goldmine/interesting-google-trends.php

Auf die Google Statiskfunktionen verlassen sich unter anderem auch Seiten wie http://www.googlefight.com/ in denen man zwei Suchanfragen im Bezug auf ihre Treffermenge in Wettbewerb setzen kann, Zum ausprobieren: Bill Gates – Steve Jobs.

Inf_12_3_10347251.pdf erweitert abschließend den Fokus der Lehreinheit und geht ein auf Spezialfunktionen von Suchmaschinen sowie einige von Googles (mehr oder weniger) bekannten Konkurrenten wie Yahoo, Bing, Exalead u.ä. Sehr interessant hier sind die Abschnitte zum Thema semantische Suchmaschinen (die mir auch sehr nachhängen^^), Metasuchmaschinen (wie Metacrawler und Konsorten die andere Suchmaschinen nach dem gewünschten Begriff durchsuchen…) sowie das Thema Deep Web, das allein durch die Konnotationen des Begriffs faszinierend anmutet. Deep Web, dass ist der von Suchmaschinen unerschlossene Teil des Internets und weckt Assoziationen zur Grenze des bekannten Universums oder den Gebieten der Tiefsee und setzt sich hauptsächlich aus Informationen zusammen, die entweder in Datenbanken liegen, nicht verlinkt wurden, durch Metainformationen, Passwortabfragen oder inkompatible Dateiformate Search-Robots aussperren (wobei die Suchmaschinenhersteller einen gewaltigen Aufwand in die Überwindung dieser Barrieren stecken, so füllt Google z.T. auch selbständig Formulare aus habe ich bemerkt). Auch interessant sind historische Dienste wie Webkataloge, die als Vorläufer von Suchmaschinen zwar bekannt waren, jedoch hab ich nie eine in natura gesehen. Ganz zum Schluss noch ein Ruf zur Vernunft, in dem aufgefordert wird, sich stets Gedanken über die Qualität und Aussagekraft von Webseiten zu machen – Finde ich auch wichtig smile.

a. Beschreiben Sie Ihre Erfahrungen mit Suchen im Web

906b06a170a812768f52ff0482cef72f6289e751_m

yeah, it’s pretty much like that wink. Da Internet-Suchmaschinen aufgrund der riesigen Datenflut meist auf Volltextrecherche ausgelegt sind, bekommt man in der Regel je allgemeiner der Suchbegriff ausfällt mehr, als man eigentlich wissen wollte (inklusive bizarrer Pornographie und Viren). Für die Internetsuche hab ich fast immer schon Google benutzt… in ganz grauer Vorzeit noch Altavista oder sowas. In der Regel findet man eigentlich das, wonach man sucht mit den in der Vorlesungen angesprochenen Methoden zur Eingrenzung oder Erweiterung der Treffermenge bzw. durch eigenes Trial & Error. Google bietet für seine Suche noch einige interessante Zusatzschalter an, die einem das Leben erleichtern. Früher war z.B. zum herausfilten von Dialerwebsiten, die den Google Ranking Algorithmus manipuliert haben, die Option “-com” zum zurückhalten aller .com Domains recht zuverlässig.

b. geben Sie Tipps

In einer Informatikervorlesung isses immer blöd wenn man jemandem was erzählt, was er schon lange weiß wink. Als allgemeinen Tipp würde ich formulieren, dass Google nicht alles findet sowie, dass man sich tatsächlich nicht immer auf die gefundenen Quellen verlassen sollte. Man achte bei der Google Suche “iPhone Tarif Monopol fällt” auf die Formulierung der einzelnen Online Newsportale, die diese Nachricht bringen. Es geht darum, dass der Exklusiv Vertrag zwischen T-Mobile und Apple demnächst dieses Jahr ausläuft und _angeblich_ das Monopol fallen soll, was aber nur ein Gerücht ist und wahrscheinlich so auch nicht stattfinden wird, da Apple kräftig mitverdient an den Exklusivverträge, die meisten Headlines stellen den Sachverhalt aber schon dar, als ob es die unausweichliche Wahrheit wäre.
Des weiteren würde ich den Einsatz von Metacrawlern (Suchmaschinen die andere Suchmaschinen bedienen) befürworten, was ich persönlich ein paar mal gemacht hab aber irgendwann dann die Googlefunktionalitäten wie Bildersuche und Scholar etc. vermisst hab.

c. berichten Sie über neue Entwicklungen oder

Unter Neuentwicklung könnte man vor allem die Semantic Web Suchmaschinen bzw. solche die einen innovativeren Ranking Algorithmus nutzen als die bekannten Branchen Schwergewichte. Zu diesen gehört beispielsweise http://www.cuil.com/ die, anders als Google, ihr Ranking anhand des Page Contexts und Schlüsselwörtern auf der Seite ausrichten. Eine reine Semantic Web Maschine, die auch Anfragen in menschlicher Sprache unterstützt findet sich untern http://swoogle.umbc.edu/. Das Konzept beruht im großen und Ganzen darauf, dem Computer durch das Hinzufügen von Metainformationen zu den eigentlichen Daten, den Zusammenhang zwischen diesen auf einem rudimentären Level aufzuzeigen und so sinnvollere Suchergebnisse liefern zu können. Die TU München hat mit Theseus auf diesem Gebiet außerdem ein recht prestigeträchtiges Projekt am Laufen.

d. über Kurioses aus Ihrer täglichen Suchpraxis

Hier möchte ich “rule 34 of the internet” zitieren

Rule 34
Generally accepted internet rule that states that pornography or sexually related material exists for any conceivable subject.
Additionally it is accepted that the rule itself has limitations and you cannot be too specific on the content of the item in question.
Most commonly used on various message boards for various reasons, from humor to cruelty.

Im Internet liegen Gut und Böse oft nah beinander tongue. Die kuriosesten Suchergebnisse erhält man aber nach wie vor bei der Google Bildsuche wink

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Log Out / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Log Out / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Log Out / Ändern )

Verbinde mit %s


Follow

Get every new post delivered to your Inbox.