zur Startseite
Passwort vergessen?
 

 

Kann man Texte verstehen, ohne sie gelesen zu haben?

Texte verstehen, ohne sie gelesen zu haben - das ist nicht nur der Traum jedes Schülers, Studierenden und überhaupt von Menschen, die von Berufs wegen viel zu lesen haben. Sondern auch der von Felix Göpfert (21), Volker Karle (21) und Thomas Reichenbach (18). Die drei Physikstudierenden der Uni Freiburg haben, um sich diesem Ziel anzunähern, mit Netzwerken gearbeitet.



Zunächst zählten Felix, Volker und Thomas Wörter verschiedener Bücher. Es zeigte sich, dass ein Buch zwar 200 000 Wörtern enthalten kann, sich jedoch innerhalb des Buches so viele Wörter wiederholen, dass es insgesamt aus höchstens 10 000 unterschiedlichen Wörtern besteht. Ein sehr viel dickeres Buch mit 600 000 Wörtern Inhalt enthält dagegen nur doppelt so viele unterschiedliche Wörter. Diese Erkenntnis war erst der Anfang vieler weiterer Untersuchungen.

Felix erklärt das Vorgehen dabei so: "Wir nehmen das Buch als Aneinanderreihung von Wörtern und untersuchen: Welches Wort kommt nach welchem Wort? Dann stellen wir innerhalb dieser langen Reihe von Wörtern Verbindungen her. Man muss sich das vorstellen wie ein Spinnennetz." Alle Wörter, die Nachbarn sind, werden miteinander verbunden, ein solches Netzwerk entsteht.

Netzwerk

Felix und seine Kommilitonen nahmen die Netzwerke genauer unter die Lupe und stellten fest, dass viele Füllwörter und bedeutungslose Wörter wie Artikel sehr häufig vorkommen – aber trotzdem unwichtig sind. "Wir versuchen, ohne die Wörter zu kennen, also ohne zu sagen, diese Wörter sind unwichtig, sondern indem wir einfach dieses Netzwerk analysieren, daraus irgendwas Sinnvolles rauszulesen."

Sinnvoll werden die Ergebnisse ihrer Erfahrung nach, wenn man nach Wortverbindungen von sechs Wörtern hintereinander sucht. In dem Text "The Origin of Species" von Charles Darwin erhält man als häufigste Sechserverbindung beispielsweise "the individuals of the same species". "Das sind schon zentrale Aussagen des Textes oder zumindest etwas, das damit zu tun hat", resümiert Felix.

Als Textgrundlage dienten neben Darwin auch Werke wie Don Quijote, Peter Pan oder Sherlock Holmes. Nicht bei allen Texten brachte das Analyseverfahren gleich gute Ergebnisse. "Das hängt auch vom Schreibstil ab und von der Länge des Textes. Ganz kurze Texte funktionieren nicht gut. Denn wir untersuchen ja die Häufigkeit von Wortverbindungen. Und bis zu einem gewissen Grad sind die zufällig, je nachdem, wie die Wörter hintereinander kommen. Da werden die Werte erst bei längeren Texten relevant."

Vorgegangen sind die drei teilweise nach Methoden der Netzwerktheorie, teils nach eigenen Überlegungen. Der Computer kam dabei nur zur Arbeitserleichterung zum Einsatz. Ein Untersuchungsparameter war die Wartezeit: Nach wie vielen Wörtern taucht dasselbe Wort wieder auf?

Wartezeit bei

Wartezeit bei

Die Grafik zeigt einen deutlichen Unterschied zwischen dem für das Textverständnis wichtigen Wort "species" (obere Grafik) und dem unwichtigen Wort "and" (untere Grafik): Während "species" auch bei Wartezeiten von über 300 Wörtern noch zu finden ist, herrscht bei der "and"-Grafik nach einem Wert von 250 auf der y-Achse gähnende Leere.

Was sagen diese unterschiedlichen Werte nun aus? "Allein noch nicht viel, das war auch unser Problem. Wir haben ganz viele Unterschiede zwischen wichtigen und unwichtigen Wörtern gefunden, aber wir wissen noch nicht genau warum, und wie wir aus dem Unterschied ein wichtiges Wort rauslesen können", erklärt Felix. Die Auswertung der Daten nennt er entsprechend "unser Hauptproblem".

Trotzdem hat er schon Zukunftsvisionen für das Projekt: "Das Tolle ist, das könnte man wie eine Suchmaschine verwenden. Wir könnten theoretisch irgendwas durchsuchen und dann sagen: Das sind die wichtigen Wörter im Text, ohne den Text zu kennen. Das könnte man natürlich super für Recherche verwenden." In jedweder Sprache, versteht sich. Auf die Maschine, die statt unsereinem unsere Texte liest, müssen wir indes wohl noch eine Weile warten.


Disclosure

fudder ist Medienpartner des Regionalwettbewerbs Jugend forscht. Dieser wird in Südbaden zum elften Mal in Folge vom Waldkircher Unternehmen Sick AG durchgeführt. Im Rahmen dieser Kooperation gibt es wieder unser Forscher-Blog mit freundlicher Unterstützung der Sick AG, in dem wir euch mit den interessantesten Themen rund um das Thema Jugend forscht versorgen.




Artikel als E-Mail verschicken Artikel auf Facebook weiterempfehlen Artikel twittern Diese Seite zu Mister Wong hinzufügen Diesen Artikel bei del.icio.us bookmarken
 



Kommentare
Anzahl der Kommentare: 20
Dienstag, 14.02.12 19:33
 

Die Antwort lautet offenbar "nein". Womit m.M.n. auch zu rechnen war.

Dienstag, 14.02.12 23:27
 

Ich denke man kann mit der Methode schon was heraus holen. Kimmt azf die Fragestellung an.
Umgekehrt ist die Antwort klarer. Es ist möglich Texte zu lesen ohne sie zu verstehen.

Mittwoch, 15.02.12 00:04
 

An die Person, die diesen Artikel verfasst hat:

Warum ist es in diesem Fall nötig, "Physikstudierende" zu schreiben? Ich finde eine solche Verunstaltung der deutschen Sprache grundsätzlich grauenhaft - fast auf einer Stufe mit dem Binnen-I oder der gender gap - da ohne Not auch "Studentinnen und Studenten" gesagt werden könnte. Aber in einem Fall diese unsägliche Substantivierung zu verwenden, in dem sowieso nur von Männern die Rede ist, ist vollkommen unnütz.

... zumal inkonsequenterweise auch von "Schülern" die Rede ist und nicht von "die Schule Besuchenden" oder "Beschulten".

Das ist für mich wieder ein Beispiel der Indoktrinierung durch feministische Linguistik bzw. gender mainstreaming. Es wird einfach mal substantiviert/gegendert, ohne zu beachten, dass "Studenten" in diesem Fall kein generisches Maskulinum wäre, sondern tatsächlich der maskuline Plural!


menti hat den Kommentar am 15.02.2012 um 00:05 bearbeitet
Mittwoch, 15.02.12 00:15
 

@menti:

"studierende" ist vollkommen usus.

http://www.duden.de/rechtschreibung/Studierender

Mittwoch, 15.02.12 00:32
 

Danke, aber das weiss ich auch. Es ist meine persönliche Meinung zum gender mainstreaming im sprachlichen Bereich. Ich habe nicht behauptet, dass diese Substantivierung nicht erlaubt sei, sondern geschrieben, dass ich sie für eine Verunstaltung der deutschen Sprache und damit für grauenhaft halte.

Ich kann den Wunsch nach einer geschlechtsneutralen Version eines solchen Wortes verstehen und auch deren Anwendung, wenn es sich tatäschlich um männliche und weibliche Studenten handelt. Substantivierungen sehe ich aber, wenn überhaupt, nur in einem solchen Fall als legitimiert an. Außerdem habe ich, wenn in einem Artikel solche Substantivierungen unbedingt verwendet werden müssen, eine konsequente Umsetzung gefordert.

Ich führe auch seit Jahren meinen persönlichen Kampf gegen die Verwendung von Binnen-I und gender gap - die übrigens vom Duden nicht erlaubt werden (vgl. http://www.duden.de/newsletter/duden-newsletter-vom-07-01-11 ) und trotzdem, vor allem im studentischen Bereich und in der Universitätsverwaltung, immer häufiger verwendet werden ;).


menti hat den Kommentar am 15.02.2012 um 00:34 bearbeitet
Mittwoch, 15.02.12 10:36
 

@menti:

ich persönlich finde es auch nicht so schön, finde aber gleichzeitig, dass man, was sprache angeht, tolerant sein sollte. sprache ist nicht festgeschrieben, sondern verändert sich ständig - das gilt v.a. auch für die deutsche sprache.

wahrscheinlich haben sich sintemal genausoviele leute über das wort studenten aufgeregt wie heute über das wort studierende.

die welt ändert sich ständig. und wir können uns entweder dafür entscheiden, uns mit ihr zu ändern, oder dafür, stehen zu bleiben.

PS: was "sinnvoll" und was "unsinnig" ist - das ist eine ganz andere diskussion. aber was ist in der deutschen sprache schon "sinnvoll". zitat einer italienischen freundin von mir: life is too short to learn german.

Mittwoch, 15.02.12 11:19
 

@manuel:

"die welt ändert sich ständig. und wir können uns entweder dafür entscheiden, uns mit ihr zu ändern, oder dafür, stehen zu bleiben. "

und genau das sehe ich anders. ich oute mich hiermit als konservativ. ich finde nicht, dass man änderungen einfach mitmachen sollte, wenn man diese nicht für richtig hält, sondern dagegen ankämpfen. ich bin der meinung, dass man sich in diese gesellschaftlichen prozesse einbringen sollte und versuchen sollte, sie nach den eigenen vorstellungen und ideen mitzugestalten. das als "stillstand" zu bezeichnen, finde ich vermessen. hierzu passt für mich der bekannte ausspruch mehrerer historischer persönlichkeiten (morus, franklin, jaurés etc.) mit der asche und dem feuer, der hinnlänglich bekannt sein sollte.

... und zum thema toleranz: die sollte immer auf gegenseitigeit beruhen. die von mir kritisierte, unreflektierte genderung wird häufig (aber natürlich nicht immer) mit ideologischen argumenten von leuten, die nicht auf einen sachlichen diskurs aus sind, verteidigt. diese argumentationsweise stellt sich häufig als moralisch überlegen gegenüber der von anderen diskussionsteilnehmern da und wertet deren standpunkt damit auf eine unsachliche weise ab. deshalb stellt sich mir hier immer die frage nach der "toleranz für die intoleranz".


menti hat den Kommentar am 15.02.2012 um 11:20 bearbeitet
Mittwoch, 15.02.12 11:38
 

@menti:

"bewegung/veränderung" und "stillstand" sind ja nur zwei extreme, zwischen denen es viele abstufungen gibt.

ich persönlich bin froh, dass sich die welt ständig, teilweise erdrutschartig, verändert.

Mittwoch, 15.02.12 11:58
 

JEDENFALLS HABT IHR EUCH JA BEIDE AUF DIE KONSEQUENTE KLEINSCHREIBUNG GEEININGT ;-)

Mittwoch, 15.02.12 12:17
 

Der Niedergang der ach-so-schönen Groß-Kleinschreibung innerhalb der deutschen (Recht-)Schreibung? Oder der Anfang von etwas ganz (schön-)en Neuem?


supermanuel hat den Kommentar am 15.02.2012 um 12:19 bearbeitet
Mittwoch, 15.02.12 12:19
 

@Christian:

Touché, das nehme ich auf und schreibe nun konsequenterweise richtig ;).

@Manuel:

Ich finde einen kompletten Stillstand auch nicht richtig, aber Du hast beide Extreme ins Feld geführt, nämlich "uns mit ihr zu ändern", also Veränderung/Bewegung und "stehen zu bleiben", also Stillstand - und das genau war ja auch meine Kritik. Ich sehe heute zu oft Veränderung, aber nicht auf sachlichen Gründen basierend. Deswegen sage ich: Veränderung ist gut, aber nicht um ihrer selbst willen, sondern um tatsächliche Verbesserungen zu erreichen. Was jeder Mensch für sich als Verbesserung empfindet, sei ihm überlassen (Toleranz!). Er kann seine Meinung aber nur als Teil der Gesellschaft einbringen, wenn er sich einmischt. Genau das habe ich mit meinem ersten Post getan und mich für die Erhaltung des generischen Maskulinums oder der Doppelnennungen eingesetzt - wider der in meinen Augen hässlichen Substantivierungen und ideologisch verklärter Formen, wie Binnen-I und gender gap.


menti hat den Kommentar am 15.02.2012 um 12:21 bearbeitet
Mittwoch, 15.02.12 12:21
 

Buchempfehlung für zwischendurch:

Gerhard Hensche: "Menetekel - 3000 Jahre Untergang des Abendlandes"

tinyurl.com/82kedq9

Mittwoch, 15.02.12 12:23
 

@menti: Okay :)

Ernstgemeintes PS: Wie bewertest du den inflationären Gebrauch von Emoticons bzw. Smileys u.ä.?


supermanuel hat den Kommentar am 15.02.2012 um 12:24 bearbeitet
Mittwoch, 15.02.12 12:38
 

@Manuel:

Ist er inflationär, also z.B. so (anhand eines fiktiven SMS-Dialos):

Er: "Hey, Süsse


EDIT: Wieso fehlen 7/8 meines Posts? Ich antworte gleich nochmal.


menti hat den Kommentar am 15.02.2012 um 12:39 bearbeitet
Mittwoch, 15.02.12 12:53
 

Okay fudder, hier liegt wohl ein technisches Problem vor. Wenn ich das Zeichen des Pfeils nach links (rechts neben linker Shift-Taste) verwende, bricht mein Post ab dort ab.

@Manuel:

Ist er inflationär, also z.B. so (anhand eines fiktiven SMS-Dialogs):

Er: "Hey, Süsse [hier sollte ein Herzchensymbol aus dem o.g. Pfeil nach links und einer 3 stehen], wie alles Liebe zum Valentinstag *hug* :) ILD"

Sie: "Ey, Schatz, der Valentinstag war gestern :(! Warum hast Du Dich nicht gemeldet !!!!!!!!!!!! :*("

Er: "Mach nicht son Fass auf :P. Ich musste gestern bis spät abends arbeiten *gähn* -_- "

Von sowas halte ich gar nichts. Viele Menschen haben schlichtweg verlernt, ihre Emotionen mit sprachlichen Mitteln auszudrücken. Dabei ist mir natürlich klar, dass die elektronisch-schriftlichen Kommunikationswege von heute oft eine möglichst schnelle Antwort erfordern, um den Fluss des Gesprächs/der Diskussion nicht zu stören. Wenn ich beim Chatten erst einmal zwei Minuten brauche, um zu antworten, stört das diese Art von Kommunikation natürlich erheblich. Wenn man sich vor Jahrzehnten einen Brief schrieb, war es egal, ob der einen Tag früher oder später ankam.

Gleichzeitig geht sowas, wie oben gesehen, natürlich auch nicht spurlos an mir vorrüber. Mein ";)" oben sollte tatsächlich meine Antwort beschleunigen. Eigentlich wollte ich sagen:

"Touché, das nehme ich auf und schreibe nun konsequenterweise richtig. Ich bin dazu in der Lage, konstruktive Kritik am eigenen inkonsequenten Handeln aufzunehmen und mich entsprechend meiner eigenen Forderungen zu verbessern. Danke für den guten Kommentar, Du hast den Punkt genau getroffen".

Kurzum: Eine Verwendung von Smileys mit dem passenden Augenmaß halte ich für unproblematisch. Sind Leute allerdings nicht mehr dazu in der Lage, ihre Gefühle mit sprachlichen Mitteln auszudrücken, dann halte ich das persönlich für sehr schade und möchte dafür werben, auf eine inflationäre Verwendung von Smileys zu verzichten. Ich will jedoch keinem Menschen mit ordnungspolitischen Maßnahmen dazu zwingen, sondern argumentativ dafür werben.

P.S.: Ja, ich weiss. Vielleicht sollte ich meinen Nickname in "Don Quijote" verändern und das o.g. Problem als "Windmühlen" bezeichnen!


menti hat den Kommentar am 15.02.2012 um 12:57 bearbeitet
Mittwoch, 15.02.12 13:04
 

@menti: Danke für deine Ausführung! Finde es gut, wenn jemand sich über Sprache Gedanken macht.

Mittwoch, 15.02.12 21:44
 

@menti: ich nehme an, Du bist ein Mann. Eventuell könnten Frauen das anders sehen? (Wobei Du im obigen Fall Recht hast: da es sich hier ausschließlich um Männer handelt, hätte man ruhig auch "Studenten" schreiben können.)

Mittwoch, 15.02.12 21:47
 

Diese Bildüberschrift ist unsinnig aber den wenigsten fällt das überhaupt auf:
http://www.badische-zeitung.de/elzach/vielleicht-studiere-ich-nun-medizin--33924072.html

Donnerstag, 16.02.12 08:16
 

Ganz neu ist die Idee nicht. Vor ca. 15 Jahren gab es bereits eine Software erstanden, die das im Artikel nur Angedachte bereits leistet (für russische und englische Texte).

Donnerstag, 16.02.12 10:00
 

@Jimbo - die behandeln die Worte doch gar nicht semantisch sondern nur als textstrings? Wieso ist die Software die Du erwähnst (welche?) dann abhaengig von der Sprache?

Um einen Kommentar zu verfassen, benötigst du ein fudder-Profil. Registriere dich kostenlos oben rechts auf fudder.






Diese Funktion steht nur für eingeloggte fudder-User zur Verfügung.

» fudder-Netiquette





» Nougat

Biete WG WIEHRE 260 € warm
Zum 13. August wird mein ...

» Fllx

re: Soda Stream Zylinder
hi nana, sabbelbiene i...

» nana7

re: re: Soda Stream Zylinder
Hallo sabbelbiene - das k...

» dirk volker

re: re: Welche Bars/Kneipen vermisst ihr?
bin ein republikaner ...

» hendrik

IKEA "Klippan" Couch zu verkaufen
IKEA KLIPPAN - 2er-Sofa, ...

» UffmLand

re: Soda Stream Zylinder
Auf der Soda Stream Inter...

» Biber

re: Soda Stream Zylinder
Es ist ohnehin ärgerlich ...

» retikulum

re: Soda Stream Zylinder
Auch in der Stadt... Kauf...

» sabbelbiene

re: Soda Stream Zylinder
Wir nutzen jetzt einige Z...